GLM-5V-Turbo: ИИ, превращающий макеты в код
GLM-5V-Turbo — это первая модель компании, заточенная именно под визуальное кодирование.
Она нативно обрабатывает изображения, видео и текст, понимает структуру макета, цветовую палитру, иерархию компонентов и логику взаимодействий — и на выходе выдаёт готовый к запуску проект.
В основе модели лежит новый визуальный энкодер CogViT и архитектура Multi-Token Prediction, которые позволяют ей работать с контекстным окном в 200K токенов и генерировать до 128K токенов за один ответ. 🤖
Для ускорения инференса используется INT8-квантизация.
На бенчмарке Design2Code, где модели воспроизводят UI-макеты в коде, GLM-5V-Turbo набрала 94.8 балла против 77.3 у Claude Opus 4.6.
Она также лидирует в GUI-агентных тестах AndroidWorld и WebVoyager.📊
Правда, в чисто текстовом кодировании — бэкенд, работа с репозиториями — Claude по-прежнему впереди по всем категориям.
☝🏻☝🏻☝🏻То есть GLM-5V-Turbo — это узкоспециализированный инструмент: идеален, когда нужно посмотреть на картинку и воспроизвести её в HTML/CSS.
Модель доступна через API по цене $1.2 за миллион входных и $4 за миллион выходных токенов, а бесплатно потестировать можно на chat.z.ai.
Вместе с моделью вышли 10 встроенных скиллов — от генерации описаний изображений до анализа акций.
ИИ полностью обучена на китайских чипах Huawei Ascend — без единого GPU от NVIDIA.🇨🇳