Пост канала «Чёрный Треугольник» от 24.05.2026
LongCat-Video-Avatar 1.5 — модель генерации «говорящих аватаров» на 13,6 миллиарда параметров, которая по качеству обходит многие коммерческие решения.
Лицензия — MIT, код и веса полностью открыты. 🔥
Модель принимает на вход аудио и фотографию (или текстовое описание) и генерирует реалистичное видео говорящего человека с точной синхронизацией губ, естественной мимикой и стабильной идентичностью персонажа даже на длинных роликах.
Поддерживает 99 языков и обеспечивает точную артикуляцию.
☝🏻☝🏻Модель работает не только с реальными лицами — она поддерживает аниме-персонажей, животных и стилизованные изображения, а также умеет обрабатывать сразу несколько аудиопотоков для сцен с диалогами нескольких персонажей.
Протестировать можно тут.