ИИ-модель Яндекса решила проблему генерации изображений с русским текстом

Яндекс выкатил обновление своей генеративной модели Alice AI ART, в котором главным фокусом стала работа с кириллицей — для нейросетей это исторически сложная задача, поскольку буквы для них не отдельные символы, а часть пиксельного полотна. В открытых данных кириллица представлена крайне слабо, а изображения с русским текстом в большинстве своём низкого качества — добавишь их в обучение «как есть», и просядет общее визуальное качество генерации.

Что сделали в Яндексе:

🔹 Собрали собственный набор данных «изображение — кириллический текст» с разметкой букв и символов: 30 млн примеров для обучения и ещё ~100 тыс. отобранных картинок для настройки. Данные подбирали так, чтобы модель видела больше разных букв, слов и сочетаний — это помогает ей точнее писать на кириллице.

🔹 Обновили архитектуру модели, чтобы лучше ловить пространственные связи между разными частями изображения, что критично для длинных надписей.

🔹 Заменили модуль, с которым модель точнее считывает смысл фраз и лучше работает с русским языком: раньше запрос фактически проходил через перевод с английского, а теперь модель понимает его напрямую.

🔹 Внедрили модуль, который уточняет слишком общие запросы. Например, «наша столица» автоматически превращается в «Москва, Кремль, Красная площадь».

По результатам внутренних замеров точность генерации текста на русском выросла в 3 раза, общее качество картинок (доля без визуальных искажений) — на треть, понимание культурного кода — до 85% (на уровне топовых индустриальных решений). По доле успешных генераций кириллического текста Alice AI ART показывает лучшие результаты среди российских моделей, а фразы из 7–9 слов теперь генерируются корректно в большинстве случаев — там, где некоторые конкуренты продолжают спотыкаться

Подписывайтесь на СофтТех

19.05.2026 18:56

МТС в партнерстве с VVP Group создадут гуманоидных роботов ЦИПР продолжает радовать партнерствами — МТС и VVP Group объявили о стратегическом сотрудничестве. Основным направлением…

Читать далее →

2 205

20.05.2026 06:59

Т1 может получить долю в «Группе Астра» Начнем день с новостей, напрямую не относящихся к ЦИПР, но очень внушительных — Т1 может стать совладельцем «Группы Астра». Конкретно речь…

Читать далее →

2 076

Другие главы канала «СофтТех»

Выберите главу, чтобы продолжить чтение

Все посты →

Глава от 15.06.2026

Microsoft снова ломает Windows 11 И снова наша нерегулярная рубрика «Microsoft …

👁 725 просмотров

Глава от 15.06.2026

Cloud․ru устроит размещение на 10 миллиардов Компания Cloud․ru объявила о плана…

👁 660 просмотров

Глава от 15.06.2026

ВТБ разделит обязанности главы IT-блока Куратор IT-блока ВТБ Вадим Кулик может …

👁 797 просмотров

Глава от 15.06.2026

Выручка ИБ-стартапов сократилась более чем в два раза Выручка ИБ-стартапов в 20…

👁 736 просмотров

Глава от 14.06.2026

Математики против ИИ Вслед за представителями религии к обсуждению проблем иску…

👁 903 просмотров

Глава от 13.06.2026

Пятьдесят пятый браузерный #дайджест наиболее интересных инфоповодов недели Про…

👁 838 просмотров

Глава от 12.06.2026

Даже в выходной не забываем о простой истине — правильное ведение аргументации э…

👁 900 просмотров

Глава от 11.06.2026

Главный урок ИИ-рынка: громкие заявления ничего не гарантируют 🔹В новом выпуске…

👁 862 просмотров

Глава от 11.06.2026

MWS Octapi теперь совместим с Deckhouse Kubernetes Platform МТС Web Services об…

👁 735 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты

Вся тема →

@canalmaxone

AntiCloudMod

AntiCloudMod — сообщество для тех, кто ценит свободу общения без облачной цензуры. Здесь обсуждают альтернативные мессенджеры, инструменты для приватности и децентрализов…

👥 375 118 · +72 598/7д

@WylsacomRed

Wylsacom Red

Официальный канал Wylsacom в Max. Тут всё про технологии и жизнь в ногу со временем! Номер заявления для регистрации в РКН: № 6979154178 Розыгрыши: kichaev@wylsacom.med…

👥 154 331 · +9 407/7д

@BelgorodDRONE

Информация БПЛА Белгород, Белгородский район

Информация БПЛА Белгород, Белгородский район — специализированный канал в мессенджере Макс, посвященный новостям и информации о беспилотных летательных аппаратах в регион…

👥 137 539 · +7 139/7д

@TikTokModCloud

TikTokModCloud

Официальные обновления стабильного мода TikTok Чат: https://clck.ru/3S6mVh По рекламе: https://iimax.ru/dim4ugan

👥 80 864 · +16 775/7д

@hitech

Hi-Tech

Оперативные новости, обзоры гаджетов, собственное видео, трансляции мировых анонсов и мероприятий По вопросам сотрудничества и размещения рекламы i.ostapenko@corp.mail.r…

👥 53 233 · -150/7д

@na_kruchok

Глент

Глент мемы Это фан-сообщество, созданное преданными поклонниками для поддержки творчества Глента. Данный канал НЕ является официальным и ведется фанатом.

👥 40 222 · +29 203/7д

🏷 Темы и теги

#облачные технологии #it-решения #кибербезопасность #цод #бизнес-софт #Технологии

📋 О канале СофтТех

Всё об IT-решениях для бизнеса и о тех, кто их создаёт: ПО, кибербез, облака, ЦОДы.

ИД НОМ idnom.ru
Реклама: в Телеграме @id_nom / в MAX https://iimax.ru/id_nom
Редакция: в Телеграме @softtech_ed

Телеграм https://t.me/it2b_channel
Регистрация в РКН https://clck.ru/3FAYNW

🔍 Архив всех постов Макс

Поиск по 8,311,809 постам из 199,733 каналов

Попробовать за 1 ₽ →

Удалить пост или канал с МАКСОТЕКИ

Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.

Удалить этот пост Удалить канал