Пост канала «АВРОРА⭕️ХАЙТЕК®» от 03.07.2026
Сбер опубликовал первую диффузионную языковую модель GFusion на основе GigaChat, а также рассказал о методах ее обучения. Это экспериментальный проект, который разработал стажер компании, студент 4-м курса Факультета компьютерных наук НИУ ВШЭ Даниил Тихонов. Диффузионные модели считаются перспективным направлением в сфере генеративного ИИ.
Классические LLM генерируют текст последовательно, слово за словом (авторегрессия), поэтому, чтобы исправить одну ошибку, модель вынуждена переписывать весь ответ заново. GFusion работает иначе: сначала создаёт приблизительный «набросок» ответа, а затем пошагово дорабатывает его — так же, как нейросети генерируют изображения и видео. За счёт параллельной генерации GFusion пишет текст быстрее: по тестам Сбера — до 45% быстрее GigaChat 3, на основе которого она обучалась. Кроме того, диффузионные модели также извлекают больше информации из ограниченного объема данных, обучаясь на одном и том же датасете несколько раз.
ФОТО: ichip.ru
#аврорамедиа_технологии
Информационная-экосистема АВРОРА⭕️МЕДИА®
МЕДИА | НОВОСТИ | РЕГИОН | ЛАЙФ | СПОРТ | ГЕРЛЗ | ХАЙТЕК | ПЕРСОНЫ | ИНСАЙД | КРИМИНАЛ | МОЛОДОСТЬ | LIVЕ ПСИХОЛОГИЯ | КИНО | ХАБАРОВСК
Медиа-ресурсы АВРОРА⭕️МЕДИА®
TELEGRAM | VK-ВИДЕО | RUTUBE | YOUTUBE | ДЗЕН | VK