✔️ Институт Аллена открыл исходный код семейства Molmo 2.
Теперь разработчики могут самостоятельно обучать и развертывать Molmo 2 на собственных данных. Это семейство моделей, представленное в декабре 2025 года, которое специализируется на глубоком понимании видео и изображений, показывает SOTA в трекинге объектов, подсчете и покадровом логическом выводе.
Ai2 опубликовали полный набор инфраструктурных инструментов. Репозиторий включает скрипты для претрейна и файнтюнинга (включая SFT), поддержку распределенного обучения на нескольких узлах, а также утилиты для подготовки данных и оценки качества.
Помимо пайплайна обучения, открыт инструментарий для деплоя. В него вошли конвертер чекпоинтов в стандартный формат Hugging Face, примеры инференса на transformers и vLLM, легковесная утилита для офлайн-обработки графики, а также готовый Docker-образ и Gradio-демо.
Ai2 в сети Х
✔️ В Claude Code началось развертывание голосового режима.
Функция пока доступна лишь 5% пользователей, но охват будет расти в ближайшие недели. Если у вас появился доступ (об этом сообщит уведомление на стартовом экране), режим активируется командой /voice.
Механика ввода работает по принципу рации: зажимаете пробел, диктуете запрос и отпускаете клавишу. Распознанный текст транслируется прямо в позицию курсора, что дает бесшовную комбинацию форматов - можно начать писать запрос руками, надиктовать самую объемную часть голосом и продолжить печатать.
Голосовой режим не требует дополнительной платы, а токены, затраченные на транскрибацию речи, не учитываются в лимитах. Новая возможность будет внедряться постепенно для всех подписчиков тарифов Pro, Max, Team и Enterprise.
Thariq Shihipar (Claude Code Team) в сети Х. https://github.com/allenai/molmo2