MachineLearning
MachineLearning
1 225 подписчиков · @ai_machinelearning_big_data
К каналу →
🚀 DeepSeek выкатили V4 и сделали то, к чему все шли последние два года.  Длинный контекст больше не фича для демо. Теперь это базовый уровень. Пока Запад празднует релизы с пафосны…
Читать далее →
3 156
Gemini после того, как Google вложил 40 000 000 000 долларов в Claude Google - инвестирует 40 миллиардов долларов, чтобы выпустить claude mythos. Новая сделка дает им 10 миллиардов…
Читать далее →
3 047

🐠 Эволюция вместо масштабирования: TRINITY от Sakana AI выжимает 86,2% на LiveCodeBench из готовых LLM.

🐠 Эволюция вместо масштабирования: TRINITY от Sakana AI выжимает 86,2% на LiveCodeBench из готовых LLM.
Лаборатория Sakana AI выкатила работу, которая хорошо ложится на текущее ощущение всей индустрии: бесконечное скейлинг-марафон с одиночными монолитными моделями постепенно упирается в стену diminishing returns. Их ответ называется TRINITY, и это не очередная гигантская LLM, а лёгкий координатор поверх уже существующих топовых моделей. Статья принята на ICLR 2026.
Идея простая по форме и довольно дерзкая по сути. 
Вместо того чтобы обучать одну огромную сетку под все задачи, авторы предлагают композицию моделей на этапе инференса (test-time model composition). TRINITY дирижирует пулом разных state-of-the-art LLM, не трогая их веса и не требуя совместимой архитектуры. По сути, это попытка обойти главные боли model merging: разные размерности скрытых состояний, разные токенизаторы и закрытые веса фронтирных моделей.
Работает это итеративно, в несколько ходов. На каждом шаге координатор смотрит на текущее состояние задачи и назначает одной из доступных LLM одну из трёх ролей. Thinker строит верхнеуровневую стратегию и анализирует ситуацию. Worker выполняет конкретные шаги решения. Verifier проверяет, насколько текущий ответ полон и корректен. Динамическое распределение этих ролей позволяет выгружать тяжёлый reasoning и узкоспециализированные навыки на внешние модели, оставляя сам координатор максимально лёгким.
Координатор работает на скрытых состояниях небольшой компактной языковой модели плюс маленькая routing head поверх. Суммарно меньше 20 тысяч обучаемых параметров. Для текущего ландшафта мультиагентных систем это смешные цифры.
Обучить такую систему оказалось нетривиально. Стандартный REINFORCE не вывез: слишком низкое отношение сигнал/шум на бинарных наградах и слабая связь градиентов с параметрами. Классическое SFT тоже отпало: разметка многоходовых траекторий получается жёстко дорогой. Решение в духе Sakana: эволюционный поиск без градиентов. Авторы используют derivative-free эволюционный алгоритм, который вылизывает эту компактную высокомерную задачу координации там, где классический градиентный оптимизатор просто ломается.
По цифрам выглядит убедительно. TRINITY стабильно обходит и существующие мультиагентные бэйзлайны, и отдельные модели в пуле на разных бенчмарках. Главная цифра на момент публикации: state-of-the-art 86,2% pass@1 на LiveCodeBench. Еще интереснее история с генерализацией. Без дообучения координатор в zero-shot режиме перенёсся на четыре невиданных задачи (AIME, BigCodeBench, MT-Bench, GPQA) и в среднем обошёл любую отдельную модель из своего пула, включая GPT-5, Gemini 2.5 Pro и Claude 4 Sonnet.
TRINITY показывает, что хорошо организованный ансамбль из разнородных моделей может стабильно обходить любую свою отдельную составляющую, если правильно подобрать механизм координации. При этом систему не нужно переобучать под каждый новый бенчмарк, что отличает её от многих специализированных решений.
Отдельно стоит обратить внимание на подход Sakana к самому видению будущего AI. Авторы явно ставят всю философию лабы на коллаборативные экосистемы разнородных моделей, которые можно комбинировать и адаптировать, вместо бесконечного качания параметров в одной монолитной сетке. TRINITY выводят как фундаментальный кирпичик коммерческого продукта Sakana Fugu, бета-версия этой мультиагентной оркестровки уже открыта.
Эволюция вместо масштабирования: TRINITY от Sakana AI выжимает 86,2% на LiveCodeBench из готовых LLM
Полезные ссылки:
Paper (arXiv): https://arxiv.org/abs/2512.04695
OpenReview: https://openreview.net/forum?id=5HaRj
Sakana Fugu (бета): https://sakana.ai/fugu-beta
Пост в X: https://x.com/SakanaAILabs/status/2048181386868293639
📌 Гайд по промптингу GPT-5.5: старые промпты придётся переписать. GPT-5.5 отличается от GPT-5.2 или GPT-5.4 в части промптнинга. Миграцию OpenAI советует (https://developers.open…
Читать далее →
2 790
✔️OpenAI предлагает $25 000 за джейлбрейк биозащиты в GPT-5.5. Компания запустила программу Bio Bug Bounty - проверку устойчивости GPT-5.5 к джейлбрейкам в области биобезопасности…
Читать далее →
2 648
Другие главы канала «MachineLearning»
Выберите главу, чтобы продолжить чтение
Все посты →
Глава от 30.05.2026
✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…
👁 172 просмотров
Глава от 29.05.2026
ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…
👁 293 просмотров
Глава от 28.05.2026
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …
👁 448 просмотров
Глава от 28.05.2026
✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…
👁 498 просмотров
Глава от 27.05.2026
⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…
👁 637 просмотров
Глава от 26.05.2026
⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля.  Э…
👁 689 просмотров
Глава от 23.05.2026
Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …
👁 842 просмотров
Глава от 23.05.2026
📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …
👁 815 просмотров
Глава от 20.05.2026
GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…
👁 1 032 просмотров

Популярные посты канала «MachineLearning»

⚡️ Вышла новая модель **Minimax M2.7** и релиз получился очень мощным. Что интересного: • 🧠 **Self-evolving модель** M2.7 — одна из первых…
👁 5 364 просмотров
ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%. Лучшие результаты н…
👁 5 335 просмотров
📌 Anthropic опубликовала результаты масштабного опроса пользователей Claude. В декабре 2025 года Anthropic провела масштабное качественное и…
👁 5 319 просмотров
📌 Google разработала алгоритм квантования KV-кэша без потери точности. Подразделение Research анонсировало TurboQuant, алгоритм векторного к…
👁 5 310 просмотров
Топ тулза для экономии до 80% на ИИ. ClawRouter - это умный, опенсорсный маршрутизатор между моделями. ClawRouter сам выбирает, какой мод…
👁 5 308 просмотров
📌 Большой мастер-класс по Claude Code!  Перед вами репозиторий с полноценным визуальным и практическим гайдом по одному из самых мощных инст…
👁 5 277 просмотров
⚡️ Лучшие GitHub-репозитории для Claude Code, которые могут увеличить эффективность твоего следующего проекта 1. Superpowers   https://githu…
👁 5 272 просмотров
🚀 Anthropic показали новый режим:   AI может выполнять задачи на компьютере и по расписанию без твоего участия Главное: - Claude управляет к…
👁 5 270 просмотров
Все что выпустили Antropic за последнее время на одной картинке. 73 релиза за 52 дня.
👁 5 255 просмотров
🌟 NVIDIA Nemotron-Cascade 2: MoE на 30B параметров и золото на математических олимпиадах. Nemotron-Cascade 2 (https://huggingface.co/nvidia/…
👁 5 243 просмотров
🤖 Palantir AI + Claude использовались для обнаружения, приоритизации и ударов по более чем 1000 целям в первые 24 часа операции против Ирана…
👁 5 240 просмотров
Когда я прошу Клода провести проверку кода
👁 5 233 просмотров
✔️ Утечка в Anthropic раскрыла детали новой модели Claude. Из-за ошибки в CMS в открытый доступ попали около 3000 внутренних документов Anth…
👁 5 229 просмотров
✔️ OpenAI объединит ChatGPT, Codex и браузер Atlas в суперприложение. Компания меняет стратегию, отказываясь от выпуска разрозненных продукт…
👁 5 205 просмотров
⚡️ Claude Code на максималках: 32 агента, скорость в 5 раз выше, ноль новых инструментов Нашли интересный open source проект oh-my-claudecod…
👁 5 172 просмотров
Это войдёт в историю: как основатель GitLab использовал ИИ в борьбе с раком У Сида Сийбранди, основателя GitLab, диагностировали редкую форм…
👁 5 169 просмотров
🚨 Неожиданный результат исследования Anthropic Компания проанализировала 1,5 млн реальных диалогов с Claude - и обнаружила тревожную тенденц…
👁 5 163 просмотров
⚡️ Нашёл интересный open-source проект: Crucix Это self-hosted intelligence terminal, который автоматически следит за событиями в мире и при…
👁 5 109 просмотров
К такому вы не готовы: теперь можно превратить GitHub в удобный магазин приложений. 😱 Новый опенсорс проект GitHub Store, который позволяет…
👁 5 109 просмотров
Началась новая эпоха - гражданской науки, когда обычные люди могут проводить сложные научные исследования с помощью AI. Инженер без медицинс…
👁 5 072 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты
Вся тема →
@colonelcassad
Colonelcassad
Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…
👥 126 543 · +1 498/7д
@techcommedia
Техком
Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg
👥 109 287 · -7 123/7д
@neuronows
CHAT GPT
Chat GPT Бот - Все Нейросети на Русском, Бесплатно чат гпт
👥 107 636 · +12 843/7д
@Neurojumor
НЕЙРОЮМОР
Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…
👥 95 587 · +3 381/7д
@id343502039804_biz
ChatGPT | Gemini | DeepSeek | Veo | ЧатГПТ | Чат GPT
Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…
👥 76 568 · +1 732/7д
@ru_cipic
НЕЙРОЮМОР | ЮМОР | НЕЙРОСЕТЬ
Первый НейроЮморной В МАХ Друзья, данный канал создан исключительно в юмористических целях! Весь контент сгенерирован нейросетями, все что Вы видите - это фантазия ней…
👥 61 964 · -1 236/7д
🏷 Темы и теги
#машинное обучение #machine learning #искусственный интеллект #дата сайнс #llm #ИИ и нейросети
📋 О канале MachineLearning
t.me/ai_machinelearning_big_data все о машинном обучение, llm, machine learning
🔍 Архив всех постов Макс
Поиск по 7,256,901 постам из 199,573 каналов
Попробовать за 1 ₽ →
Удалить пост или канал с МАКСОТЕКИ
Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.
📊 Аналитика канала «MachineLearning» ➡️ Перейти в канал Макс
Заявка в МАКСОТЕКА
Добавьте свой канал в каталог
Зарегистрируйтесь в личном кабинете и добавьте канал за пару кликов.
Перейти в личный кабинет →

Бесплатная регистрация, быстрая модерация.