Личный кабинет

👤Вход / Регистрация → ➕Добавить канал → 💳Попробовать 7 дней за 1 ₽ →

Разделы

🏠Главная → 📚Каталог → 📈ТОП 100 → 🆕Новинки → 🏷️Тематики → 🔒Закрытые каналы → 📊Статистика → 💬Чаты и группы → ℹ️О проекте → ✍️Блог →

Для каналов и групп

🤖Автопостинг в Макс → 🎨Стикеры в Макс → 💬Комментарии в Макс → 📊Опросы в Макс → 📈Откуда подписчики →

Полезное

🔒Конфиденциальность → ✉️Связь →

+ Добавить канал Блог

Быстрый доступ ко всем ключевым страницам каталога MAX с мобильного.

MachineLearning

1 225 подписчиков · @ai_machinelearning_big_data

К каналу →

24.04.2026 04:43

🚀 DeepSeek выкатили V4 и сделали то, к чему все шли последние два года. Длинный контекст больше не фича для демо. Теперь это базовый уровень. Пока Запад празднует релизы с пафосны…

Читать далее →

3 156

25.04.2026 07:36

Gemini после того, как Google вложил 40 000 000 000 долларов в Claude Google - инвестирует 40 миллиардов долларов, чтобы выпустить claude mythos. Новая сделка дает им 10 миллиардов…

Читать далее →

3 047

26.04.2026 07:28

🐠 Эволюция вместо масштабирования: TRINITY от Sakana AI выжимает 86,2% на LiveCodeBench из готовых LLM.

🐠 Эволюция вместо масштабирования: TRINITY от Sakana AI выжимает 86,2% на LiveCodeBench из готовых LLM.
Лаборатория Sakana AI выкатила работу, которая хорошо ложится на текущее ощущение всей индустрии: бесконечное скейлинг-марафон с одиночными монолитными моделями постепенно упирается в стену diminishing returns. Их ответ называется TRINITY, и это не очередная гигантская LLM, а лёгкий координатор поверх уже существующих топовых моделей. Статья принята на ICLR 2026.

Как наконец стать собой: курс «Сепарация» для женщин

Перестаньте жить чужими ожиданиями — найдите внутреннюю свободу и уверенность

Начать путь к себе →

Идея простая по форме и довольно дерзкая по сути.
Вместо того чтобы обучать одну огромную сетку под все задачи, авторы предлагают композицию моделей на этапе инференса (test-time model composition). TRINITY дирижирует пулом разных state-of-the-art LLM, не трогая их веса и не требуя совместимой архитектуры. По сути, это попытка обойти главные боли model merging: разные размерности скрытых состояний, разные токенизаторы и закрытые веса фронтирных моделей.
Работает это итеративно, в несколько ходов. На каждом шаге координатор смотрит на текущее состояние задачи и назначает одной из доступных LLM одну из трёх ролей. Thinker строит верхнеуровневую стратегию и анализирует ситуацию. Worker выполняет конкретные шаги решения. Verifier проверяет, насколько текущий ответ полон и корректен. Динамическое распределение этих ролей позволяет выгружать тяжёлый reasoning и узкоспециализированные навыки на внешние модели, оставляя сам координатор максимально лёгким.
Координатор работает на скрытых состояниях небольшой компактной языковой модели плюс маленькая routing head поверх. Суммарно меньше 20 тысяч обучаемых параметров. Для текущего ландшафта мультиагентных систем это смешные цифры.
Обучить такую систему оказалось нетривиально. Стандартный REINFORCE не вывез: слишком низкое отношение сигнал/шум на бинарных наградах и слабая связь градиентов с параметрами. Классическое SFT тоже отпало: разметка многоходовых траекторий получается жёстко дорогой. Решение в духе Sakana: эволюционный поиск без градиентов. Авторы используют derivative-free эволюционный алгоритм, который вылизывает эту компактную высокомерную задачу координации там, где классический градиентный оптимизатор просто ломается.
По цифрам выглядит убедительно. TRINITY стабильно обходит и существующие мультиагентные бэйзлайны, и отдельные модели в пуле на разных бенчмарках. Главная цифра на момент публикации: state-of-the-art 86,2% pass@1 на LiveCodeBench. Еще интереснее история с генерализацией. Без дообучения координатор в zero-shot режиме перенёсся на четыре невиданных задачи (AIME, BigCodeBench, MT-Bench, GPQA) и в среднем обошёл любую отдельную модель из своего пула, включая GPT-5, Gemini 2.5 Pro и Claude 4 Sonnet.
TRINITY показывает, что хорошо организованный ансамбль из разнородных моделей может стабильно обходить любую свою отдельную составляющую, если правильно подобрать механизм координации. При этом систему не нужно переобучать под каждый новый бенчмарк, что отличает её от многих специализированных решений.
Отдельно стоит обратить внимание на подход Sakana к самому видению будущего AI. Авторы явно ставят всю философию лабы на коллаборативные экосистемы разнородных моделей, которые можно комбинировать и адаптировать, вместо бесконечного качания параметров в одной монолитной сетке. TRINITY выводят как фундаментальный кирпичик коммерческого продукта Sakana Fugu, бета-версия этой мультиагентной оркестровки уже открыта.
Эволюция вместо масштабирования: TRINITY от Sakana AI выжимает 86,2% на LiveCodeBench из готовых LLM
Полезные ссылки:
Paper (arXiv): https://arxiv.org/abs/2512.04695
OpenReview: https://openreview.net/forum?id=5HaRj
Sakana Fugu (бета): https://sakana.ai/fugu-beta
Пост в X: https://x.com/SakanaAILabs/status/2048181386868293639

27.04.2026 08:58

📌 Гайд по промптингу GPT-5.5: старые промпты придётся переписать. GPT-5.5 отличается от GPT-5.2 или GPT-5.4 в части промптнинга. Миграцию OpenAI советует (https://developers.open…

Читать далее →

2 790

28.04.2026 08:56

✔️OpenAI предлагает $25 000 за джейлбрейк биозащиты в GPT-5.5. Компания запустила программу Bio Bug Bounty - проверку устойчивости GPT-5.5 к джейлбрейкам в области биобезопасности…

Читать далее →

2 648

Другие главы канала «MachineLearning»

Выберите главу, чтобы продолжить чтение

Все посты →

Глава от 30.05.2026

✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…

👁 172 просмотров

Глава от 29.05.2026

ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…

👁 293 просмотров

Глава от 28.05.2026

Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …

👁 448 просмотров

Глава от 28.05.2026

✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…

👁 498 просмотров

Глава от 27.05.2026

⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…

👁 637 просмотров

Глава от 26.05.2026

⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля. Э…

👁 689 просмотров

Глава от 23.05.2026

Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …

👁 842 просмотров

Глава от 23.05.2026

📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …

👁 815 просмотров

Глава от 20.05.2026

GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…

👁 1 032 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты

Вся тема →

@colonelcassad

Colonelcassad

Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…

👥 126 543 · +1 498/7д

@techcommedia

Техком

Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg

👥 109 287 · -7 123/7д

@neuronows

CHAT GPT

Chat GPT Бот - Все Нейросети на Русском, Бесплатно чат гпт

👥 107 636 · +12 843/7д

@Neurojumor

НЕЙРОЮМОР

Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…

👥 95 587 · +3 381/7д

@id343502039804_biz

Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…

👥 76 568 · +1 732/7д

@ru_cipic

НЕЙРОЮМОР | ЮМОР | НЕЙРОСЕТЬ

Первый НейроЮморной В МАХ Друзья, данный канал создан исключительно в юмористических целях! Весь контент сгенерирован нейросетями, все что Вы видите - это фантазия ней…

👥 61 964 · -1 236/7д

🏷 Темы и теги

#машинное обучение #machine learning #искусственный интеллект #дата сайнс #llm #ИИ и нейросети

📋 О канале MachineLearning

t.me/ai_machinelearning_big_data все о машинном обучение, llm, machine learning

🔍 Архив всех постов Макс

Поиск по 7,256,901 постам из 199,573 каналов

Попробовать за 1 ₽ →

Удалить пост или канал с МАКСОТЕКИ

Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.

Удалить этот пост Удалить канал