MachineLearning
MachineLearning
1 225 подписчиков · @ai_machinelearning_big_data
К каналу →
🗂️ Живая база лучших AI-инструментов - обновляется с 2023 и держит только актуальное В одном месте собрали весь стек, который реально используют сейчас: - свежие LLM и новые релизы…
Читать далее →
3 573
✔️ KIMI K2.6 за ночь обогнала LM Studio на маке! В блоге о запуске новой модели Kimi есть история, от которой немного отвисает челюсть.  Моделька сама, без человека, поставила себе…
Читать далее →
3 500

SSoT: Sakana AI научила LLM быть по-настоящему случайными Попросите любую LLM 100 раз «подбрось монету», и распределение орла и решки перекосится дале…

SSoT: Sakana AI научила LLM быть по-настоящему случайными
Попросите любую LLM 100 раз «подбрось монету», и распределение орла и решки перекосится далеко от честных 50 на 50. Похожая история с «придумай 10 идей для романа»: вместо десяти разных сюжетов модель выдаёт десять вариаций одного и того же. Даже если явно передать ей вероятности, генерировать выборку, строго соответствующую распределению, у LLM получается плохо.
Японская лаборатория Sakana AI в новой статье «SSoT: Prompting LLMs for Distribution-Faithful and Diverse Generation», принятой на ICLR 2026, показывает, что эту проблему можно закрыть одним только промптом, без дообучения и без внешних генераторов случайных чисел.
Приём называется String Seed of Thought и устроен максимально просто: модель сначала генерирует у себя в «голове» случайную строку, а потом использует её как сид при формировании итогового ответа. Никаких внешних инструментов и случайных чисел извне не требуется, всё делается средствами самой LLM.
Авторы прогнали SSoT на широком наборе моделей, и картина получилась убедительная. Смещение выборки у открытых и закрытых LLM заметно уменьшается, а у части reasoning-моделей точность распределений почти неотличима от настоящего ГСЧ. Метод работает не только на бинарном выборе вроде монетки, но и на произвольных дискретных распределениях.
SSoT резко повышает разнообразие генерации в задачах, где важна креативность. В экспериментах с написанием коротких художественных текстов добавление одной строчки SSoT в промпт ощутимо увеличивает разнообразие выходных документов, не ломая их качества. То есть один и тот же трюк одновременно чинит и «честную случайность», и типичную проблему с однообразными идеями.
Для AI-инженеров это интересно по нескольким причинам. SSoT можно воспринимать как дешёвый кирпич для построения продакшен-систем на LLM: там, где раньше приходилось прикручивать внешние сэмплеры или городить костыли, чтобы модель не залипала в одном и том же ответе, теперь иногда достаточно грамотно оформленного промпта. Sakana AI прямо называет SSoT базовой техникой для будущих подходов к inference-time scaling, интеграции LLM в реальные пайплайны и для задач, где нужны честные выборки из распределений.
Подробный разбор механизма, теоретический анализ и интерактивное демо лежат в блоге и в статье на arXiv.
Блог: https://pub.sakana.ai/ssot
Статья: https://arxiv.org/abs/2510.21150
Роскошный максимум: получить приглашение в команду SberAds за один день! 😉Сделать это можно на One Day Offer* для Data Analyst**, который пройдёт уже 25 апреля. Сбер ждёт специалис…
Читать далее →
2 608
🖥 Text-to-SQL ломается не из-за модели. Он ломается из-за схемы Большинство думает, что проблема в LLM или плохом промпте. На практике всё проще. Модель не видит правильные связи м…
Читать далее →
3 231
Другие главы канала «MachineLearning»
Выберите главу, чтобы продолжить чтение
Все посты →
Глава от 30.05.2026
✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…
👁 172 просмотров
Глава от 29.05.2026
ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…
👁 293 просмотров
Глава от 28.05.2026
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …
👁 448 просмотров
Глава от 28.05.2026
✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…
👁 498 просмотров
Глава от 27.05.2026
⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…
👁 637 просмотров
Глава от 26.05.2026
⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля.  Э…
👁 689 просмотров
Глава от 23.05.2026
Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …
👁 842 просмотров
Глава от 23.05.2026
📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …
👁 815 просмотров
Глава от 20.05.2026
GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…
👁 1 032 просмотров

Популярные посты канала «MachineLearning»

⚡️ Вышла новая модель **Minimax M2.7** и релиз получился очень мощным. Что интересного: • 🧠 **Self-evolving модель** M2.7 — одна из первых…
👁 5 364 просмотров
ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%. Лучшие результаты н…
👁 5 335 просмотров
📌 Anthropic опубликовала результаты масштабного опроса пользователей Claude. В декабре 2025 года Anthropic провела масштабное качественное и…
👁 5 319 просмотров
📌 Google разработала алгоритм квантования KV-кэша без потери точности. Подразделение Research анонсировало TurboQuant, алгоритм векторного к…
👁 5 310 просмотров
Топ тулза для экономии до 80% на ИИ. ClawRouter - это умный, опенсорсный маршрутизатор между моделями. ClawRouter сам выбирает, какой мод…
👁 5 308 просмотров
📌 Большой мастер-класс по Claude Code!  Перед вами репозиторий с полноценным визуальным и практическим гайдом по одному из самых мощных инст…
👁 5 277 просмотров
⚡️ Лучшие GitHub-репозитории для Claude Code, которые могут увеличить эффективность твоего следующего проекта 1. Superpowers   https://githu…
👁 5 272 просмотров
🚀 Anthropic показали новый режим:   AI может выполнять задачи на компьютере и по расписанию без твоего участия Главное: - Claude управляет к…
👁 5 270 просмотров
Все что выпустили Antropic за последнее время на одной картинке. 73 релиза за 52 дня.
👁 5 255 просмотров
🌟 NVIDIA Nemotron-Cascade 2: MoE на 30B параметров и золото на математических олимпиадах. Nemotron-Cascade 2 (https://huggingface.co/nvidia/…
👁 5 243 просмотров
🤖 Palantir AI + Claude использовались для обнаружения, приоритизации и ударов по более чем 1000 целям в первые 24 часа операции против Ирана…
👁 5 240 просмотров
Когда я прошу Клода провести проверку кода
👁 5 233 просмотров
✔️ Утечка в Anthropic раскрыла детали новой модели Claude. Из-за ошибки в CMS в открытый доступ попали около 3000 внутренних документов Anth…
👁 5 229 просмотров
✔️ OpenAI объединит ChatGPT, Codex и браузер Atlas в суперприложение. Компания меняет стратегию, отказываясь от выпуска разрозненных продукт…
👁 5 205 просмотров
⚡️ Claude Code на максималках: 32 агента, скорость в 5 раз выше, ноль новых инструментов Нашли интересный open source проект oh-my-claudecod…
👁 5 172 просмотров
Это войдёт в историю: как основатель GitLab использовал ИИ в борьбе с раком У Сида Сийбранди, основателя GitLab, диагностировали редкую форм…
👁 5 169 просмотров
🚨 Неожиданный результат исследования Anthropic Компания проанализировала 1,5 млн реальных диалогов с Claude - и обнаружила тревожную тенденц…
👁 5 163 просмотров
⚡️ Нашёл интересный open-source проект: Crucix Это self-hosted intelligence terminal, который автоматически следит за событиями в мире и при…
👁 5 109 просмотров
К такому вы не готовы: теперь можно превратить GitHub в удобный магазин приложений. 😱 Новый опенсорс проект GitHub Store, который позволяет…
👁 5 109 просмотров
Началась новая эпоха - гражданской науки, когда обычные люди могут проводить сложные научные исследования с помощью AI. Инженер без медицинс…
👁 5 072 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты
Вся тема →
@colonelcassad
Colonelcassad
Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…
👥 126 733 · +1 498/7д
@techcommedia
Техком
Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg
👥 109 287 · -7 123/7д
@neuronows
CHAT GPT
Chat GPT Бот - Все Нейросети на Русском, Бесплатно чат гпт
👥 107 636 · +12 843/7д
@Neurojumor
НЕЙРОЮМОР
Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…
👥 95 587 · +3 381/7д
@id343502039804_biz
ChatGPT | Gemini | DeepSeek | Veo | ЧатГПТ | Чат GPT
Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…
👥 76 568 · +1 732/7д
@ru_cipic
НЕЙРОЮМОР | ЮМОР | НЕЙРОСЕТЬ
Первый НейроЮморной В МАХ Друзья, данный канал создан исключительно в юмористических целях! Весь контент сгенерирован нейросетями, все что Вы видите - это фантазия ней…
👥 61 964 · -1 236/7д
🏷 Темы и теги
#машинное обучение #machine learning #искусственный интеллект #дата сайнс #llm #ИИ и нейросети
📋 О канале MachineLearning
t.me/ai_machinelearning_big_data все о машинном обучение, llm, machine learning
🔍 Архив всех постов Макс
Поиск по 7,257,490 постам из 199,573 каналов
Попробовать за 1 ₽ →
Удалить пост или канал с МАКСОТЕКИ
Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.
📊 Аналитика канала «MachineLearning» ➡️ Перейти в канал Макс
Заявка в МАКСОТЕКА
Добавьте свой канал в каталог
Зарегистрируйтесь в личном кабинете и добавьте канал за пару кликов.
Перейти в личный кабинет →

Бесплатная регистрация, быстрая модерация.