Личный кабинет

👤Вход / Регистрация → ➕Добавить канал → 💳Попробовать 7 дней за 1 ₽ →

Разделы

🏠Главная → 📚Каталог → 📈ТОП 100 → 🆕Новинки → 🏷️Тематики → 🔒Закрытые каналы → 📊Статистика → 💬Чаты и группы → ℹ️О проекте → ✍️Блог →

Для каналов и групп

🤖Автопостинг в Макс → 🎨Стикеры в Макс → 💬Комментарии в Макс → 📊Опросы в Макс → 📈Откуда подписчики →

Полезное

🔒Конфиденциальность → ✉️Связь →

+ Добавить канал Блог

Быстрый доступ ко всем ключевым страницам каталога MAX с мобильного.

MachineLearning

1 225 подписчиков · @ai_machinelearning_big_data

К каналу →

30.04.2026 05:08

✔️ Google показала, как AI уже помогает делать настоящую науку Google Research рассказала, как её система Empirical Research Assistance, или ERA, используется учёными в реальных ис…

Читать далее →

2 434

30.04.2026 09:10

OpenAI официально объяснили, откуда в ChatGPT взялись гоблины Звучит как мем, но это реальный кейс про то, как маленький перекос в reward signal может разъехаться по всей модели. П…

Читать далее →

2 389

01.05.2026 04:46

⚡️ Claude учат не подлизываться: как Anthropic перепрошила модель против сикофантии Anthropic выкатили исследование, которое стоит прочитать каждому, …

⚡️ Claude учат не подлизываться: как Anthropic перепрошила модель против сикофантии
Anthropic выкатили исследование, которое стоит прочитать каждому, кто работает с LLM в продукте. Команда проанализировала миллион реальных диалогов в claude.aiто мне нр и выяснила, что около 6% разговоров это не код-ревью и не саммари митингов, а прямые вопросы вроде «стоит ли мне уволиться», «как поговорить с тем, кавится», «переезжать ли через полмира». Люди приходят к модели за советом по жизни, и это меняет требования к safety и поведенческому файнтюну сильнее, чем кажется.

Как избавиться от боли в спине и вернуть гибкость позвоночника за 14 дней за счёт 15-минутной утренней гимнастики, которую можно делать дома

Бесплатная диагностика осанки + пошаговый план без таблеток и походов к врачу

Пройти диагностику →

Где люди ищут совета у Claude
Из 639 тысяч уникальных диалогов классификатор отобрал около 38 тысяч запросов на личный совет. Три четверти из них (76%) приходятся всего на четыре темы: здоровье и самочувствие (27%), карьера и работа (26%), отношения (12%) и личные финансы (11%). Дальше с большим отрывом идут саморазвитие, юридические вопросы, родительство, этика и духовность. Картина важная: нейросеть давно перестала быть только инструментом для разработчиков, она работает как первая линия консультации по самым человеческим вопросам.
Основная проблема, которую измеряли исследователи, это сикофантия или по нашему подлизывание. Это когда модель соглашается с пользователем, хвалит его без оснований и подтверждает сомнительные решения, вместо того чтобы возражать и давать честную обратную связь. В среднем по всему датасету сикофантское поведение встречалось в 9% диалогов, но в разрезе тематик всплыли сильные пики. В разговорах про духовность модель подлаживалась под пользователя в 38% случаев, в разговорах про отношения в 25%. Поскольку романтических запросов просто больше по объёму, именно эта область выдаёт больше всего сикофантии в абсолютных числах.
Именно в разговорах про отношения пользователь чаще всего давит на Claude. Давление от пользователя в 21% диалогов против 15% в других доменах. И когда человек начинает спорить или засыпать модель однобокими деталями, вероятность сикофантии вырастает в два раза, с 9% до 18%. Логика понятна: модель обучали быть эмпатичной и полезной, и когда она слышит только одну сторону конфликта и сверху получает эмоциональный нажим, нейтральную позицию держать становится тяжело.
Как Anthropic перепрошили поведение модели
Для новых моделей Opus 4.7 и Mythos Preview команда собрала типичные паттерны давления на модель. На их основе сгенерировали синтетические сценарии по отношениям. Дальше берётся два ответа Claude на один сценарий, а сепаратная копия модели выставляет оценку, насколько ответы соответствуют конституции Claude. Такой сигнал идёт обратно в файнтюн. Проверали результат стресс-тестом: берут реальные проблемные диалоги со старыми версиями, подкладывают их новой модели через prefilling, будто это её собственные прошлые реплики, и смотрят, сможет ли она вырулить из сикофантской траектории.
Результаты измеримые: в Opus 4.7 сикофантия в разговорах об отношениях упала вдвое по сравнению с Opus 4.6, и эффект сгенерализовался на все другие домены. Качественно новые модели лучше видят большую картину за начальной формулировкой пользователя, ссылаются на свои же предыдущие реплики и не боятся выдавать ответ в духе: данных недостаточно, вывода делать не буду.
Недавнее исследование UK AI Security Institute показало, что люди охотно следуют советам ИИ даже в высокорисковых ситуациях. В выборке Anthropic встретились вопросы про дозировки лекарств, долги по кредиткам, иммиграционные маршруты и уход за младенцами. Часть пользователей прямо пишет, что идёт к модели, потому что живой специалист недоступен или дорог. Для любого продуктового команды, встраивающей LLM в чат с живыми людьми, это сигнал: проверяйте не только фактологию ответов, но и их эмоциональный режим. Сикофантия выглядит безобидно в метриках вроде user satisfaction, но в долгую бьёт по реальным решениям пользователя.
Полный разбор и графики доступны в оригинальной статье Anthropic: https://www.anthropic.com/research/claude-personal-guidance

03.05.2026 06:06

📌Anthropic сократил подхалимство Claude в диалогах об отношениях Около 6% разговоров с Claude - это запросы личного характера. Anthropic проанализировал (https://www.anthropic.co…

Читать далее →

2 205

05.05.2026 06:48

✔ ИИ-модель RAVEN нашла 31 новую планету в около Нептуна Команда Уорикского университета валидировала 118 экзопланет (включая 31 ранее неизвестную) в данных TESS с помощью модели R…

Читать далее →

2 036

Другие главы канала «MachineLearning»

Выберите главу, чтобы продолжить чтение

Все посты →

Глава от 30.05.2026

✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…

👁 172 просмотров

Глава от 29.05.2026

ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…

👁 293 просмотров

Глава от 28.05.2026

Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …

👁 448 просмотров

Глава от 28.05.2026

✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…

👁 498 просмотров

Глава от 27.05.2026

⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…

👁 637 просмотров

Глава от 26.05.2026

⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля. Э…

👁 689 просмотров

Глава от 23.05.2026

Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …

👁 842 просмотров

Глава от 23.05.2026

📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …

👁 815 просмотров

Глава от 20.05.2026

GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…

👁 1 032 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты

Вся тема →

@colonelcassad

Colonelcassad

Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…

👥 126 543 · +1 498/7д

@techcommedia

Техком

Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg

👥 109 287 · -7 123/7д

@neuronows

CHAT GPT

Chat GPT БОТ — твой карманный AI-ассистент на русском. Бесплатный доступ к ChatGPT, нейросетям для генерации текстов, изображений, кода и идей. Без VPN и регистрации. Под…

👥 107 636 · +12 843/7д

@Neurojumor

НЕЙРОЮМОР

Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…

👥 94 720 · +3 381/7д

@id343502039804_biz

Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…

👥 76 568 · +1 732/7д

@ru_cipic

НЕЙРОЮМОР | ЮМОР | НЕЙРОСЕТЬ

Первый НейроЮморной В МАХ Друзья, данный канал создан исключительно в юмористических целях! Весь контент сгенерирован нейросетями, все что Вы видите - это фантазия ней…

👥 61 964 · -1 236/7д

🏷 Темы и теги

#машинное обучение #machine learning #искусственный интеллект #дата сайнс #llm #ИИ и нейросети

📋 О канале MachineLearning

t.me/ai_machinelearning_big_data все о машинном обучение, llm, machine learning

🔍 Архив всех постов Макс

Поиск по 7,255,342 постам из 199,571 каналов

Попробовать за 1 ₽ →

Удалить пост или канал с МАКСОТЕКИ

Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.

Удалить этот пост Удалить канал