Личный кабинет

👤Вход / Регистрация → ➕Добавить канал → 💳Подключить за 490 ₽/мес →

Разделы

🏠Главная → 📚Каталог → 📈ТОП 100 → 🆕Новинки → 🏷️Тематики → 🗞️Архив постов → 🔒Закрытые каналы → 📊Статистика → 📢Реклама → 💬Чаты и группы → ℹ️О проекте → ✍️Блог →

Для каналов и групп

🤖Автопостинг в Макс → 🎨Стикеры в Макс → 💬Комментарии в Макс → 📊Опросы в Макс → 📈Откуда подписчики →

Полезное

🔒Конфиденциальность → ✉️Связь →

+ Добавить канал Блог

Быстрый доступ ко всем ключевым страницам каталога MAX с мобильного.

MachineLearning

1 283 подписчиков · @ai_machinelearning_big_data

К каналу →

04.02.2026 11:31

🌟 Qwen3-Coder-Next: агентная MoE-модель в линейке Qwen3-Coder. Qwen3-Coder-Next (https://qwen.ai/blog?id=qwen3-coder-next) — открытая MoE-модель на 80 млрд. общих и 3 млрд. активн…

Читать далее →

2 978

06.02.2026 06:55

✔️ NVIDIA представила семейство мультимодальных моделей для визуального поиска. Nemotron ColEmbed V2 - обновленная линейка эмбеддинг-моделей (3B, 4B и 8B) для сложных RAG-системы. …

Читать далее →

3 023

09.02.2026 07:07

📌 OVQA: прощай, KV-cache offloading.

📌 OVQA: прощай, KV-cache offloading.
В Zyphra придумали (https://www.zyphra.com/post/ovqa)

Вам предодобрено 30 000 рублей под 0% на 30 дней

Ставка 0% вы получаете 30 000 рублей и возвращаете 30 000 через 30 дней без переплат!

Получить деньги на карту

как усидеть на двух стульях сразу, когда хочется резиновый контекст, но под рукой нет тонны памяти.
То. что они предложили, называется Online Vector-Quantized Attention - это модификация (https://arxiv.org/pdf/2602.03922)
векторного квантования, которая учит словарь думать на лету.
В классическом VQ ключи заменяются ближайшими центроидами из статичного словаря. Это бустит вычисления, но создает проблему: словарь обучен на одних данных, а во время генерации модель видит совсем другое распределение ключей. Ошибка квантования растет, внимание теряет точность и как итог: VQ начинает плавать.
Так вот, модификация в том, чтобы отказаться от статического словаря в пользу адаптивного к текущей последовательности: каждый новый токен обновляет только один центроид - тот, к которому ближе всего.
Это разреженное обновление работает как защита от катастрофического забывания: старая информация не вымывается новой волной токенов, а аккуратно перезаписывается по мере необходимости.
Плюс есть хард-лимит на размер состояния, после достижения которого объем памяти перестает расти, а вычисления становятся строго линейными.
🟡Результаты тестовых экспериментов
🟢Модель, обученная на 4К токенах, уверенно справлялась с контекстом до 64К без деградации качества;
🟢На внутриконтекстном поиске OVQ почти не отставала от полноценного самовнимания, потребляя при этом в 4 раза меньше памяти;
🟢На In-Context Learning VQ провалился, а OVQ вышла на уровень классического внимания, используя всего ~4К центроидов;
🟢Сравнения с линейными альтернативами (Mamba2 и дельта-сети) тоже в пользу OVQ: она стабильнее держит долгий контекст без просадок точности;
🟠В задачах Positional ICR OVQA работает чуть хуже, чем классическое внимание но все равно достойно.
Очень хочется надеяться, что OVQ - это предтеча настоящего непрерывного обучения, где в светлом будущем вместо бесконечно пухнущего KV-кэша появится компактная, но живая память, способная удерживать важные детали без потерь.
🟡Статья (https://www.zyphra.com/post/ovqa)
🟡Arxiv (https://arxiv.org/pdf/2602.03922)
#AI #ML #LLM #OVQA #Zyphra

12.02.2026 09:21

⚡️ DeepWiki - GitHub-репозитории, которые можно “спросить” как ChatGPT DeepWiki - это инструмент, который превращает любой GitHub-проект в интерактивную документацию с AI. Просто з…

Читать далее →

3 241

14.02.2026 09:01

✔️ OpenAI обвинила DeepSeek в краже знаний через дистилляцию. В меморандуме для Комитета Палаты представителей по Китаю OpenAI пожаловалась, что DeepSeek обучала свои модели на вых…

Читать далее →

3 318

Другие главы канала «MachineLearning»

Выберите главу, чтобы продолжить чтение

Все посты →

Глава от 30.05.2026

✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…

👁 172 просмотров

Глава от 29.05.2026

ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…

👁 293 просмотров

Глава от 28.05.2026

Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …

👁 448 просмотров

Глава от 28.05.2026

✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…

👁 498 просмотров

Глава от 27.05.2026

⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…

👁 637 просмотров

Глава от 26.05.2026

⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля. Э…

👁 689 просмотров

Глава от 23.05.2026

Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …

👁 842 просмотров

Глава от 23.05.2026

📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …

👁 815 просмотров

Глава от 20.05.2026

GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…

👁 1 032 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты

Вся тема →

@neuronows

CHAT GPT

Chat GPT Бот - Все Нейросети на Русском, Бесплатно чат гпт

👥 136 081 · -3 162/7д

@colonelcassad

Colonelcassad

Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…

👥 132 032 · +707/7д

@Neurojumor

НЕЙРОЮМОР

Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…

👥 106 311 · +2 431/7д

@steamfree48

Chat GPT

Chat GPT - бот на Русском + картинки

👥 80 341 · +8 007/7д

@id343502039804_biz

Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…

👥 74 264 · -192/7д

@techcommedia

Техком

Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg Работаем с: https://maxln.ru/Sp…

👥 73 694 · -3 081/7д

🏷 Темы и теги

#AI #ML #LLM #OVQA #Zyphra #машинное обучение #data science #искусственный интеллект #алгоритмы ml #практические кейсы ai #нейросети #ИИ и нейросети

📋 О канале MachineLearning

Погружение в мир машинного обучения, LLM и Data Science. Разбираем алгоритмы, нейросети и практические кейсы. Для тех, кто хочет быть в курсе трендов AI и применять их в работе. Подписывайтесь, чтобы не пропустить новости и лайфхаки от сообщества.

🔍 Архив всех постов Макс

Поиск по 12,868,856 постам из 202,020 каналов

Подключить за 490 ₽/мес →

Удалить пост или канал с МАКСОТЕКИ

Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.

Удалить этот пост Удалить канал