MachineLearning
MachineLearning
1 223 подписчиков · @ai_machinelearning_big_data
К каналу →
🌟 Qwen3-Coder-Next: агентная MoE-модель в линейке Qwen3-Coder. Qwen3-Coder-Next (https://qwen.ai/blog?id=qwen3-coder-next) — открытая MoE-модель на 80 млрд. общих и 3 млрд. активн…
Читать далее →
2 978
✔️ NVIDIA представила семейство мультимодальных моделей для визуального поиска. Nemotron ColEmbed V2 - обновленная линейка эмбеддинг-моделей (3B, 4B и 8B) для сложных RAG-системы. …
Читать далее →
3 023

📌 OVQA: прощай, KV-cache offloading.

📌 OVQA: прощай, KV-cache offloading.
В Zyphra придумали (https://www.zyphra.com/post/ovqa)
как усидеть на двух стульях сразу, когда хочется резиновый контекст, но под рукой нет тонны памяти.
То. что они предложили, называется Online Vector-Quantized Attention - это модификация (https://arxiv.org/pdf/2602.03922)
векторного квантования, которая учит словарь думать на лету.
В классическом VQ ключи заменяются ближайшими центроидами из статичного словаря. Это бустит вычисления, но создает проблему: словарь обучен на одних данных, а во время генерации модель видит совсем другое распределение ключей. Ошибка квантования растет, внимание теряет точность и как итог: VQ начинает плавать.
Так вот, модификация в том, чтобы отказаться от статического словаря в пользу адаптивного к текущей последовательности: каждый новый токен обновляет только один центроид - тот, к которому ближе всего.
Это разреженное обновление работает как защита от катастрофического забывания: старая информация не вымывается новой волной токенов, а аккуратно перезаписывается по мере необходимости.
Плюс есть хард-лимит на размер состояния, после достижения которого объем памяти перестает расти, а вычисления становятся строго линейными.
🟡Результаты тестовых экспериментов
🟢Модель, обученная на 4К токенах, уверенно справлялась с контекстом до 64К без деградации качества;
🟢На внутриконтекстном поиске OVQ почти не отставала от полноценного самовнимания, потребляя при этом в 4 раза меньше памяти;
🟢На In-Context Learning VQ провалился, а OVQ вышла на уровень классического внимания, используя всего ~4К центроидов;
🟢Сравнения с линейными альтернативами (Mamba2 и дельта-сети) тоже в пользу OVQ: она стабильнее держит долгий контекст без просадок точности;
🟠В задачах Positional ICR OVQA работает чуть хуже, чем классическое внимание но все равно достойно.
Очень хочется надеяться, что OVQ - это предтеча настоящего непрерывного обучения, где в светлом будущем вместо бесконечно пухнущего KV-кэша появится компактная, но живая память, способная удерживать важные детали без потерь.
🟡Статья (https://www.zyphra.com/post/ovqa)
🟡Arxiv (https://arxiv.org/pdf/2602.03922)
#AI #ML #LLM #OVQA #Zyphra
⚡️ DeepWiki - GitHub-репозитории, которые можно “спросить” как ChatGPT DeepWiki - это инструмент, который превращает любой GitHub-проект в интерактивную документацию с AI. Просто з…
Читать далее →
3 241
✔️ OpenAI обвинила DeepSeek в краже знаний через дистилляцию. В меморандуме для Комитета Палаты представителей по Китаю OpenAI пожаловалась, что DeepSeek обучала свои модели на вых…
Читать далее →
3 318
Другие главы канала «MachineLearning»
Выберите главу, чтобы продолжить чтение
Все посты →
Глава от 30.05.2026
✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…
👁 172 просмотров
Глава от 29.05.2026
ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…
👁 293 просмотров
Глава от 28.05.2026
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …
👁 448 просмотров
Глава от 28.05.2026
✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…
👁 498 просмотров
Глава от 27.05.2026
⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…
👁 637 просмотров
Глава от 26.05.2026
⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля.  Э…
👁 689 просмотров
Глава от 23.05.2026
Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …
👁 842 просмотров
Глава от 23.05.2026
📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …
👁 815 просмотров
Глава от 20.05.2026
GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…
👁 1 032 просмотров

Популярные посты канала «MachineLearning»

⚡️ Вышла новая модель **Minimax M2.7** и релиз получился очень мощным. Что интересного: • 🧠 **Self-evolving модель** M2.7 — одна из первых…
👁 5 364 просмотров
ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%. Лучшие результаты н…
👁 5 335 просмотров
📌 Anthropic опубликовала результаты масштабного опроса пользователей Claude. В декабре 2025 года Anthropic провела масштабное качественное и…
👁 5 319 просмотров
📌 Google разработала алгоритм квантования KV-кэша без потери точности. Подразделение Research анонсировало TurboQuant, алгоритм векторного к…
👁 5 310 просмотров
Топ тулза для экономии до 80% на ИИ. ClawRouter - это умный, опенсорсный маршрутизатор между моделями. ClawRouter сам выбирает, какой мод…
👁 5 308 просмотров
📌 Большой мастер-класс по Claude Code!  Перед вами репозиторий с полноценным визуальным и практическим гайдом по одному из самых мощных инст…
👁 5 277 просмотров
⚡️ Лучшие GitHub-репозитории для Claude Code, которые могут увеличить эффективность твоего следующего проекта 1. Superpowers   https://githu…
👁 5 272 просмотров
🚀 Anthropic показали новый режим:   AI может выполнять задачи на компьютере и по расписанию без твоего участия Главное: - Claude управляет к…
👁 5 270 просмотров
Все что выпустили Antropic за последнее время на одной картинке. 73 релиза за 52 дня.
👁 5 255 просмотров
🌟 NVIDIA Nemotron-Cascade 2: MoE на 30B параметров и золото на математических олимпиадах. Nemotron-Cascade 2 (https://huggingface.co/nvidia/…
👁 5 243 просмотров
🤖 Palantir AI + Claude использовались для обнаружения, приоритизации и ударов по более чем 1000 целям в первые 24 часа операции против Ирана…
👁 5 240 просмотров
Когда я прошу Клода провести проверку кода
👁 5 233 просмотров
✔️ Утечка в Anthropic раскрыла детали новой модели Claude. Из-за ошибки в CMS в открытый доступ попали около 3000 внутренних документов Anth…
👁 5 229 просмотров
✔️ OpenAI объединит ChatGPT, Codex и браузер Atlas в суперприложение. Компания меняет стратегию, отказываясь от выпуска разрозненных продукт…
👁 5 205 просмотров
⚡️ Claude Code на максималках: 32 агента, скорость в 5 раз выше, ноль новых инструментов Нашли интересный open source проект oh-my-claudecod…
👁 5 172 просмотров
Это войдёт в историю: как основатель GitLab использовал ИИ в борьбе с раком У Сида Сийбранди, основателя GitLab, диагностировали редкую форм…
👁 5 169 просмотров
🚨 Неожиданный результат исследования Anthropic Компания проанализировала 1,5 млн реальных диалогов с Claude - и обнаружила тревожную тенденц…
👁 5 163 просмотров
⚡️ Нашёл интересный open-source проект: Crucix Это self-hosted intelligence terminal, который автоматически следит за событиями в мире и при…
👁 5 109 просмотров
К такому вы не готовы: теперь можно превратить GitHub в удобный магазин приложений. 😱 Новый опенсорс проект GitHub Store, который позволяет…
👁 5 109 просмотров
Началась новая эпоха - гражданской науки, когда обычные люди могут проводить сложные научные исследования с помощью AI. Инженер без медицинс…
👁 5 072 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты
Вся тема →
@colonelcassad
Colonelcassad
Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…
👥 125 727 · +1 498/7д
@techcommedia
Техком
Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg
👥 109 287 · -7 123/7д
@neuronows
CHAT GPT
Chat GPT БОТ — твой бесплатный проводник в мир нейросетей на русском. Здесь ты найдешь мощные AI-инструменты для текста, изображений и анализа данных. Без регистрации и с…
👥 102 888 · +12 843/7д
@Neurojumor
НЕЙРОЮМОР
Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…
👥 93 021 · +3 381/7д
@id343502039804_biz
ChatGPT | Gemini | DeepSeek | Veo | ЧатГПТ | Чат GPT
Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…
👥 76 568 · +1 732/7д
@ru_cipic
НЕЙРОЮМОР | ЮМОР | НЕЙРОСЕТЬ
Первый НейроЮморной В МАХ Друзья, данный канал создан исключительно в юмористических целях! Весь контент сгенерирован нейросетями, все что Вы видите - это фантазия ней…
👥 61 285 · -1 236/7д
🏷 Темы и теги
#AI #ML #LLM #OVQA #Zyphra #машинное обучение #machine learning #искусственный интеллект #дата сайнс #llm #ИИ и нейросети
📋 О канале MachineLearning
Погружение в мир машинного обучения, LLM и Data Science. Актуальные статьи, разборы моделей, новости индустрии и практические кейсы для специалистов и энтузиастов. Подписывайся, чтобы быть в курсе трендов AI.
🔍 Архив всех постов Макс
Поиск по 7,246,508 постам из 199,554 каналов
Попробовать за 1 ₽ →
Удалить пост или канал с МАКСОТЕКИ
Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.
📊 Аналитика канала «MachineLearning» ➡️ Перейти в канал Макс
Заявка в МАКСОТЕКА
Добавьте свой канал в каталог
Зарегистрируйтесь в личном кабинете и добавьте канал за пару кликов.
Перейти в личный кабинет →

Бесплатная регистрация, быстрая модерация.