MachineLearning
MachineLearning
1 223 подписчиков · @ai_machinelearning_big_data
К каналу →
⚡️ Лучшие GitHub-репозитории для Claude Code, которые могут увеличить эффективность твоего следующего проекта 1. Superpowers   https://github.com/obra/superpowers  2. Awesome Cla…
Читать далее →
5 272
🚀 Anthropic показали новый режим:   AI может выполнять задачи на компьютере и по расписанию без твоего участия Главное: - Claude управляет компьютером    - кликает, вводит текст, о…
Читать далее →
5 270

Google представила TurboQuant для квантования KV-кэша

📌 Google разработала алгоритм квантования KV-кэша без потери точности.
Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.
TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.
KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.
Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.
🟡TurboQuant - двухэтапный пайплайн.
Сначала PolarQuant (https://arxiv.org/pdf/2502.02617):
случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.
На втором этапе подключается QJL (https://dl.acm.org/doi/10.1609/aaai.v39i24.34773),
метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.
Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".
Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.
При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.
Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.
Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.
🟡Статья (https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/)
🟡Arxiv (https://arxiv.org/pdf/2504.19874)
Все что выпустили Antropic за последнее время на одной картинке. 73 релиза за 52 дня.
Читать далее →
5 255
ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%. Лучшие результаты на старте такие: - Gemini 3.1 Pro Preview…
Читать далее →
5 335
Другие главы канала «MachineLearning»
Выберите главу, чтобы продолжить чтение
Все посты →
Глава от 30.05.2026
✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…
👁 172 просмотров
Глава от 29.05.2026
ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…
👁 293 просмотров
Глава от 28.05.2026
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …
👁 448 просмотров
Глава от 28.05.2026
✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…
👁 498 просмотров
Глава от 27.05.2026
⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…
👁 637 просмотров
Глава от 26.05.2026
⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля.  Э…
👁 689 просмотров
Глава от 23.05.2026
Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …
👁 842 просмотров
Глава от 23.05.2026
📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …
👁 815 просмотров
Глава от 20.05.2026
GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…
👁 1 032 просмотров

Популярные посты канала «MachineLearning»

⚡️ Вышла новая модель **Minimax M2.7** и релиз получился очень мощным. Что интересного: • 🧠 **Self-evolving модель** M2.7 — одна из первых…
👁 5 364 просмотров
ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%. Лучшие результаты н…
👁 5 335 просмотров
📌 Anthropic опубликовала результаты масштабного опроса пользователей Claude. В декабре 2025 года Anthropic провела масштабное качественное и…
👁 5 319 просмотров
Топ тулза для экономии до 80% на ИИ. ClawRouter - это умный, опенсорсный маршрутизатор между моделями. ClawRouter сам выбирает, какой мод…
👁 5 308 просмотров
📌 Большой мастер-класс по Claude Code!  Перед вами репозиторий с полноценным визуальным и практическим гайдом по одному из самых мощных инст…
👁 5 277 просмотров
⚡️ Лучшие GitHub-репозитории для Claude Code, которые могут увеличить эффективность твоего следующего проекта 1. Superpowers   https://githu…
👁 5 272 просмотров
🚀 Anthropic показали новый режим:   AI может выполнять задачи на компьютере и по расписанию без твоего участия Главное: - Claude управляет к…
👁 5 270 просмотров
Все что выпустили Antropic за последнее время на одной картинке. 73 релиза за 52 дня.
👁 5 255 просмотров
🌟 NVIDIA Nemotron-Cascade 2: MoE на 30B параметров и золото на математических олимпиадах. Nemotron-Cascade 2 (https://huggingface.co/nvidia/…
👁 5 243 просмотров
🤖 Palantir AI + Claude использовались для обнаружения, приоритизации и ударов по более чем 1000 целям в первые 24 часа операции против Ирана…
👁 5 240 просмотров
Когда я прошу Клода провести проверку кода
👁 5 233 просмотров
✔️ Утечка в Anthropic раскрыла детали новой модели Claude. Из-за ошибки в CMS в открытый доступ попали около 3000 внутренних документов Anth…
👁 5 229 просмотров
✔️ OpenAI объединит ChatGPT, Codex и браузер Atlas в суперприложение. Компания меняет стратегию, отказываясь от выпуска разрозненных продукт…
👁 5 205 просмотров
⚡️ Claude Code на максималках: 32 агента, скорость в 5 раз выше, ноль новых инструментов Нашли интересный open source проект oh-my-claudecod…
👁 5 172 просмотров
Это войдёт в историю: как основатель GitLab использовал ИИ в борьбе с раком У Сида Сийбранди, основателя GitLab, диагностировали редкую форм…
👁 5 169 просмотров
🚨 Неожиданный результат исследования Anthropic Компания проанализировала 1,5 млн реальных диалогов с Claude - и обнаружила тревожную тенденц…
👁 5 163 просмотров
⚡️ Нашёл интересный open-source проект: Crucix Это self-hosted intelligence terminal, который автоматически следит за событиями в мире и при…
👁 5 109 просмотров
К такому вы не готовы: теперь можно превратить GitHub в удобный магазин приложений. 😱 Новый опенсорс проект GitHub Store, который позволяет…
👁 5 109 просмотров
Началась новая эпоха - гражданской науки, когда обычные люди могут проводить сложные научные исследования с помощью AI. Инженер без медицинс…
👁 5 072 просмотров
Это полезно: известный исследователь Себастьян Рашка собрал коллекцию современных архитектур LLM в одном месте. Внутри диаграммы и карточки…
👁 5 058 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты
Вся тема →
@colonelcassad
Colonelcassad
Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…
👥 125 727 · +1 498/7д
@techcommedia
Техком
Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg
👥 109 287 · -7 123/7д
@neuronows
CHAT GPT
Chat GPT БОТ — твой бесплатный проводник в мир нейросетей на русском. Здесь ты найдешь мощные AI-инструменты для текста, изображений и анализа данных. Без регистрации и с…
👥 102 888 · +12 843/7д
@Neurojumor
НЕЙРОЮМОР
Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…
👥 92 044 · +3 381/7д
@id343502039804_biz
ChatGPT | Gemini | DeepSeek | Veo | ЧатГПТ | Чат GPT
Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…
👥 76 568 · +1 732/7д
@ru_cipic
НЕЙРОЮМОР | ЮМОР | НЕЙРОСЕТЬ
Первый НейроЮморной В МАХ Друзья, данный канал создан исключительно в юмористических целях! Весь контент сгенерирован нейросетями, все что Вы видите - это фантазия ней…
👥 61 285 · -1 236/7д
🏷 Темы и теги
#машинное обучение #machine learning #искусственный интеллект #дата сайнс #llm #ИИ и нейросети
📋 О канале MachineLearning
Погружение в мир машинного обучения, LLM и Data Science. Актуальные статьи, разборы моделей, новости индустрии и практические кейсы для специалистов и энтузиастов. Подписывайся, чтобы быть в курсе трендов AI.
🔍 Архив всех постов Макс
Поиск по 7,244,611 постам из 199,552 каналов
Попробовать за 1 ₽ →
Удалить пост или канал с МАКСОТЕКИ
Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.
📊 Аналитика канала «MachineLearning» ➡️ Перейти в канал Макс
Заявка в МАКСОТЕКА
Добавьте свой канал в каталог
Зарегистрируйтесь в личном кабинете и добавьте канал за пару кликов.
Перейти в личный кабинет →

Бесплатная регистрация, быстрая модерация.