Личный кабинет

👤Вход / Регистрация → ➕Добавить канал → 💳Подключить за 490 ₽/мес →

Разделы

🏠Главная → 📚Каталог → 📈ТОП 100 → 🆕Новинки → 🏷️Тематики → 🗞️Архив постов → 🔒Закрытые каналы → 📊Статистика → 📢Реклама → 💬Чаты и группы → ℹ️О проекте → ✍️Блог →

Для каналов и групп

🤖Автопостинг в Макс → 🎨Стикеры в Макс → 💬Комментарии в Макс → 📊Опросы в Макс → 📈Откуда подписчики →

Полезное

🔒Конфиденциальность → ✉️Связь →

+ Добавить канал Блог

Быстрый доступ ко всем ключевым страницам каталога MAX с мобильного.

MachineLearning

1 283 подписчиков · @ai_machinelearning_big_data

К каналу →

23.05.2026 07:35

📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по поиску уязвимостей в системно значимом программном обеспечении с помощью ИИ. Согласно обновленному …

Читать далее →

815

23.05.2026 09:15

Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка отчётов занимала дни: данные собирались вручную, цифры перепроверялись, а бизнес слишком долго ждал …

Читать далее →

842

26.05.2026 10:53

⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля.

Вам предодобрено 30 000 рублей под 0% на 30 дней

Ставка 0% вы получаете 30 000 рублей и возвращаете 30 000 через 30 дней без переплат!

Получить деньги на карту

Это тот редкий случай, когда сложную архитектурную идею можно открыть не в виде сухой формулы из статьи, а в виде понятного кода, где видно, как именно модель выбирает, на какие токены смотреть.

Проблема обычного attention хорошо знакома всем, кто работал с длинным контекстом: чем больше последовательность, тем дороже становится вычисление. Каждый токен сравнивается со всеми предыдущими, и цена быстро улетает в квадрат. Sparse attention пытается убрать лишнюю работу без полного отказа от качества.
В реализации показан базовый механизм DSA: лёгкий индексатор оценивает важность прошлых токенов, затем выбираются top-K позиций, остальные маскируются, и attention считается только по релевантным участкам контекста. По сути, модель получает не весь контекст подряд, а отфильтрованное поле внимания.

В примере есть GPT-style модель, слой attention с DSA, optional KV cache, отдельный runnable-скрипт и тесты. Это не production-код уровня DeepSeek V3.2 с fused kernels, MLA и серверными оптимизациями. Зато это хороший учебный разбор, где архитектурная идея превращается в читаемую реализацию.

Sparse attention здесь разобрать пройти руками: от scoring до маскирования и выбора токенов.

https://github.com/rasbt/LLMs-from-scratch/tree/main/ch04/09_dsa

27.05.2026 10:03

⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, второго почти не заметили Об этом факте регулярно вспоминают в сообществе разработчиков, но и сейчас…

Читать далее →

637

28.05.2026 09:16

✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национальную систему видеонаблюдения, перенося вычисления на периферию и внедряя поиск по видео через пром…

Читать далее →

498

Другие главы канала «MachineLearning»

Выберите главу, чтобы продолжить чтение

Все посты →

Глава от 30.05.2026

✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundat…

👁 172 просмотров

Глава от 29.05.2026

ИИ в аналитике — новый стандарт для бизнеса Сегодня компании, внедряющие ИИ в а…

👁 293 просмотров

Глава от 28.05.2026

Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила …

👁 448 просмотров

Глава от 28.05.2026

✔️ Китай перевел городские камеры на ИИ-поиск по видео КНР модернизирует национ…

👁 498 просмотров

Глава от 27.05.2026

⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, в…

👁 637 просмотров

Глава от 23.05.2026

Кажется, аналитика подошла к моменту больших изменений. Ещё недавно подготовка …

👁 842 просмотров

Глава от 23.05.2026

📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по …

👁 815 просмотров

Глава от 20.05.2026

GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозитор…

👁 1 032 просмотров

Глава от 19.05.2026

📌 Сколько стоит построить ИИ-ЦОД мощностью 1 ГВт? Epoch AI опубликовала (https:…

👁 1 052 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты

Вся тема →

@neuronows

CHAT GPT

Chat GPT Бот - Все Нейросети на Русском, Бесплатно чат гпт

👥 137 454 · -1 748/7д

@colonelcassad

Colonelcassad

Авторский канал Бориса Рожина - эксперта Центра военно-политической журналистики. Мой канал в Телеграме: https://t.me/boris_rozhin Мой блог в Живом Журнале: http://colo…

👥 131 804 · +766/7д

@Neurojumor

НЕЙРОЮМОР

Нейроюмор - этот канал создан исключительно в юмористических целях, весь контент сгенерированный нейросетями. Сотрудничество: https://clck.ru/3R576C Нейросеть, нейронка…

👥 105 803 · +2 606/7д

@steamfree48

Chat GPT

Chat GPT - бот на Русском + картинки

👥 77 353 · +8 145/7д

@techcommedia

Техком

Главное про технологии, интернет-культуру, тренды и нейросети. По вопросам сотрудничества: https://clck.ru/3SQMK4 https://t.me/merustg Работаем с: https://maxln.ru/Sp…

👥 74 677 · -3 246/7д

@id343502039804_biz

Чат GPT, Чатгпт, Чат GPT Chat GPT / Чат Джипити ГПТ ии чатбот (AI) бот — AI бот нейросеть. Внутри хайповые нейросети: ChatGPT (GPT чат гпт), Claude, Gemini, DeepSeek ( д…

👥 74 331 · -183/7д

🏷 Темы и теги

#машинное обучение #data science #искусственный интеллект #алгоритмы ml #практические кейсы ai #нейросети #ИИ и нейросети

📋 О канале MachineLearning

Погружение в мир машинного обучения, LLM и Data Science. Разбираем алгоритмы, нейросети и практические кейсы. Для тех, кто хочет быть в курсе трендов AI и применять их в работе. Подписывайтесь, чтобы не пропустить новости и лайфхаки от сообщества.

🔍 Архив всех постов Макс

Поиск по 12,459,516 постам из 201,882 каналов

Подключить за 490 ₽/мес →

Удалить пост или канал с МАКСОТЕКИ

Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.

Удалить этот пост Удалить канал