DeepSeek V4: Pro и Flash — характеристики и цены
Сегодня китайская лаборатория, которая год назад обрушила акции NVIDIA, представила сразу две модели: DeepSeek-V4-Pro (1.6T параметров, 49B активных) и DeepSeek-V4-Flash (284B параметров, 13B активных).
Обе — Mixture-of-Experts, обе с контекстным окном в 1 миллион токенов, обе под лицензией Apache 2.0 с открытыми весами на Hugging Face.
Главная инновация — гибридная архитектура внимания, которую они назвали Compressed Sparse Attention + Heavily Compressed Attention.
На практике это означает, что при контексте в 1M токенов V4-Pro требует лишь 27% FLOPs и 10% KV-кэша по сравнению с предыдущей V3.2.
По бенчмаркам V4-Pro бьёт все существующие open-source модели и вплотную подбирается к закрытым фронтирам.
▫️На Codeforces модель набирает 3206 — это выше GPT-5.4.
▫️На SWE-Verified (реальные баги на GitHub) — 80.6, практически наравне с Claude Opus 4.6.
▫️На математических бенчмарках вроде IMOAnswerBench — 89.8, уступая только GPT-5.4.
▫️При этом в задачах на общие знания модель пока отстаёт от Gemini-3.1-Pro, и DeepSeek честно это признаёт.
☝🏻☝🏻☝🏻Цены в разы ниже западных:
🔻V4-Flash: $0.14 за миллион входных токенов, $0.28 за выходные.
🔻V4-Pro: $1.74 / $3.48.
Для сравнения Claude Opus 4.6 стоит $5 за 1 млн входных токенов и $25 за 1 млн выходных токенов по стандартному API-тарифу.
☝🏻☝🏻Отдельная история — чипы Huawei.
DeepSeek фактически создал первую фронтирную модель, работающую на полностью китайской кремниевой инфраструктуре.
Модель поддерживает три режима рассуждений: Non-think, Think High и Think Max.
Уже интегрирована с OpenClaw и OpenCode для агентного кодинга.