🚀 PageIndex - умный индекс документов для reasoning-RAG (без векторов)
PageIndex от VectifyAI - open-source система, которая помогает работать с длинными документами (PDF, тексты, …
Читать далее →
🌟 Qwen3-Coder-Next: агентная MoE-модель в линейке Qwen3-Coder.
Qwen3-Coder-Next (https://qwen.ai/blog?id=qwen3-coder-next)
— открытая MoE-модель на 80 млрд. общих и 3 млрд. активн…
Читать далее →
✔️ NVIDIA представила семейство мультимодальных моделей для визуального поиска.
✔️ NVIDIA представила семейство мультимодальных моделей для визуального поиска.
Nemotron ColEmbed V2 - обновленная линейка эмбеддинг-моделей (3B, 4B и 8B) для сложных RAG-системы. Под капотом - механизм позднего взаимодействия по типу ColBERT, который дает прочную семантическую связь между текстовыми запросами и визуальным контентом (таблицами, диаграммами и инфографикой).
Серия V2 ставит в приоритет максимальную точность. Старшая модель на 8B уже заняла 1 место в бенчмарке ViDoRe V3, обойдя конкурентов в поиске по визуально сложным документам.. Новинки построены на Llama 3.2 и Qwen3-VL, используют двунаправленное внимание и доступны на Hugging Face. https://huggingface.co/collections/nvidia/nemotron-colembed-v2
📌 OVQA: прощай, KV-cache offloading.
В Zyphra придумали (https://www.zyphra.com/post/ovqa)
как усидеть на двух стульях сразу, когда хочется резиновый контекст, но под рукой нет то…
Читать далее →
⚡️ DeepWiki - GitHub-репозитории, которые можно “спросить” как ChatGPT
DeepWiki - это инструмент, который превращает любой GitHub-проект в интерактивную документацию с AI.
Просто з…
Читать далее →