Цены на оперативную память пошли вниз!
Исследователи Google представили алгоритм TurboQuant, который сжимает данные в оперативной памяти нейросетей, сокращая её потребление не менее чем в шесть раз без потери производительности.
Технология использует метод векторной квантизации для оптимизации рабочей памяти, что позволяет системам ИИ обрабатывать больше данных с меньшими затратами ресурсов. Разработка пока находится на лабораторной стадии, её представят на конференции ICLR 2026.
Эксперты отмечают, что нововведение не решает проблему ресурсоёмкости обучения моделей, но способно снизить стоимость эксплуатации ИИ.