В чипах Apple нашли скрытую мощь.
Разработчик и исследователь безопасности под ником 0x0SojalSec сообщил о необычном прорыве для Apple Silicon. Ему удалось обойти программные ограничения нейронного процессора ANE в чипах M4 и заставить его выполнять не только инференс, но и полноценное обучение нейросетей. До сих пор Apple позиционировала Neural Engine исключительно как ускоритель для уже готовых моделей, заявляя производительность до 38 TOPS.
Для этого энтузиаст отказался от стандартных инструментов Apple вроде Core ML и Metal, создав собственный промежуточный язык MIL, который позволяет напрямую взаимодействовать с ANE. Все вычисления выполняются в оперативной памяти без обращения к накопителю, а для обхода зависаний используется перезапуск процесса через команду exec() с сохранением контрольных точек. В результате удалось задействовать до 15,8 TFLOPS вычислительной мощности для задач обучения, включая обратное распространение ошибки в трансформерных моделях.
Исходный код проекта уже опубликован на GitHub, а первые испытания показали впечатляющие результаты. Некоторые этапы обучения трансформеров на чипах M4 выполняются всего за несколько миллисекунд. Это означает, что обычные MacBook и iPad потенциально могут стать платформой для локального обучения небольших моделей ИИ без необходимости использовать облачные вычисления.
Открытие вызвало большой интерес в сообществе разработчиков искусственного интеллекта. Оно показывает, что Apple, возможно, сознательно ограничивает возможности своего оборудования на программном уровне, а скрытый потенциал Neural Engine заметно выше, чем предполагалось ранее. По мере дальнейших экспериментов энтузиасты могут обнаружить и другие возможности Apple Silicon, которые пока остаются недоступными для обычных пользователей.