🔊 Вышел самый лёгкий и доступный генератор речи — MOSS-TTS-Nano работает локально на любом процессоре даже без видеокарты.
• GPU не нужен, всё работает на 4-ядерном CPU — запустится даже на девайсах уровня Raspberry Pi.
• Озвучивает тексты в реальном времени без задержек.
• Говорит на 20 языках — лучше всего на английском, но также знает русский.
• Моделька крошечная — всего 100 миллионов параметров, при этом выдаёт отличное качество и звук в 48 кГц.
• Умеет озвучивать длинные тексты и даже клонировать любой голос.
GitHub — https://github.com/OpenMOSS/MOSS-TTS-Nano, а пробуем демку — https://huggingface.co/spaces/OpenMOSS-Team/MOSS-TTS-Nano