Кыргызская Kani TTS 2 вошла в топ-3 TTS AI-моделей мира
Кыргызстанские разработчики закрепились в мировом AI-сообществе: модель синтеза речи Kani TTS 2 вошла в число самых популярных TTS-моделей на платформе Hugging Face — крупнейшем международном каталоге решений в сфере искусственного интеллекта. Для полностью открытой модели из Кыргызстана попадание в топ-3 стало заметным результатом. О достижении рассказали в Парке высоких технологий КР.
Новую версию представила команда стартапа NineNineSix. Kani TTS 2 стала развитием первой модели и продемонстрировала технологический скачок: система генерирует до 40 секунд стабильной речи за один проход — более чем вдвое больше по сравнению с предыдущей версией. Модель поддерживает кыргызский, английский и испанский языки, а архитектура позволяет обучать ее для других языков, акцентов и диалектов.
Разработчики сделали ставку на открытость. Команда опубликовала не только веса модели, но и полный код предварительного обучения. Это дает исследователям и компаниям возможность создавать собственные голосовые решения на базе Kani TTS 2. Поддержка zero-shot voice cloning позволяет клонировать голос по короткому аудиофрагменту.
Модель насчитывает около 400 млн параметров и предобучена на 10 тысячах часов речевых данных. Для работы достаточно GPU с примерно 3 ГБ видеопамяти, что делает решение доступным как для локального использования, так и для серверных проектов.
NineNineSix ранее представила первую версию Kani TTS, а также голосовую колонку и AI-ассистента AkylAi — первого искусственного интеллекта, говорящего на кыргызском языке. Команда специализируется на языковых технологиях и фокусируется на поддержке малоресурсных языков, которые часто остаются вне внимания крупных корпораций.