Кыргызстандын Kani TTS 2 сүйлөм синтез модели Hugging Face платформасында жогорку орунда турат

Виктор Сизов Коом / Эксклюзив
VK X OK WhatsApp Telegram

Кыргызстандык иштеп чыгуучулар командасы эл аралык технологиялык аренада өз жетишкендиктерин кайрадан көрсөттү, деп маалымдалат Жогорку технологиялар паркында (ЖТП) Кыргызстанда.
NineNineSix стартапы Kani TTS2 сүйлөө синтезинин жаңыланган версиясын сунуштады, ал буга чейин Hugging Face платформасында эң көп талап кылынган TTS моделдеринин катарына кирген — дүйнөдөгү эң ири жасалма интеллект коллекцияларынын бири.

Kani TTS 2 — бул команданын мурунку иштеп чыгууларынын эволюциясынын жыйынтыгы. Модель азыр бир өтүүдө 40 секундга чейин сүйлөө өндүрүүгө жөндөмдүү, бул анын мурунку версиясынын көрсөткүчтөрүнөн эки эсе көп.

ЖТПда белгилешкендей, Кыргызстанда түзүлгөн ачык модель үчүн Hugging Face платформасындагы эң мыкты үч TTS моделдеринин катарына кирүү сейрек жана маанилүү жетишкендик болуп саналат.
NineNineSix командасы жөнүндө

NineNineSix — бул жасалма интеллекттин тил технологияларына адистешкен кыргызстандык иштеп чыгуучулар командасы.

Мурда алар Kani TTSтин биринчи версиясын сунуштап, үн колонкасын жана кыргыз тилинде сүйлөгөн биринчи жасалма интеллект AkylAiны иштеп чыгышкан.
Чектелген ресурстары бар тилдер үчүн үн

Көптөгөн ири AI компаниялары англис жана башка кеңири таралган тилдерге көңүл буруп жатканда, ресурстары аз тилдер көп учурда алардын көз карашынан четте калат. NineNineSix башка жолду тандады.

Kani TTS 2 модели англис, испан жана кыргыз тилдерин колдойт, ал эми анын архитектурасы аны дээрлик бардык тилдерге, акценттерге же диалекттерге ылайыкташтырууга мүмкүндүк берет.

Проекттин негизги өзгөчөлүктөрүнүн бири команда алдын ала окутуу үчүн толук кодду жарыялады, бул ар бир өлкөгө же изилдөөчү топко Kani TTS 2 негизинде өз үн моделин түзүүгө мүмкүндүк берет.

nineninesix.aiнын негиздөөчүсү Нурсултан Бакашов белгилегендей: «Kani TTS 2 — бул биринчи версиядан кийинки кадам, биз сүйлөө өндүрүүнүн туруктуулугун жакшырттык жана модель узун фрагменттерди иштеп чыгууга үйрөттүк. Биздин максат — ар кандай тилдерге жана акценттерге, анын ичинде ресурстары аз тилдерге ылайыкташтырууга оңой компакттуу жана ачык моделдерди иштеп чыгуу. Биз дүйнөлүк деңгээлдеги технологиялар Кыргызстанда түзүлүшү мүмкүн экенин көрсөтүүнү каалайбыз, ошондуктан биз модельдин салмактарын гана эмес, алдын ала окутуу үчүн бардык кодду да ачык кылдык, ар бир команда TTSти өз тили үчүн үйрөтө алсын».
Кani TTS 2нин негизги жакшыртуулары төмөнкүлөрдү камтыйт:

* Бир өтүүдө 40 секундга чейин туруктуу сүйлөө өндүрүү жөндөмдүүлүгү;

* Кыска аудиофрагмент боюнча үн клонирлөө технологиясын колдоо — zero-shot voice cloning;

* Толук ачык архитектура жана окутуу коду;

* Hugging Face платформасындагы TTS моделдеринин үчтүгүнө кирүү.

ЖТПнын маалыматы боюнча, модель болжол менен 400 миллион параметрден турат, болжол менен 10 000 сааттык сүйлөө маалыматтары боюнча алдын ала окутулган жана 3 ГБ видео эс тутуму бар GPUда иштей алат, бул аны жергиликтүү жана сервердик колдонууга жеткиликтүү кылат.

«Kani TTS 2 — бул жөн гана дагы бир AI модель эмес. Бул кыргызстандык адистер дүйнөлүк деңгээлдеги технологияларды иштеп чыгууга жана глобалдык ИИ рыногунда атаандашууга жөндөмдүү экендигинин далили. NineNineSix Кыргызстанды гана эмес, алдыңкы AI чечимдерин түзүүчү катары да көрсөтүп жатат», - деп кошумчалашты ЖТПда.
VK X OK WhatsApp Telegram