Підписуйтеся на наш телеграм канал!

Український технологічний стартап навчає штучний інтелект розуміти кримськотатарську мову
Український стартап Respeecher тренує штучний інтелект, щоби алгоритм зміг розпізнавати кримськотатарську мову. Розробники впевнені, що це сприятиме популяризації мови серед носіїв, а також спонукатиме людей цікавитися мовами етносів, які живуть на території України.
«Процес збору та аналізу інформації потребує багато часу — в залежності від якості аудіо, це може зайняти від кількох тижнів до кількох місяців. Втім, наша команда хоче, щоб цей ресурс був безкоштовними і доступним у відкритих джерелах. Ми віримо, що це допоможе у популяризації використання, як української, так і кримськотатарської мови», — заявив технічний директор та співзасновник Respeecher Дмитро Бєлєвцов.
Носії або ж знавці кримськотатарської мови мають нагоду надіслати Respeecher свій власний аудіозапис, скориставшись Google-формою.
Розробники дали кілька рекомендацій про аудіо, які їм знадобляться: «Для високоякісного аналізу ми потребуємо 1000 годин із записами кримськотатарської мови. Чим більше відмінних акцентів і тональностей модель штучного інтелекту проаналізує, тим точнішим буде результат розпізнавання мови. Це можуть бути, як записи подкастів, так і просто аудіо, записані у тихій кімнаті на диктофон телефону. Дуже важливо, щоб аудіо мало мінімумом звуків на фоні, на кшталт, шум кондиціонера, холодильника чи голоси інших людей. Чим довший хронометраж аудіо, тим краще».
У Respeecher запевнили, що жодні персональні дані не будуть збережені, а голоси людей використають лише для навчання ШІ.
Нагадаємо — торік восени американський актор Джеймс Ерл Джонс, який є основним голосом Дарта Вейдера у культовій кіносазі «Зоряні війни», дозволив Respeecher використати штучний інтелект для озвучування свого персонажа. А ще раніше українські розробники допомогли Lucasfilms озвучити молодшу версію Люка Скайвокера у телесеріалах «Мандалорець» та «Книга Боби Фетта».