Национальная библиотека республики совместно с Арктическим государственным институтом культуры и искусств разрабатывает новый искусственный интеллект, призванный сохранить якутский язык, передает информационный портал «Якутия 24».
С 13 февраля разработчики начали сбор голосов, они уже получили 6500 записей. Сам ИИ призван не только сохранить язык, но и обучать ему. Также он может использоваться при создании более живой модели голоса для озвучивания текста.
При этом, для корректной работы искусственного интеллекта, разработчикам необходимо собрать голосовые записи, на основе которых будущий искусственный интеллект будет учиться говорить на якутском.
«Сфера применения на самом деле очень обширна, однако технология не нова. Уже есть системы в библиотеках для слабовидящих, которые читают текст, но он машинный, не живой. А вот ИИ может сделать это лучше, но необходим большой объем данных, то есть записей» — сообщили в библиотеке.
Для сбора голосов была организована акция «Ийэ тылгын харыстаа» («Сохрани родной язык»), в рамках которой носитель языка может поделиться своим голосом для разработки проекта. Это может сделать любой желающий, обратившись к волонтерам в здании АГИКИ. Также поделиться своим голосом можно через сайт Национальной библиотеки Якутии, на специальной платформе «voicenlrs».
Кроме того, разработчикам можно помочь с проверкой записей. Пока из полученных 6500 записей обработано около 500. На вышеуказанной платформе, помимо записи, есть функция проверки аудио на соответствие тексту. Это поможет быстрее обработать аудиоматериалы. Проверенные пользователем работы будут рассмотрены в приоритете.
С помощью голосовых записей ИИ будет помогать учить язык, переводить, понимать, озвучивать тексты, видео и другой контент, а также позволит генерировать собственный контент на якутском языке.
«Разработчики различного программного обеспечения, например, смогут сделать так, чтобы их программа говорила на якутском языке. Конечно, это опять озвучивание текста, но на ходу и почти как в аудиокнигах» — рассказывают разработчики.
Данная разработка реализуется в рамках федеральной программы «Приоритет-2030. Дальний Восток».