Чукотский язык готовят к добавлению в сервис "Яндекс.Переводчик"

Чукотский язык готовят к добавлению в сервис "Яндекс.Переводчик"
Фото: chukotka-priroda.ru

Специалисты Чукотского арктического научного центра собрали и обработали 100 тысяч словоформ для интеграции чукотского языка в цифровую среду. В настоящее время ведётся повторная проверка и редактирование материалов. Следующим этапом станет размещение готовых данных на специальном портале «Национальный корпус чукотского языка», после чего языковые пары «чукотский — русский» станут доступны в сервисе «Яндекс.Переводчик», сообщает ИА «Чукотка».

Первый этап оцифровки чукотского языка проходил в прошлом году. В проекте участвовали двое сотрудников центра с привлечёнными экспертами — носителями языка. Среди них Борис Ыттыгыргын, Григорий Ранаврольтын, Вера Грачёва и Антонина Кергитваль. Они проверяли достоверность каждой языковой пары «оригинал — русский перевод». Сбор словоформ также вели активисты, включая Викторию Вылко, Галину Пенелькут, Михаила Голбцева, Александру Пенелькут и ведущую новостей на чукотском языке на «Радио Пурга» Анну Гыргольгыргыну. Работа велась при постоянных консультациях с другими знатоками языка из сёл Чукотки.

«Нам сказали ещё в конце 2024 года, что мы можем встать в очередь в "Яндекс.Переводчик", когда соберём 300 000 словоформ. Но малочисленные народы очень сильно попросили Агентство по делам национальностей снизить этот ценз до 100 000. Это позволило и чукотскому языку подобраться к заветной цели», – рассказал директор Чукотского арктического научного центра Денис Литовка.

Для реализации проекта при поддержке Сбера был приобретён специализированный книжный сканер, позволяющий быстро и качественно оцифровывать старые издания на чукотском языке, включая книги, газеты и брошюры. С помощью этого оборудования переведено в цифровой формат более 30 книг, изданных в период с 1940-х по 1980-е годы XX века. Эти материалы легли в основу языкового корпуса. Также важную финансовую поддержку оказал окружной департамент образования и науки, что позволило достичь цели — собрать первые 100 тысяч словоформ.

«В дальнейшем, когда первые данные будут переданы в сервис "Яндекс. Переводчик", начнется работа по формированию второй сотни тысяч словоформ, и так далее. Будет, конечно, и аудиосервис. То есть, вы говорите по-русски – Яндекс переводит на чукотский и, наоборот, с чукотского на русский, или на другой язык, на английский, сразу же, автоматически. Наши сотрудницы уже начинают работать с аудио», – отметил Денис Литовка.

Параллельно с интеграцией в «Яндекс.Переводчик» продолжится наполнение сайта «Национальный корпус чукотского языка», где будут доступны оцифрованная литература и аудиоматериалы.

К концу 2025 года в «Яндекс.Переводчике» было представлено 18 языков народов России. В течение следующих трёх лет планируется добавить ещё 20. К этой работе подключились 19 регионов, отобравших 34 языка, находящихся под угрозой исчезновения, среди которых вепсский, мансийский, ненецкий, хантыйский и чукотский.

Что еще почитать

В регионах

Новости региона

Все новости

Новости

Самое читаемое

...
Сегодня
...
...
...
...
Ощущается как ...

Автовзгляд

Womanhit

Охотники.ру