В Карелии готовят базу для включения карельского и вепсского языков в «Яндекс Переводчик»

В Москве состоялось заседание рабочей группы при ФАДН России по созданию корпусов языков народов Российской Федерации для включения в «Яндекс Переводчик». Карелия присоединилась к федеральной инициативе по созданию языковых корпусов для сервиса «Яндекс Переводчик» в 2024 году. В рамках проекта создаются корпуса карельского (на базе ливвиковского наречия) и вепсского языков.
К работе подключены языковые специалисты, преподаватели, сотрудники Института языка, литературы и истории, члены республиканской термино-орфографической комиссии при главе Карелии, члены общественных организаций карелов и вепсов. Координирует деятельность министерство национальной и региональной политики.
О ходе работы на заседании рабочей группы в режиме ВКС рассказала начальник отдела министерства Елена Мигунова:

– В республике собрано и направлено разработчикам более 70 тысяч параллельных предложений на русском и карельском языках при целевом показателе 100 тысяч. Кроме того, выполнено обучение языковой модели искусственного интеллекта, а полученные переводы прошли экспертную оценку. В языковом корпусе вепсского языка собрано порядка 40 тысяч предложений, которые в ближайшее время также будут направлены разработчикам.