Ку хыпарпа эсир ҫавӑн пекех Чӑвашла паллашма пултаратӑр
Чувашский язык
![]() Как сообщает лаборатория чувашского языка, основанная энтузиастами, в параллельном корпусе чувашского языка количество пар чувашско-русских предложений перевалило за 200 тысяч. Параллельный корпус чувашского языка на данный момент создается для сбора параллельных текстов, на основе которых впоследствии энтузиасты хотят добавить чувашско-русский и русско-чувашский автоматический перевод в системы Яндекса, Гугла и т.д. В то же время идет и разработка своего собственного переводчика на основе нейронного алгоритма (ресурс будет готов в ближайшее время). На данный момент разработчикам удалось достичь качества в 24 BLEU (для сравнения: русско-английский перевод Яндекса и Гугла имеет качество 30–35 BLEU). Как сообщают энтузиасты, для более качественного перевода необходимо собрать порядка миллиона пар. Работа по набору пар началась в апреле текущего года и за это время удалось довести их количество до 200 тысяч. В следующем году планируется довести количество до полумиллиона пар. Работа в данном направлении ведется группой, куда входят энтузиасты: Николай Плотников (руководитель, разработка корпуса), Александр Антонов (специалист по машинному переводу), Светлана Трофимова, Эрбина Портнова, Алина Иванова (обработка текстов) и другие. Еще больше интересных и актуальных новостей вы найдете в чувашской версии сайта! Источник новости:
|
См. также |
Добавить новый комментарий |
О сайте | Помощь сайту | Статистика
(c) 2005-2017 Chuvash.Org | Номер свидетельства о регистрации в качестве СМИ: ЭЛ № ФС 77 - 68592, выдано 3 февраля 2017 года Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Содержимое сайта (кроме статей, взятых из других источников) публикуется на условиях CreativeCommons Attribution-ShareAlike 3.0. Вопросы по работе сайта: site(a)chuvash.org |