Войти | Регистрация | Вход необходим для полного использования сайта
 +4.3 °C
Есть секреты, которые не позволяют себя рассказывать.
(Эдгар По)
 

Чувашский язык: Паралельный корпус чувашского языка перешагнул через рубеж в 200 тысяч пар

Знакомства Познакомлюсь с мужчиной любящим танцевать и петь на родном чувашском языке
Знакомства Хочу познакомиться с женщиной до 55 лет чувашской или русской национальности дл...
Куплю куплю невостребованную кабельно-проводниковую продукцию. возможен выезд и осмотр...
Ку хыпарпа эсир ҫавӑн пекех Чӑвашла паллашма пултаратӑр
Аçтахар Плотников 06.12.2019 00:27 | 1835 просмотров
Чувашский язык

Как сообщает лаборатория чувашского языка, основанная энтузиастами, в параллельном корпусе чувашского языка количество пар чувашско-русских предложений перевалило за 200 тысяч.

Параллельный корпус чувашского языка на данный момент создается для сбора параллельных текстов, на основе которых впоследствии энтузиасты хотят добавить чувашско-русский и русско-чувашский автоматический перевод в системы Яндекса, Гугла и т.д. В то же время идет и разработка своего собственного переводчика на основе нейронного алгоритма (ресурс будет готов в ближайшее время). На данный момент разработчикам удалось достичь качества в 24 BLEU (для сравнения: русско-английский перевод Яндекса и Гугла имеет качество 30–35 BLEU).

Как сообщают энтузиасты, для более качественного перевода необходимо собрать порядка миллиона пар. Работа по набору пар началась в апреле текущего года и за это время удалось довести их количество до 200 тысяч. В следующем году планируется довести количество до полумиллиона пар.

Работа в данном направлении ведется группой, куда входят энтузиасты: Николай Плотников (руководитель, разработка корпуса), Александр Антонов (специалист по машинному переводу), Светлана Трофимова, Эрбина Портнова, Алина Иванова (обработка текстов) и другие.

#чувашский язык, #достижения, #наука, #сайты

Еще больше интересных и актуальных новостей вы найдете в чувашской версии сайта!

Источник новости: http://corpus.chv.su/
 

См. также

Добавить новый комментарий

Ваше имя:
Ваш комментарий:
B T U T Заг1 Заг2 Заг3 # X2 X2 Ӳкерчĕк http://
WWW:
ĂăĔĕÇçŸÿ
Всего введено: 0 симв. Лимит: 1200 симв.
Если у вас все еще нет раскладки для печати текста на чувашском языке, ее можете взять ЗДЕСЬ.
 

Разрешенные Wiki тэги:

__...__ - выделение слова ссылой.

__aaa|...__ - выделение некого слова ссылкой на другое слово.

__http://ya.ru|...__ - выделение слова ссылкой на внешнюю ссылку.

**...** - выделение жирным.

~~...~~ - выделение курсивом.

___...___ - выделение подчеркиванием.

Новости недели

Orphus

Другие языки

Баннеры

Счетчики