Специалисты «Яндекса» раскрыли, сколько человек в день переводят на чувашском с помощью их переводчика. Приводя в качестве примера якутский язык, они рассказали как работает машинный перевод, заодно упомянули и количество переводов — в день они насчитывают 40 тысяч сессий.
Сколько предложений или слов было в ходе сессии, не указано. Этот показатель можно сравнить только с другими языками. 40 тыс. раз в день используются пары якутского и русского языков — это примерно одно и то же. Для башкирского языка показатель выше — в день с этой парой языков переводят 70 тыс. раз. Из российских языков, не считая русского, наиболее широко используется татарский язык — около 250 тысяч раз в сутки.
Указывая эти числа, специалисты в «Яндексе» назвали их цифровым пульсом языка — если на какой-то язык ежедневно переводятся тысячи текстов, то этот язык по их мнению является живым.
В статье авторы объяснили, с какими трудностями сталкиваются при подготовке переводчика для малоресурсного языка, представленного в интернете ограниченным количеством текстов.
Таксисты Яндекс.Такси и Uber вышли на первомайскую забастовку. Как сообщает издание «Про Город», они собрались на парковке возде гипермаркета в Новочебоксарске. Всего приняло участие около 50 участников.
Требование таксистов прежнее — повышение тарифов. «Надо цены поднять. Ведь заказы есть, а тарифы все равно низкие. «Яндекс» забирает свой процент, таксопарк забирает. В итоге работаем за копейки», — высказали суть недовольства участники забастовки корреспонденту «Про Города».
Напомним, что и ранее таксисты Яндекс.Такси были недовольны низкими ценами тарифов. При этом следует отметить, что сами тарифы у Яндекс.Такси и Uber не самые низкие — в Чебоксарах и его спутнике работают сервисы, у которых цены еще ниже.
27 февраля 2020 года по случаю добавления чувашского языка в Яндекс.Переводчик состоится презентация «Чувашский язык — новые горизонты». Презентация пройдет в актовом зале (1-ый этаж) Национальной библиотеки Чувашской Республики, начало в 11:00.
На презентацию приглашаются работники науки, образования, культуры, журналисты, общественные деятели, а также все желающие, интересующиеся развитием чувашского языка. Адрес национальной библиотеки: Чебоксары, пр. Ленина, 15.
Для справки: Чувашский язык в Яндекс.Переводчик был добавлен 1 февраля. Это удалось осуществить благодаря совместному труду сотрудников отдела сервиса «Яндекс.Переводчика», инициативной группы «Лаборатории чувашского языка», Национальной библиотеки Чувашской Республики, Министерства цифрового развития, информационной политики и массовых коммуникаций Чувашской Республики, инициативной группы «Хавал» и многих других. Яндекс.Переводчик сейчас позволяет перевести с чувашского примерно на 100 языков, и со ста языков — на чувашский.
В инициативную группу «Лаборатории чувашского языка» входят: Николай Плотников, Александр Антонов, Светлана Трофимова, Алина Иванова, Эрбина Портнова, Оксана Антонова и др.
Яндекс в социальной сети Хабрхабр рассказал о том, как происходила работа по добавлению чувашского языка в Яндекс.Переводчик. Для получения текущего качества перевода они использовали не только предоставленные нашей лабораторией чувашского языка 250 тысяч пар чувашско-русских предложений, но и воспользовались многими подходами для улучшения качества.
Для чувашско-русской пары Яндекс использовал свою систему на основе нейросетей. Но из-за малого количества данных (для хорошего качества требуется порядка 1 миллиона пар) они также прибегли к родственным связям нашего чувашского языка — на примерах азербайджанского, башкирского, татарского, казахского, киргизского, турецкого и узбекского языков. Также был применен метод обратного перевода: огромный объем качественных русских текстов был переведен автоматически на чувашский и таким образом были созданы синтетические пары. При этом с помощью специального метода им удалось избавиться от большей части ошибочно переведенных данных.
Чувашский язык сейчас доступен в веб-версии переводчика, а также на мобильных устройствах.