Переводчик Bing перепутал США с Россией в твите Трампа, но он и до этого вёл себя странно Статьи редакции
Исправлял ошибки, путал страны и не понимал слэнг.
Пользователи Твиттера обратили внимание на твит президента США Дональда Трампа, в котором он говорил о проблемах Северной Кореи и взаимоотношениях с Китаем.
Встроенный переводчик Bing, которым владеет компания Microsoft, автоматически перевёл аббревиатуру «U.S.A.» как «Российская Федерация».
Одна вера, один твиттер, один переводчик
На сайте переводчик предлагает такой же вариант, но по неизвестной причине он автоматически определяет язык как хорватский. Если вручную переставить язык на английский, то он всё равно оставит прежний вариант.
Bing используется в Фейсбуке и в Твиттере, чтобы помогать пользователям с переводом. Из-за того, что некоторые записи написаны с ошибками или в них используется слэнг, переводчик часто не справляется с задачей.
Настолько часто, что на Tumblr по запросу «bing translation» можно найти десятки постов со смешным или абсурдным переводом.
С 2016 года Microsoft внедрила машинное обучение с помощью нейросетей в своих переводчиках. Одна из проблем такого подхода в том, что настойчивые пользователи могут отмечать верный перевод как неправильный, после чего программа «запомнит» этот результат и будет показывать его в будущем.
Несмотря на это, Facebook запустила автоматический перевод записей и комментариев у 800 миллионов пользователей. В нём также задействованы нейросети, которые «знают» более 70 языков.
FUCKING RUSSIAN HACKERS!!!!
ДОЛБАНЫЕ АМЕРИКАНСКИЕ ХАКЕРЫ!!!! (translated by Bing)
Очевидно это отработала ветка алгоритма которую толком не доделали или плохо оттестировали. Вообще статистические переводчики разбивают текст на предложения но тут он напоролся на аббревиатуру написанную через точки и от этого сломался.
Тут скорее всего нейросеть виновата. Она же учится на данных, которые получает от пользователей, поэтому вполне возможно, что русские повлияли на это.
Статистические алгоритмы перевода к нейросетям отношения не имеют и учатся они на параллельных текстах. Но тут явно изза точек в аббревиатуре он был неприменим и включился какойто плохо реализованный костыль.
Видео 2007 года и сейчас Google работает уже на нейросетях и обучается пользователями, насчет Bing конечно не уверен.
Попробуйте в том же бинге попробовать перевести "U.K.", он сработает нормально. Трудности у него только с "U.S.A.", a значит закономерность с точками не срабатывает и "U.S.A." это лишь частный случай.
Спорить конечно же бесполезно, достоверно тут смогут ответить только разработчики бинга. Вдруг в недрах движка русские хакеры вставили такие строчки :)
Откуда инфа? Я видел статью только о планах применения нейросетей для синтеза голоса у них. Ну и всякая муть с машинами.
значит закономерность с точками не срабатываетЯ только сказал что это отдельная ветка, может с U.K. она и отработала хорошо а на U.S.A. сломалась, как она работает и на какой статистике построена я хз
Собсно переводчик до сих пор работает как в 2007 примерно, никакого качественного улучшения не было и не думаю что там меняли алгоритмы сильно
У вас там мат пробрался в статью
ПРОСТО ОН ПРАВДУ ЗНАЕТ, А ВЫ - НЕТ
Щас бы в статье про ошибки перевода ошибаться в переводе. Не «отправлен из Эстонии», а «на эстонском».
Bing говно
@
Bing is cool