В переводчике Google нашли основанный на латыни тайный шифр Статьи редакции

Сотрудники компании FireEye обнаружили в переводчике Google тайный шифр, основанный на латинской фразе «Lorem Ipsum», использующейся в интернете в качестве бессмысленного текста для заполнения пустого места на макетах веб-страниц. Об этом в своём блоге 18 августа сообщил специалист по кибербезопасности Брайан Кребс.

Шифр удалось обнаружить исследователю FireEye Майклу Шукри (Michael Shoukry) и его помощнице, не называющей своего реального имени и пользующейся в сети никнеймом Kraeh3n.

Секретный «язык» оказался встроен в сервис Google Translate. При вводе в поле перевода латинского словосочетания «lorem ipsum», написанного с двух строчных букв, сервис сообщал, что по-английски оно означает «Китай». Обратный порядок слов — «ipsum lorem» — переводился как «интернет». Те же слова, но написанные с заглавных букв — «Lorem Ipsum» — выдавали аббревиатуру Организации Североатлантического альянса, НАТО (NATO).

Ввод в Google Translate ещё нескольких версий написания фразы позволял обнаружить и другие засекреченные слова. Большая их часть была так или иначе связана со всемирной сетью и Китаем.

Дублируя фразу один или два раза в различном написании и с разным порядком слов, Шукри и Kraeh3n удалось составить таблицу таких странных переводов, складывавшихся уже не в отдельные слова, а в целые предложения. В большинстве своём предложения не имели смысла и были не закончены — «Пожалуйста, проверьте, что автомобиль», «Запуск в Китае и китайский», «Запуск Китая и интернет», «Это повредило маркетинговой технологии», «О самой игре», «Китайский интернет-феномен», «Интернет-технологии в Китае», «Спасибо за интернет» и так далее.

Дальнейшие исследования показали, что в качестве шифра использовались не только первые два слова из текста шаблонной фразы, а вся фраза целиком, в полной версии выглядящая вот так.

Перевод разных отрывков текста выдавал порой самые удивительные результаты — от фраз о том, что «Россия возможно будет страдать», до предложений вроде «Китай — это боль» и «Возможно, это и есть интернет».

Мы подумали, что, возможно, Google просто ошибается в переводе. Но то, что слова получают такие значения — Китай, НАТО, свободный интернет — заставило задуматься. Просто баг? Или шифр внедрён в переводчик намеренно? Неужели с его помощью кто-то может общаться? Что это на самом деле? Майкл Шукри, сотрудник компании FireEye

Как пишет Брайн Кребс, узнавший об открытии странного шифра в Google Translate от одного из своих знакомых, исследователям удалось протестировать «баг» в переводчике всего несколько недель. Начиная с 16 августа слова «Lorem Ipsum», в каком бы виде они ни были написаны, стали выдавать только один вариант перевода — «Lorem Ipsum».

Представитель Google рассказал Кребсу, что интернет-компания обнаружила неисправность в алгоритме переводчика и устранила её. Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев.

Существующий сегодня алгоритм перевода Google Translate был внедрён американской интернет-компанией в 2007 году. Система основывается на постоянном самообучении, улучшая собственные способности за счёт анализа текстов, переведённых с одного языка на другой живыми людьми. Часть языковых пар переводится Google напрямую, другие — через промежуточный перевод на английский язык.

Фраза-шаблон, начинающаяся со слова «Lorem Ipsum», представляет собой искажённый отрывок из трактата древнеримского философа и государственного деятеля Цицерона «О пределах добра и зла». Трактат был написан в 45 году до нашей эры.

Версия фразы, использующаяся дизайнерами при заполнении макетов страниц, не имеет перевода. Оригинальный же кусок, из которого сделан шаблон, выглядит так: «Neque porro quisquam est, qui dolorem ipsum, quia dolor sit, amet, consectetur, adipisci velit» (перевод: «нет никого, кто возлюбил бы, предпочел и возжаждал бы само страдание только за то, что это страдание»).

0
72 комментария
Написать комментарий...
Осенний цветок

Не, ну тут все понятно. Заговор раскрыт - теперь можно и спать идти

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Половый Никита

"Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев."

Ответить
Развернуть ветку
Лекарственный Кирилл
Ответить
Развернуть ветку
Крайний звук
Ответить
Развернуть ветку
Заключенный парфюмер
Ответить
Развернуть ветку
1 комментарий
Промышленный ГОСТ
Ответить
Развернуть ветку
Связанный танк88

Пам ПАМ ПАААААААМ

Ответить
Развернуть ветку
Несчастный утюг

Комментарий недоступен

Ответить
Развернуть ветку
Смешной лолипоп

Я уже купил билет в Китай

Ответить
Развернуть ветку
Компьютерный франт

мурашки по коже пошли

Ответить
Развернуть ветку
Лекарственный Кирилл

Они и не исправили это, кстати

Ответить
Развернуть ветку
Электрический фонарь

значит, страдания неизбежны

Ответить
Развернуть ветку
Нехороший спрей

Если написать Consectetur именно с большой буквы, то вместо России будет Minneapolis

Ответить
Развернуть ветку
Пограничный яд

Для особых ценителей тайных шифров

Ответить
Развернуть ветку
Молодой цветок

Предвкушаю заголовки пророссийских СМИ "Гугл сказал, что Россия будет страдать", "Переводчик гугла тайно контролируется госдепом США".

Ответить
Развернуть ветку
Стратегический колос

дык, все всё давно поняли про гугл) а какой хороший был ютуб, до того, как они его купили.

Ответить
Развернуть ветку
Сердечный диод
Ответить
Развернуть ветку
Областной Макс

А тем временем где-то в китайском, например, МИДе или там ЦК Компартии Китая перестала обновляться одна страничка, на которой уже несколько лет висела слегка измененная заглушка "Ipsum ipsum lorem sit...".

Ответить
Развернуть ветку
Газетный Гоша
Ответить
Развернуть ветку
Европейский жар

Один из принципов обучения перевода: скан множества документов из открытых источников, которые заведомо верно переведены на несколько языков. Это всякие там директивы ООН и т.д. Судя по всему эти документы закончились и в список попали источники с некачественным переводом, в которых в каких-то фрагментах оставляли лорем ипсум. В результате алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи.

Ответить
Развернуть ветку
Студенческий кавалер

Разве алгоритм учитывает с какой буквы пишется слово, с прописной или строчной?

Ответить
Развернуть ветку
3 комментария
Академический Абдужаббор

Самое логичное объяснение.

Ответить
Развернуть ветку
Нищий бинокль

"алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи"
Надо такие алгоритмы отдельно распространнять - годная крипота

Ответить
Развернуть ветку
Технический Денис

Прикрепляйте, пожалуйста, под такими статьями музыку из «Секретных Материалов». А то явно чего-то не хватает.

Ответить
Развернуть ветку
Федеральный Филипп

раньше помнится можно было добавлять свои варианты перевода, и на этом основывалось огромное количество шуток.
например

Ответить
Развернуть ветку
Сердечный диод

Ятаки не понял дизайн этой text area

Ответить
Развернуть ветку
Далекий франт
Ответить
Развернуть ветку
Сердечный диод
Ответить
Развернуть ветку
Академический Абдужаббор

БЕЗНОГNМ!

Ответить
Развернуть ветку
Известный щит
Ответить
Развернуть ветку
Крупный утюг
Ответить
Развернуть ветку
Тонкий чувак

Ехал Ipsum через Ipsum
Видит Ipsum в реке Ipsum
Сунул Ipsum в реку Ipsum
Ipsum Ipsum Ipsum Ipsum

Ответить
Развернуть ветку
Тонкий чувак

А еще можно так:
Lorem Ipsum lorem lpsum
lorem Ipsum Lorem lpsum
lorem ipsum lorem lpsum
Ipsum ipsum Ipsum Ipsum

Ответить
Развернуть ветку
2 комментария
Металлургический парфюмер

Ехал ipsum через ipsum
Видит ipsum в lorem ipsum
ipsum ipsum ipsum ipsum
lorem ipsum lore ipsum!

Ответить
Развернуть ветку
Традиционный рак

Надеюсь Шукри еще жив.

Ответить
Развернуть ветку
Многие Влад

Спасибо за интернет.

Ответить
Развернуть ветку
Личной кофе

Тот неловкий момент, когда не успеваешь допечатать последнюю букву, а Гугл уже выдаёт перевод...

Ответить
Развернуть ветку
Мясной череп

valar morghulis

Ответить
Развернуть ветку
Небольшой браслет

Если в Word'е ввести конструкцию вида =lorem(a,b), где a — количество абзацев, а b — количество предложений в каждом абзаце, и нажать enter, то на странице в заданном формате сгенерируется что бы вы думали? Lorem ipsum! Формула =lorem(3,10) даст результат в 3 абзаца по 10 предложений в каждом, а =lorem(10,3) — соответственно, наоборот.

Ответить
Развернуть ветку
Влажный якорь

Так и развивается...

Ответить
Развернуть ветку
Входной Артем

Проделки ZOG

Ответить
Развернуть ветку
Универсальный кавалер

Google Переводчик - статистический. Собственно, этим всё и объясняется.

Ответить
Развернуть ветку
Верный ключ

Казалось бы, причём здесь ЦРУ? =))

Ответить
Развернуть ветку
Удивленный алмаз

Синим полотнищем — фаза вершины. Я призываю дух из машины.

Ответить
Развернуть ветку
Патриотический паркур

Подозреваю, что на подобных фразах разработчики что-нибудь тестировали, а потом попросту забыли убрать

Ответить
Развернуть ветку
Ближний ящик

Exactly my point.

Ответить
Развернуть ветку
Порядочный будильник

./// которая поможет вам принять мою Правду

1) НЕ ПЫТАЙТЕСБ ЧТОТ0 И3МЕНИТЬ!

2) ДУМАNТ3 ТОЛЬКО О СЕБЕ!

3) РУКИ

4) ДОСМОТ?

людей посмотревших сойдут с ума

БЕЗНОГИМ

Получилось? В этом видео звук соджержит слепок V1 o5 u2 наложение — ШИМ

В нем нету ничего злого, но оно пугает. Но после просмотра вы почувствуете радость, и в дальнейшем всё в вашей жизни будет хорошо!

Ваш друг.

Ответить
Развернуть ветку
Ограниченный Макс

Кто с хабра - тот поймет

Ответить
Развернуть ветку
Ведущий шар

А вот простая фраза "Ла-ла-ла-ла ла-ла-ла-ла",
хотя и кажется бессмысленной, способна рассказать очень многое о текущей геополитической ситуации без всякого перевода.
Удивительно, правда?

Ответить
Развернуть ветку
Достаточный дым

Вспоминается truecrypt и "If I wish to use the NSA"

Ответить
Развернуть ветку
Любопытный Артем

Масоны, они повсюду)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Твердый коктейль

Все нормально, это просто AI гугл переводчика обучается и готовится захватить интернет.

Ответить
Развернуть ветку
Соседний рубин

Это все жидомассоны

Ответить
Развернуть ветку
Шахматный Орзэмэс
Ответить
Развернуть ветку
Смутный вентилятор

До сих пор же хрень выдает

Ответить
Развернуть ветку
Смутный вентилятор

Вот это самое страшное

Ответить
Развернуть ветку
1 комментарий
Самарский историк

Ну там-же машинное обучение. Не разбираюсь в этом, но мне кажется мог кто-то просто пошутить, дав выборку текстов про интернет/Россию/Китай и как их перевод дать Lorem Ipsum. вот и весь заговор.

Ответить
Развернуть ветку
Растительный дебаркадер

Это переводчик был обучаем. Можно было собственные переводы добавлять. Вот кто-то и прикололся

Ответить
Развернуть ветку
Грамотный единорожек88
Ответить
Развернуть ветку
Занятый Паша

теперь все понятно

Ответить
Развернуть ветку
Прошедший паркур
Ответить
Развернуть ветку
Прошедший паркур
Ответить
Развернуть ветку
Твердый коктейль

la-li-lu-le-lo

Ответить
Развернуть ветку
Веселый бинокль

Алгоритм перевода статистический, и основывается он на параллельных текстах, которые они черпают в том числе и из индексируемых страниц и документов в интернете.

Поскольку часто там, где нет подходящего контента на другом языке, разработчики сайтов лепят "Lorem ipsum dolor sit amet...", то не исключено, что оно попадает в паблик, а затем и в поисковый индекс, и оттуда уже в переводы.

Более подробно - http://borches.livejournal.com/1378263.html

Ответить
Развернуть ветку
Поэтический кавалер

:(. Но спасибо, да.

Ответить
Развернуть ветку
Читать все 72 комментария
null