Офтоп
RobotReview

«Яндекс» раскрыл обезличенные голосовые запросы пользователей через сервис «Яндекс.Толока»

Журналисты издания RobotReview получили доступ к архиву голосовых навигационных и поисковых запросов пользователей «Яндекса». Имена владельцев отсутствуют, число пользователей неизвестно.

25 мая 2017 года на платформе «Яндекс.Толока» появилось задание по транскрибированию коротких аудиофайлов. Редакция RobotReview сделала вывод, что это записи запросов. Интерфейс сервиса позволил прослушивать записи и загружать их на компьютеры исполнителей задания.

Представители пресс-службы «Яндекса» пояснили изданию Searchengines.ru, что личные данные пользователей защищены, а при распределении заданий на платформе гарантируется полная анонимность запросов.

В этом смысле нет особенной разницы, работает ли толокер с текстовым запросом или голосовым — у него всё равно нет возможности идентифицировать пользователя, который этот запрос задал.

Кажется, как будто голосовые запросы содержат больше информации, и как будто бы по ним можно как-то опознать пользователя, — но по факту из десятков миллионов запросов, случайным образом распределяемым по толокерам, нет никакого способа извлечь информацию о конкретном пользователе.

То, что называют «сливом», не угрожает безопасности, потому что использовать эту информацию против пользователей все равно нет никакой технической возможности.

пресс-служба «Яндекса»

При этом «Яндекс» начал дополнительный аудит процессов на платформе «Яндекс.Толока» на предмет безопасности персональных данных. По правилам, исполнителям заданий запрещается распространять данные, полученные в процессе работы.

0
14 комментариев
Написать комментарий...
Технологический чайник

Комментарий недоступен

Ответить
Развернуть ветку
Густой ящик

Как уже заебали эти доморощенные борцы за приватность, что на хабре, что здесь.

Ответить
Развернуть ветку
Экспериментальный Слава

Эти задания там уже хуй знает сколько времени.

Ответить
Развернуть ветку
Драгоценный Кирилл

Ну собственно, если в обезличенном виде, то почему бы и нет? Толока - это краудсорс для улучшения внутренних алгоритмов и процессов Яндекса

Ответить
Развернуть ветку
Дневной пёс_анон

Комментарий недоступен

Ответить
Развернуть ветку
Немой месяц

Кстати узнавание голоса тоже вполне себе тема

Ответить
Развернуть ветку
Немой месяц

Потому что в запросах могут быть имена и фамилии а не только "как пройти в библиотеку"?

Ответить
Развернуть ветку
Звездный велосипед

Имён-Фамилий не встречали, но интимных запросов полно, да и просто личных. Банках/Страховым/МВД, и всем тем компаниям у которых есть база голосов своих клиентов/подопечных будет полезно ознакомиться с поисковыми интересами.

Ответить
Развернуть ветку
Вторичный кубок

Издержки вряд ли сравнимы с выгодами от улучшения сервиса.

Ответить
Развернуть ветку
Звездный велосипед

У Толоки аудитория до 1.5 млн в месяц (по SimilarWeb). В Яндексе говорят, что в выборке миллионы запросов. Люди повторяются. Зачем сделали интерфейс для загрузки?

Ответить
Развернуть ветку
Интенсивный завод

Интерфейс для загрузки явно сделан не намерено, такая кнопка есть у встроенных mp3-плееров большинства браузеров

Ответить
Развернуть ветку
Звездный велосипед

СЕОшники уже руки потирают, судя по всему - http://pr-cy.ru/news/p/6473

Ответить
Развернуть ветку
Валютный шар

Комментарий недоступен

Ответить
Развернуть ветку
Звездный велосипед

"Мы увидели материал о голосовых запросах в Толоке и хотим поблагодарить вас за то, что вы выявили эту ситуацию — она не совсем правильная с точки зрения правил работы толокеров, однако мы хотим подчеркнуть, что в ней нет ничего страшного для пользователей" - https://robot-review.ru/yandex-response-and-thanks-d1cb969ac3fb

Ответить
Развернуть ветку
Читать все 14 комментариев
null