Журналисты издания RobotReview получили доступ к архиву голосовых навигационных и поисковых запросов пользователей «Яндекса». Имена владельцев отсутствуют, число пользователей неизвестно.
25 мая 2017 года на платформе «Яндекс.Толока» появилось задание по транскрибированию коротких аудиофайлов. Редакция RobotReview сделала вывод, что это записи запросов. Интерфейс сервиса позволил прослушивать записи и загружать их на компьютеры исполнителей задания.
Представители пресс-службы «Яндекса» пояснили изданию Searchengines.ru, что личные данные пользователей защищены, а при распределении заданий на платформе гарантируется полная анонимность запросов.
В этом смысле нет особенной разницы, работает ли толокер с текстовым запросом или голосовым — у него всё равно нет возможности идентифицировать пользователя, который этот запрос задал.
Кажется, как будто голосовые запросы содержат больше информации, и как будто бы по ним можно как-то опознать пользователя, — но по факту из десятков миллионов запросов, случайным образом распределяемым по толокерам, нет никакого способа извлечь информацию о конкретном пользователе.
То, что называют «сливом», не угрожает безопасности, потому что использовать эту информацию против пользователей все равно нет никакой технической возможности.
При этом «Яндекс» начал дополнительный аудит процессов на платформе «Яндекс.Толока» на предмет безопасности персональных данных. По правилам, исполнителям заданий запрещается распространять данные, полученные в процессе работы.
Комментарий недоступен
Как уже заебали эти доморощенные борцы за приватность, что на хабре, что здесь.
Эти задания там уже хуй знает сколько времени.
Ну собственно, если в обезличенном виде, то почему бы и нет? Толока - это краудсорс для улучшения внутренних алгоритмов и процессов Яндекса
Комментарий недоступен
Кстати узнавание голоса тоже вполне себе тема
Потому что в запросах могут быть имена и фамилии а не только "как пройти в библиотеку"?
Имён-Фамилий не встречали, но интимных запросов полно, да и просто личных. Банках/Страховым/МВД, и всем тем компаниям у которых есть база голосов своих клиентов/подопечных будет полезно ознакомиться с поисковыми интересами.
Издержки вряд ли сравнимы с выгодами от улучшения сервиса.
У Толоки аудитория до 1.5 млн в месяц (по SimilarWeb). В Яндексе говорят, что в выборке миллионы запросов. Люди повторяются. Зачем сделали интерфейс для загрузки?
Интерфейс для загрузки явно сделан не намерено, такая кнопка есть у встроенных mp3-плееров большинства браузеров
СЕОшники уже руки потирают, судя по всему - http://pr-cy.ru/news/p/6473
Комментарий недоступен
"Мы увидели материал о голосовых запросах в Толоке и хотим поблагодарить вас за то, что вы выявили эту ситуацию — она не совсем правильная с точки зрения правил работы толокеров, однако мы хотим подчеркнуть, что в ней нет ничего страшного для пользователей" - https://robot-review.ru/yandex-response-and-thanks-d1cb969ac3fb