Информационные барыги

Кто и как следит на нами в век интернета? Можно ли как-то защититься от слежки?

Сегодня в разных закоулках интернета все чаще и чаще поднимаются яростные споры о слежке в интернете и сохранности анонимности. Кто-то считает таких людей параноиками, кто-то понимает, что сегодня проще смириться с пугающей действительностью, а кто-то до сих пор не осознает суть проблемы и рисует в голове образ работника спецслужб со специальным оборудованием, которое подключается к интернет-кабелю и перехватывает всю нужную информацию.

Времена изменились, и сейчас основная угроза сохранению анонимности в сети исходит не от спецслужб, не от хакеров, а от современных интернет-гигантов и социальных сетей. Именно они агрегируют в себе петабайты информации о каждом из нас. При этом многие уверены, что смогут сохранить анонимность если не будут выкладывать в интернет настоящую личную информацию, фотографии, контактные данные и т.д. И это серьезнейшая ошибка. Как и в реальной жизни, лучше всего о человеке говорят не его слова, а его поступки и действия. И крупнейшие игроки современного интернета успешно используют этот источник информации в своих целях.

Сегодня практически невозможно найти сайт, на котором бы не был установлен счетчик Google Analytics, виджеты от Facebook или авторизация через соцсети. Браузеры и плагины к браузерам, выпускаемые такими интернет-гигантами, также являются ценнейшим источником информации о действиях пользователя. Благодаря им, каждое ваше действие в сети - посещение сайта, клик на баннер, просмотр видео, прослушивание аудио, скачивание фильма с треккера - все это сливается множеству заинтересованных лиц, которые потом агрегируют всю собранную информацию и используют ее как для своих собственных целей, так и для продажи третьим лицам.

Весь объем собираемой информации в полной мере сегодня могут осознать только технически подкованные специалисты. Но на простых примерах анализа общедоступной информации можно шаг за шагом погрузиться в бездонные недра океана информации, которую можно незаметно для пользователя получить в довольно сжатые сроки.

Давайте я просто покажу, какие данные можно использовать для анализа и их организации в подробнейшее досье на любого пользователя сети:

1. Юзер-агент (информация об операционной система и браузере) + ваш IP. Позволяют определить местонахождение человека, иногда вплоть до дома. Информация об ОС может косвенно служить ориентиром на достаток (iphone последней модели, Mac OS и т.д.). Эту информацию может использовать в своих целях ЛЮБОЙ сайт. И это уже активно делают поисковики билетов на самолеты, предлагая пользователям Mac OS цену выше, чем пользователям старенькой Windows XP

2. История поиска, история посещения ВСЕХ сайтов. Отдельно отмечу, что ваш провайдер (а по требованию суда и власти) достанут подробнейшую информацию обо всех порно-сайтах, которые вы посещали даже в приватном режиме браузера. На основе анализа этих данных и сопоставления их с известными данными на основе методов машинного обучения можно с вероятностью в 90-95% определить полный набор персональных данных о пользователе: возраст пол, политические убеждения, интересы, социальный статус, доход и т.д.

3. Сопоставление и анализ использования одних и тех же аккаунтов соцсетей, сервисов и сайтов на разных компьютерах и в разное время. Позволяет легко вычислить рабочий, домашний компьютеры пользователя, его мобильные устройства, относительно точное расположение места работы и дома. Опять же, теоретически эту информацию может собрать ЛЮБОЙ сайт, который задастся такой целью.

4. Анализ содержимого ваших аккаунтов в соцсетях: письма, контакты, медиа-контент, гео-теги, даты публикаций, расшаренные ссылки и многое-многое другое. Позволяют определить, часто с поразительной точностью, места работы, проживания, отдыха, уровень доходов, социальный и семейный статус, возраст (подразумевается, что эта информация не была указана самим пользователем) и многое другое.

5. Анализ расположения точек подключения к сети через мобильные устройства на основе ip или публичных Wi-Fi точек позволяет с высокой точностью вычислить маршруты и время движения пользователя.

6. Анализ ваших друзей, контактов, связывание аккаунтов соцсетей между собой. Сейчас огромное количество приложений на смартфонах просят дать им доступ к вашим контактам, а также связать их аккаунты с учетными записями в других соцсетях и сайтах. Вы же не думаете, что они это делают только с целью «найти ваших друзей»? И часто именно тут кроется основная причина того, что человека, который не указывает свои настоящие данные и не выкладывает идентифицирующие его данные, можно относительно точно вычислить на основе анализа его связей в соцсетях, друзей, контактов почты.

И это лишь то, что лежит на поверхности - анализ очевидных данных, которые может получить любой крупный игрок за счет своих бесконечных счетчиков, виджетов на большинстве сайтов, ну и, конечно, браузеров и плагинов.

Однако путей для их последующего анализа, и даже для предсказания дальнейших действий пользователей, огромное количество. От примитивнейших умозаключений до, казалось бы, несвязанных на первый взгляд действиях, которые приводят к определенному результату.

Простейший пример: женщина 25-35 лет ищет информацию о беременности, врачах, роддомах и т.д. Логично предположить, что через 7-9 месяцев этой женщине будет ОЧЕНЬ уместна реклама подгузников, детских игрушек, колясок и прочих детских радостей. Или, предположим, машинное обучение на основе миллиарда запросов за последний год выявило устойчивую связь между (это мои больные фантазии) поиском в гугле информации о котиках и последующим через 4 месяца поиском адвокатов для маньяков-потрошителей и потенциальном сроке за убийство. В следующий раз эта система после поиска вами фотографии котиков предупредит соответствующие органы о вас, как о потенциальном убийце. Ну или, как минимум, будет считать, что через 4 месяца после поиска вами фотографий котиков вам следует показать рекламу адвоката. И в большинстве случаев она будет права, т.к. за этим выводом стоит анализ тысяч и миллионов действий пользователей.

На первый взгляд все это звучит и выглядит абсурдно. И это было бы смешно, если бы не было так страшно. Сегодня активно развивается направление анализа огромных массивов данных - Big Data, которое открывает невозможные ранее из-за технических ограничений невероятные возможности в выявлении закономерностей и которые можно использовать как во благо (например, предсказывая эпидемии на основе анализа поисковых запросов, для предупреждения возможных техногенных аварий), так и во вред. Ведь компромат можно найти на абсолютно любого человека, было бы желание. И ко всей этой информации есть почти полный доступ у государства, правоохранительных органов. Но и это еще полбеды. Лицензионное соглашение многих соцсетей и интернет-сервисов подразумевает свободное использование этой собранной информации в своих коммерческих целях (в частности, в контекстной рекламе) и даже в отдельных случаях ее передачу или продажу третьим лицам. Кто является этими "третьими лицами" мы, скорее всего, никогда не узнаем.

Даже в обезличенном виде этот огромный массив информации является ценнейшим товаром для миллионов покупателей. Ведь такое подробное досье позволяет, сопоставив обезличенную информацию с достоверно известной, идентифицировать человека с минимальной погрешностью.

С каждым днем интернет проникает в нашу жизнь все глубже и глубже, интернет-гиганты выстраивают огромную единую инфраструктуру, предоставляя удобные сервисы и службы в одной точке, под одним логином. И часто все это не стоит для конечного пользователя ни копейки. Потому что эти компании зарабатывают не на предоставлении услуг, а на сборе максимума информации о пользователе во всех сферах его жизни. И чем больше информации они смогут собрать, тем более ценной она является для покупателя.

Мы становимся все более зависимыми от сервисов интернет-гигантов. А это значит, что мы будем вынуждены использовать их сервисы, их сайты, тем самым только пополняя свое досье каждым своим действием в интернете. Приход "интернета вещей" будет значить, что теперь гиганты будут знать когда вы проснулись, почистили зубы, поставили чайник, включили кондиционер и выключили свет в спальне после тесного сближения (определенного на основе датчиков) с вашей второй половинкой.

В будущем нет места для анонимности. В будущем нет места личной жизни. Ты либо в тренде, либо уходи в лес. И даже в случае, если в будущем и дальше будут появляться подпольные анонимные сети, вроде TOR, которые будут сохранять некое подобие анонимности, то это все равно никогда не станет массовым явлением и всегда будет уделом гиков, параноиков, ярых противников системы и, конечно же, криминальных элементов.

Сегодня невозможно пользоваться интернетом и быть невидимым, анонимным, неопознанным. Мы все под колпаком. Зато бесплатно.

0
29 комментариев
Написать комментарий...
Средневековый динозавр
Сейчас огромное количество приложений на смартфонах просят дать им доступ к вашим контактам, а также связать их аккаунты с учетными записями в других соцсетях и сайтах. Вы же не думаете, что они это делают только с целью «найти ваших друзей»?
Ответить
Развернуть ветку
Драматический Никита

TJ - проект ФСБ, Лихачев - тайный агент.

Ответить
Развернуть ветку
Страховой рубин

Лихачев: дети шпионов.

Ответить
Развернуть ветку
Колючий супер_стар

TJ как вступительная работа в академию ФСБ. Когда школу закончит, конечно же.

Ответить
Развернуть ветку
Принудительный Влад

Любое мобильное приложение содержит как минимум 3 системы аналитики, которое следит за каждым вашим действием внутри.

Плюс не забывайте про аналитику самой платформы, вон гугол за несколько лет хранит историю перемещений

https://maps.google.com/locationhistory/b/0

Ответить
Развернуть ветку
Грузовой спрей

Я в безопасности?

Ответить
Развернуть ветку
Принудительный Влад

Просто оставлю это здесь (p.s. плоский юмор наличиствует)

Ответить
Развернуть ветку
Бледный каякер
наличиствует

И правда.

Ответить
Развернуть ветку
Уральский единорожек88

Тихо шифером шурша, едет крыша не спеша

Ответить
Развернуть ветку
Вредный Женя
Google Analytics

Кстати, попросил Ghostery не блокировать этот и прочие гугловые скриптики и теперь в Google Now иногда приходят интересные статьи на разные интересные мне темы. Не нужно так уж шарахаться. Да и таргетированная реклама — совсем не такая уж плохая штука.

Ответить
Развернуть ветку
Средневековый турник

Ghostery же после перепродажи другой компании сам сливает информацию.

Ответить
Развернуть ветку
Вредный Женя

Извините, а можно ли какое-то подтверждение? А то поиск по тому же Хабрахабру ничего не дал.

Ответить
Развернуть ветку
Бледный каякер
Ответить
Развернуть ветку
Вредный Женя
which sells data on the ads you block to the ad companies themselves

Действительно, спасибо. Но, тем не менее, я не вижу в этом ничего плохого. Напротив, имея подобный фидбек, сами рекламные компании могут начать работать над тем, чтобы сделать свои баннеры/скрипты/анализаторы как можно менее назойливыми.

Ответить
Развернуть ветку
Бледный каякер

Собственно, обратного я и не говорил. А вот ответ от самого представителя компании (в той же новости на lifehacker):

Ответить
Развернуть ветку
Мокрый глобус

GhostRank можно отключить. По-умолчанию он отключен.

Ответить
Развернуть ветку
Вредный Женя

Ох, не знал, спасибо. Хотя я им пользуюсь по большей части, чтобы странички быстрее грузились.

Ответить
Развернуть ветку
Мокрый глобус

Главный вопрос не в том, какую информацию они собирают. Вопрос в том, чем мне это вредит?

Покажут рекламу, которая соответствует именно моим интересам и потребностям? Вот так проблема.

Ответить
Развернуть ветку
Населенный Мурод

Представьте, что наступит тот день, когда те самые школьники, с начальных классов открывшие интернет и писавшие туда всякие откровенный бред, будут бороться за видные в медиа управленческие должности. Тот же президент.
Информационная резня будет похлеще Красной свадьбы.

Ответить
Развернуть ветку
Населенный Мурод

Но насчет обычных пользователей вы правы - ничего такого опасного эта информация не будет делать.

Ответить
Развернуть ветку
Драматический Никита

Хорошая тема, кстати, а Tor вообще дает анонимность? Или это все сказки?

Ответить
Развернуть ветку
Корпоративный Мурод

Есть информация, что TOR - проект ЦРУ и с тех пор так и развивается.

При желании спецслужбы могут вычислить пользователей TOR. Тот же Silk Road был размещен в TOR, но это ему нисколько не помогло остаться неидентифицированным

Ответить
Развернуть ветку
Неясный кот

его спалила капча =(

Ответить
Развернуть ветку
Драматический Никита

Я скорей поверю в официальную версию, что он спалил свой gmail, когда рекламировал свой сайт.

Ответить
Развернуть ветку
Корпоративный Мурод

Я не специалист в области TOR, поэтому не могу дать четкий ответ. Читал, что отследить сложно, но можно

Ответить
Развернуть ветку
Серьезный пёс_анон

Комментарий недоступен

Ответить
Развернуть ветку
Вредный Женя

Раз наркотиками активно торгуют, что-то точно даёт. Но так-то I2P будет покруче.

Ответить
Развернуть ветку
Абстрактный коктейль
Отдельно отмечу, что ваш провайдер (а по требованию суда и власти) достанут подробнейшую информацию обо всех порно-сайтах, которые вы посещали даже в приватном режиме браузера.
На основе анализа этих данных и сопоставления их с известными данными на основе методов машинного обучения можно с вероятностью в 90-95% определить полный набор персональных данных о пользователе: возраст пол, политические убеждения, интересы, социальный статус, доход и т.д.

Всегда знал, что существует корреляция между порно-сайтами и возрастом, полом, политическими убеждениями...

Ответить
Развернуть ветку
Обширный Кирилл

Если бы я был уверен в адекватности правительства моей страны, быть может, я бы относился ко всему этому гораздо спокойнее.

Ответить
Развернуть ветку
Читать все 29 комментариев
null