Учёные выявили сеть ботов в соцсетях по первой цифре числа подписчиков Статьи редакции

Учёные из американского университета проанализировали учётные записи в социальных сетях и обнаружили закономерность, которая позволила выявить сеть «российских ботов». На это обратило внимание научно-популярное издание N+1.

Дженнифер Голбек (Jennifer Golbeck) из Мэрилендского университета в США провела исследование, в котором попыталась выяснить, как закон Бенфорда соотносится с социальными сетями. Оказалось, что число подписчиков в социальных сетях должно удовлетворять так называемому «закону первой цифры», который гласит, что цифра «1» встречается на первом месте куда чаще, чем все остальные.

В своей работе американские учёные отобрали пользователей из твиттера, Google Plus и LiveJournal, у которых было минимум 100 друзей или подписчиков, а затем проанализировали полученные данные о социальных связях в соответствии с законом Бенфорда. Выяснилось, что результаты проверки более 91,5% пользователей Google Plus и 85,5% аккаунтов в LiveJournal совпадали с теми, которые предполагались на основании закона первой цифры.

Для анализа были взяты 20 988 профилей в Твиттер. В них нашли только 170 подозрительных профилей, 168 из которых действительно оказались ботами. Абсолютное большинство из них были замечены в подозрительной активности. Дженнифер Голбек называет их частью «российской сети ботов». Аккаунты публиковали одинаковые случайно выбранные фразы (зачастую вырванные из середины предложений) или изображения с бесплатных фотохостингов.

Согласно полученным показателям, социальные сети прекрасно подпадают под действие закона. Исключением стал лишь Pinterest, где цифра «5» встречалась чаще, чем это прогнозировали специалисты. Объяснением этому служит необходимость указывать минимум пять сфер интересов при регистрации.

Распределение первой цифры в числе подписчиков. Точки обозначают показатели, рассчитанные по закону Бенфорда

Обнаружить закономерность удалось исключительно благодаря использованию закона Бенфорда, который позволил проанализировать поведение большого количества аккаунтов и выявить те, которые отличались необычными действиями.

Закон Бенфорда описывает вероятность появления определённой первой цифры в различных величинах, которые взяты из реальной жизни. Например, в списке самых высоких строений мира цифра «1» встречается куда чаще, чем «9». Данный закон используют для измерения точности финансовой документации, результатов выборов и множества других показателей. Существует специальный сайт, где можно ознакомиться с другими примерами.

0
19 комментариев
Написать комментарий...
Резиновый якорь
>нашли только 140 подозрительных профилей, 168 из которых действительно оказались ботами.

Шо?

Ответить
Развернуть ветку
Всероссийский чайник

170 в оригинале

Ответить
Развернуть ветку
Резиновый якорь

да, уже пофиксили

Ответить
Развернуть ветку
Правильный самолет

Мне кажется, или это какой-то бред?

гласит, что цифра «1» встречается на первом месте куда чаще, чем все остальные.
учёные отобрали пользователей, у которых было минимум 100 друзей

Очевидно же, что цифра «1» будет встречаться чаще, потому что аккаунтов с количеством друзей >= 100 && < 200 будет больше, чем >= 200 && < 300 и т.д.

Ответить
Развернуть ветку
Правильный самолет

И 20 000 аккаунтов — это же просто смешная выборка. Это столько твитов в минуту пишется.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Некоторые Валера

где-то читал, что по законам социологии выборка в 22 тысячи или около того считается репрезентативной с низкой степенью погрешности. Видимо юзеров от сотки выбрали, чтобы отсеять "нулевые" аккаунты. Хотя, конечно, интереснее было бы узнать результаты в выборке от сотни тысяч. Но в целом исследование проведено корректно, имхо

Ответить
Развернуть ветку
Дополнительный инструмент

Не думаю, что это бред, просто написано нескладно. Распределение Бенфорда по сути то же самое, что и допустим нормальное распределение. Если что-то при достаточно большой выборке вываливается за пределы стандартного отклонения, то это подозрительно.
Другое дело, что выборка тут откровенно скудная.

Ответить
Развернуть ветку
Подлинный франт

Странно, что еще никто не запостил

Ответить
Развернуть ветку
Разнообразный файл

Я тут только 20-ю серию 3-его сезона "Элементарно" досмотрел. А эта статья была как 21 серия :-D

Ответить
Развернуть ветку
Мрачный будильник

А я вот бросил его смотреть. Уровень неправды в сериале зашкаливает.

Ответить
Развернуть ветку
Разнообразный файл

третий сезон нормально смотрелся, второй да, чуть слажали)

Ответить
Развернуть ветку
Мрачный будильник

Меня в этом сериале раздражает ровно две вещи:

1. Убийца это первый человек с кем разговаривал Шерлок и Ватсен.

2. Псевдо научный бред, с помощью которого раскрывают преступления.

С первым пунктом к третьему сезону разобрались, а вот со вторым... Серия с клонированными растениями у которых одинаковая корневая система стала для меня последней каплей.

Ответить
Развернуть ветку
Газетный дебаркадер

Они сильно косячат, когда вставляют в сюжет элементы нашего мира, но в целом по уровню сюжета сериал очень хорош.

Ответить
Развернуть ветку
Мрачный будильник

Ну не знаю. Это конечно только моё ИМХО, но когда почти во всех сериях убийцей оказывается первый встречный Холмсом человек...

Ответить
Развернуть ветку
Газетный дебаркадер

суть не в этом

Ответить
Развернуть ветку
Дневной пёс_анон

Комментарий недоступен

Ответить
Развернуть ветку
Любовный Влад

Спасибо, образовательный Tj, за наводку еще одного метода для моего диплома.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Забавный череп

Это они еще "ВКонтакте" не видели.

Ответить
Развернуть ветку
Подобный пистолет

Вконтач ещё далеко не самое комфортное место для ботов.

Ответить
Развернуть ветку
Читать все 19 комментариев
null