Швед написал 2,7 миллиона статей для «Википедии» Статьи редакции

Шведский пользователь пишет в среднем по 10 тысяч статей для «Википедии» каждый день. О том, как ему это удаётся и все ли в интернет-энциклопедии довольны такой «плодовитостью» автора, рассказывает The Wall Street Journal.

53-летний Сверкер Йоханссон (Sverker Johansson) написал 2,7 миллиона статей на «Википедии» — это 8,5 процента от всей коллекции интернет-энциклопедии. Это больше, чем у любого другого автора.

Такая высокая производительность объясняется тем, что большинство статей за Йоханссона пишет специальная программа Lsjbot. Автор находит подходящую базу данных, составляет схему материала и запускает бота, который на основе полученной информации компонует текст в формате «Википедии». Иногда так появляется до 10 тысяч статей в день.

Треть статей, созданных Lsjbot, написаны на шведском языке. Остальные — на двух вариантах филиппинского (один из них является родным для жены Йоханссона).

Особенно много материалов у шведского пользователя и его программы вышло в процессе каталогизации малоизвестных видов животных, в том числе бабочек и пчёл. Автор также гордится статьями о городах Филиппин.

Благодаря Йоханссону в 2013 году шведская «Википедия» перевалила за миллион статей, причём миллионную, про один из видов бабочек, написал Lsjbot. На тот момент за этой программой числилось уже 450 тысяч материалов на шведском языке — то есть, почти половина.

У Йоханссона ушло несколько месяцев на создание программы, которая бы писала статьи для «Википедии». При этом она оказалась не идеальной: когда Lsjbot переключился на русскую версию свободного фотоархива Wikimedia Commons, он не смог считать кириллицу и стал выдавать ошибки.

WSJ отмечает, что не все в сообществе редакторов «Википедии» благосклонно относятся к использованию ботов для создания статей. Критики отмечают, что программа Йоханссона собирает только самую базовую информацию об описываемых объектах, не указывая их отличительных особенностей.

Впрочем, плодовитый автор уверен, что недовольство высказывает «громкое меньшинство». Он уверен, что его действия позволят создать в сети «абсолютную демократию».

0
50 комментариев
Написать комментарий...
Плоский татарин

Дядя создает фундамент. Базовые данные? Ну иди, добавляй, пионэр.

Ответить
Развернуть ветку
Соседний холод

Практика показывает, что статьи, автоматически создаваемые ботами, никто потом не в силах доработать вручную, поэтому они должны уже в момент заливки содержать много информации.

Ответить
Развернуть ветку
Подходящий цвет

Почему "не в силах"-то? Типа, с чистого листа написать легче? или в разметку срут?

Ответить
Развернуть ветку
Соседний холод

Дело не в разметке, а в нетривиальных фактах. Боты берут тривиальщину (какое семейство, какой род и т. п.) из баз данных, а не примечательные данные из книжек. И этих неполноценных статей умопомрачительное количество, их вручную невозможно обрабатывать.

Ответить
Развернуть ветку
Подходящий цвет

Какие-то базовые описания и ТТХ всё равно нужны, их как раз неинтересно заполнять, а глядеть иногда приходится; примечательные факты можно потом ручками дописать.

Ответить
Развернуть ветку
Соседний холод

ТТХ — это у военной техники, про неё ботам нигде статьи не доверяют писать.
Какие базовые описания вы ожидаете в (никому особо не нужных, ИМХО) статьях о видах восточноафриканских жуков?

Ответить
Развернуть ветку
Подходящий цвет

Какие-то справочные сведения — ареалы обитания, численность, года открытия, размеры, различные формулы (зубов, крыльев и т.п.).

Ответить
Развернуть ветку
Соседний холод

Вы думаете, биологи для каждого известного вида насекомых знают ареалы обитания и численность? А года открытия почти всегда добавляют, про размеры и формулы не знаю.

Ответить
Развернуть ветку
Подходящий цвет

Что-то, что приведено в справочниках, откуда бот и копипастит, не во вред же.

Ответить
Развернуть ветку
Отечественный томагавк_два

Продам цемент, недорого

Ответить
Развернуть ветку
Фундаментальный Влад

Wylsa, когда обзор Mac Pro?

Ответить
Развернуть ветку
Поразительный Никита

Вилса, хочу свежих яблочек!

Ответить
Развернуть ветку
Драгоценный Кирилл

Пффф. У нас депутаты такой программой для новых законов пользуются

Ответить
Развернуть ветку
Сознательный торшер

Это же как настолько тупую программу можно было написать?

Ответить
Развернуть ветку
Подобный пистолет

mail.ru писали

Ответить
Развернуть ветку
Голый алмаз

Думаю, её написали те же, кто занимался разработкой всяческих сбербанков онлайн

Ответить
Развернуть ветку
Желающий жар

Писали за еду.

Ответить
Развернуть ветку
Подробный Артем

Комментарий недоступен

Ответить
Развернуть ветку
Подходящий цвет

Корчевателем.

Ответить
Развернуть ветку
Подходящий цвет

или Яндекс-рефератом

Ответить
Развернуть ветку
Соседний холод
Ответить
Развернуть ветку
Весенний блик

В таком случае, стоит ранжировать языковые разделы по комбинации из количества статей и процента статей, созданных ботами.

Ответить
Развернуть ветку
Соседний холод

Кажется, люди не поняли, зачем я поместил эту ссылку, потому что она нормально не отпарсилась (в комменты призывается Чекальский), и решили, что я иронизирую в адрес русской Википедии. Поэтому уточню — выделяйте текст и вставляйте его в адресную строку вручную, там будет эссе русской Википедии на тему миллионных ботозаливок в нидерландской, шведской, вьетнамской и др. Википедиях.

Ответить
Развернуть ветку
Виноватый Филипп

+1 за https

Ответить
Развернуть ветку
Соседний холод

Вообще-то принудительный редирект на шифрованный протокол — это стандартная для всех зарегистрированных участников фича, введённая фондом "Викимедиа" на всех его проектах после разоблачений Сноудена.

Ответить
Развернуть ветку
Подобный пистолет

Донцова какбэ одобряе

Ответить
Развернуть ветку
Иной яд

Комментарий недоступен

Ответить
Развернуть ветку
Украинский Денис

Приложил руку к тысячам рефератов

Ответить
Развернуть ветку
Минеральный кран

Как основа отлично, если там присутствует ссылки откуда взята инфа, то отлично) Жаль русский язык не потянул, надеюсь это вопрос времени, и программа должна быть в отрытом доступе.

Ответить
Развернуть ветку
Соседний холод

Написать программу для автоматического написания таких "статей" на русском нетрудно, просто сообщество русской Википедии против массовых ботозаливок неполноценных статей.

Ответить
Развернуть ветку
Минеральный кран

Да, думаю ты прав, пусть сразу статья стоящая, не люблю когда статья вроде есть, а там по сути ничего и не написано, только глаза мозолит

Ответить
Развернуть ветку
Коммунистический динозавр

Сообщество русской Википедии на такие ботозаливки никогда не согласится. Статьи создаваемые ботом ужасно коротки: строчка информации, шаблон-карточка и список литературы. Такие статьи не проходят по критериям качества рувики, у нас статьи такого размера удаляют по критерию: "С1: пустая или очень короткая статья без энциклопедического содержания." Ботозаливки в рувики вообще не проводились уже очень давно.

Ответить
Развернуть ветку
Отвратительный ГОСТ

Для русской Википедии нужно использовать Яндекс.Рефераты.
http://referats.yandex.ru/referats/

Ответить
Развернуть ветку
Ориентированный корабль

Дедок-то - копирайтер 85 lvl!

Ответить
Развернуть ветку
Либеральный Никита

надо такого бота под лурку написать.

Ответить
Развернуть ветку
Подходящий цвет

Нахуй такой рак нужен.

Ответить
Развернуть ветку
Коллективный лолипоп

Швед-википелист с женой-филлиппинкой.
Почти архитипично.

Ответить
Развернуть ветку
Подробный Артем

Комментарий недоступен

Ответить
Развернуть ветку
Коллективный лолипоп

Такие представления не у меня, а мем на крауте.

Ответить
Развернуть ветку
Родной татарин

Оруэлл одобряет!

Ответить
Развернуть ветку
Поразительный Никита

а зачем он это делает? на альтруистических началах?

Ответить
Развернуть ветку
Подробный Артем

Комментарий недоступен

Ответить
Развернуть ветку
Коммунистический динозавр

Вся Википедия на таких началах создаётся. Все пишут статьи бесплатно. А администраторы например ещё вынуждены тратить по нескольку часов в день вычищая всякие "Машка дура" из статей и блокируя всю эту школоту причём тоже совершенно бесплатно.

Ответить
Развернуть ветку
Ежегодный Филипп

когда Lsjbot переключился на русскую версию свободного фотоархива Wikimedia Commons, он не смог считать кириллицу и стал выдавать ошибки.

ну как всегда

Ответить
Развернуть ветку
Подробный Артем

Комментарий недоступен

Ответить
Развернуть ветку
Известный щит

Султан:крайний репортаж!(

Ответить
Развернуть ветку
Дипломатический мангал

Благодоря ему появилось очень много полезной информации и не важно как он добавляет эти статьи .

Ответить
Развернуть ветку
Октябрьский кофе

Полезной? Вряд ли кому-то полезны несколько невычитанных строчек о малоизвестных насекомых. Зоологам, конечно, полезны, но вряд ли они будут пользоваться Википедией для профессиональных целей. А вот репутация Википедии страдает от статей такого низкого качества.

Ответить
Развернуть ветку
Страстной Влад

Никита Лихачев уже попросил Сверкера Йоханссона написал программу, заменяющую шеф-редактора TJ...

Ответить
Развернуть ветку
Искренний Филипп

"Треть статей, созданных Lsjbot, написаны на языке, который является родным для жены Йоханссона."

Ответить
Развернуть ветку
Читать все 50 комментариев
null