Швед написал 2,7 миллиона статей для «Википедии» Статьи редакции
Шведский пользователь пишет в среднем по 10 тысяч статей для «Википедии» каждый день. О том, как ему это удаётся и все ли в интернет-энциклопедии довольны такой «плодовитостью» автора, рассказывает The Wall Street Journal.

53-летний Сверкер Йоханссон (Sverker Johansson) написал 2,7 миллиона статей на «Википедии» — это 8,5 процента от всей коллекции интернет-энциклопедии. Это больше, чем у любого другого автора.
Такая высокая производительность объясняется тем, что большинство статей за Йоханссона пишет специальная программа Lsjbot. Автор находит подходящую базу данных, составляет схему материала и запускает бота, который на основе полученной информации компонует текст в формате «Википедии». Иногда так появляется до 10 тысяч статей в день.
Треть статей, созданных Lsjbot, написаны на шведском языке. Остальные — на двух вариантах филиппинского (один из них является родным для жены Йоханссона).
Особенно много материалов у шведского пользователя и его программы вышло в процессе каталогизации малоизвестных видов животных, в том числе бабочек и пчёл. Автор также гордится статьями о городах Филиппин.
Благодаря Йоханссону в 2013 году шведская «Википедия» перевалила за миллион статей, причём миллионную, про один из видов бабочек, написал Lsjbot. На тот момент за этой программой числилось уже 450 тысяч материалов на шведском языке — то есть, почти половина.
У Йоханссона ушло несколько месяцев на создание программы, которая бы писала статьи для «Википедии». При этом она оказалась не идеальной: когда Lsjbot переключился на русскую версию свободного фотоархива Wikimedia Commons, он не смог считать кириллицу и стал выдавать ошибки.
WSJ отмечает, что не все в сообществе редакторов «Википедии» благосклонно относятся к использованию ботов для создания статей. Критики отмечают, что программа Йоханссона собирает только самую базовую информацию об описываемых объектах, не указывая их отличительных особенностей.
Впрочем, плодовитый автор уверен, что недовольство высказывает «громкое меньшинство». Он уверен, что его действия позволят создать в сети «абсолютную демократию».
#Википедия #Швеция #Lsjbot #Сверкер_Йоханссон #самый_плодовитый_автор_Википедии #боты_в_Википедии #шведская_Википедия
Дядя создает фундамент. Базовые данные? Ну иди, добавляй, пионэр.
Практика показывает, что статьи, автоматически создаваемые ботами, никто потом не в силах доработать вручную, поэтому они должны уже в момент заливки содержать много информации.
Почему "не в силах"-то? Типа, с чистого листа написать легче? или в разметку срут?
Дело не в разметке, а в нетривиальных фактах. Боты берут тривиальщину (какое семейство, какой род и т. п.) из баз данных, а не примечательные данные из книжек. И этих неполноценных статей умопомрачительное количество, их вручную невозможно обрабатывать.
Какие-то базовые описания и ТТХ всё равно нужны, их как раз неинтересно заполнять, а глядеть иногда приходится; примечательные факты можно потом ручками дописать.
ТТХ — это у военной техники, про неё ботам нигде статьи не доверяют писать.
Какие базовые описания вы ожидаете в (никому особо не нужных, ИМХО) статьях о видах восточноафриканских жуков?
Какие-то справочные сведения — ареалы обитания, численность, года открытия, размеры, различные формулы (зубов, крыльев и т.п.).
Вы думаете, биологи для каждого известного вида насекомых знают ареалы обитания и численность? А года открытия почти всегда добавляют, про размеры и формулы не знаю.
Что-то, что приведено в справочниках, откуда бот и копипастит, не во вред же.
Продам цемент, недорого
Wylsa, когда обзор Mac Pro?
Вилса, хочу свежих яблочек!
Пффф. У нас депутаты такой программой для новых законов пользуются
Это же как настолько тупую программу можно было написать?
mail.ru писали
Думаю, её написали те же, кто занимался разработкой всяческих сбербанков онлайн
Писали за еду.
Комментарий недоступен
Корчевателем.
или Яндекс-рефератом
https://ru.wikipedia.org/wiki/Википедия:Ботопедия
В таком случае, стоит ранжировать языковые разделы по комбинации из количества статей и процента статей, созданных ботами.
Кажется, люди не поняли, зачем я поместил эту ссылку, потому что она нормально не отпарсилась (в комменты призывается Чекальский), и решили, что я иронизирую в адрес русской Википедии. Поэтому уточню — выделяйте текст и вставляйте его в адресную строку вручную, там будет эссе русской Википедии на тему миллионных ботозаливок в нидерландской, шведской, вьетнамской и др. Википедиях.
+1 за https
Вообще-то принудительный редирект на шифрованный протокол — это стандартная для всех зарегистрированных участников фича, введённая фондом "Викимедиа" на всех его проектах после разоблачений Сноудена.
Донцова какбэ одобряе
Комментарий недоступен
Приложил руку к тысячам рефератов
Как основа отлично, если там присутствует ссылки откуда взята инфа, то отлично) Жаль русский язык не потянул, надеюсь это вопрос времени, и программа должна быть в отрытом доступе.
Написать программу для автоматического написания таких "статей" на русском нетрудно, просто сообщество русской Википедии против массовых ботозаливок неполноценных статей.
Да, думаю ты прав, пусть сразу статья стоящая, не люблю когда статья вроде есть, а там по сути ничего и не написано, только глаза мозолит
Сообщество русской Википедии на такие ботозаливки никогда не согласится. Статьи создаваемые ботом ужасно коротки: строчка информации, шаблон-карточка и список литературы. Такие статьи не проходят по критериям качества рувики, у нас статьи такого размера удаляют по критерию: "С1: пустая или очень короткая статья без энциклопедического содержания." Ботозаливки в рувики вообще не проводились уже очень давно.
Для русской Википедии нужно использовать Яндекс.Рефераты.
http://referats.yandex.ru/referats/
Дедок-то - копирайтер 85 lvl!
надо такого бота под лурку написать.
Нахуй такой рак нужен.
Швед-википелист с женой-филлиппинкой.
Почти архитипично.
Комментарий недоступен
Такие представления не у меня, а мем на крауте.
Оруэлл одобряет!
а зачем он это делает? на альтруистических началах?
Комментарий недоступен
Вся Википедия на таких началах создаётся. Все пишут статьи бесплатно. А администраторы например ещё вынуждены тратить по нескольку часов в день вычищая всякие "Машка дура" из статей и блокируя всю эту школоту причём тоже совершенно бесплатно.
когда Lsjbot переключился на русскую версию свободного фотоархива Wikimedia Commons, он не смог считать кириллицу и стал выдавать ошибки.
ну как всегда
Комментарий недоступен
Султан:крайний репортаж!(
Благодоря ему появилось очень много полезной информации и не важно как он добавляет эти статьи .
Полезной? Вряд ли кому-то полезны несколько невычитанных строчек о малоизвестных насекомых. Зоологам, конечно, полезны, но вряд ли они будут пользоваться Википедией для профессиональных целей. А вот репутация Википедии страдает от статей такого низкого качества.
Никита Лихачев уже попросил Сверкера Йоханссона написал программу, заменяющую шеф-редактора TJ...
"Треть статей, созданных Lsjbot, написаны на языке, который является родным для жены Йоханссона."