Викитека:Работа для бота

Материал из Викитеки — свободной библиотеки
Перейти к навигации Перейти к поиску
↱
  • ВТ:РДБ

Эта предназначена для отслеживания заказов для ботов — специальных программ, способных автоматически создавать и править статьи по заданному алгоритму. Боты могут очень многое (всё, что формально алгоритмизируемо), но основным вкладом в развитие Викитеки всё-таки остаются созданные и исправленные вручную статьи. После выполнения или отклонения запрос переносится в архив.

Если ботовладелец берётся за исполнение заявки, то он ставит в заявке надпись «Запрос рассматривается» и ставит свою подпись и дату. После выполнения меняет надпись на «Запрос выполнен». На отклонённые по разным причинам запросы ставится надпись «Запрос отклонён».

Текущие запросы[править]

Скрипт для башкирской викитеки[править]

Имеется массив произведений на башкирском языке. Хотел бы залить ботом. Дайте образец программы, для заливки викитеки, которая находится в инкубаторе. zsaliho@mail.ru --Саган (обсуждение) 11:00, 26 февраля 2014 (UTC)[ответить]

Даты рождения/смерти в страницах авторов[править]

Стоило бы преобразовать свободный текст в {{ДатаРождения}} и {{ДатаСмерти}}, где это однозначно: указаны даты по старому и новому стилю для авторов из Российской империи, даты после введения нового стиля, иностранные авторы, т. д. --EugeneZelenko (обсуждение) 13:57, 3 мая 2012 (UTC)[ответить]

Подбор интервики для страниц-неоднозначностей[править]

Стоило бы попытаться подбирать интервики для страниц-неоднозначностей на основе интервики в Википедии. Хотя бы для одиночных слов. Если не править страницы напрямую, то составить таблицу с кандидатами. Думаю, что можно поработать с английским и польским разделами. --EugeneZelenko (обсуждение) 14:11, 18 апреля 2012 (UTC)[ответить]

Интервики в текстах в дореформенной орфографии[править]

Поскольку интервики в других проектах указывают на текст в современной орфографии, стандартные роботы обходят тексты в дореформенной орфографии стороной. Соответственно надо иметь робота обновляющего интервики в тексте в дореформенной орфографии по странице в современной. В информации о текстах также иногда дублируются ссылки на страницы в других разделах, которые тоже могут нуждаться в обновлении. --EugeneZelenko 15:14, 26 января 2012 (UTC)[ответить]

Категории веков, десятилетий, годов[править]

Для нашей эры:

  1. Из категорий веков и десятилетий удалить шаблон {{... век}}, если он есть.
  2. В каждую категорию века добавить шаблон {{Навигация}}, напр., в Категория:XIX век
    {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:XIX век |Викиновости = |Викисклад = Category:19th century }}.
  3. В каждую категорию десятилетия добавить шаблон {{Навигация}}, напр., в Категория:1810-е годы
    {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:1810-е |Викиновости = |Викисклад = Category:1810s }}.
  4. В каждой категории десятилетия добавить ключ сортировки, напр., в Категория:1810-е годы родительская категория должна быть [[Категория:XIX век|*01]], в Категория:1890-е годы — [[Категория:XIX век|*09]].
  5. Добавить или изменить (если он есть) ключ сортировки в категориях года, напр., в Категория:1810 год род. категория должна быть [[Категория:1810-е годы|*00]], в Категория:1811 год — [[Категория:1810-е годы|*01]].
  6. В каждую категорию года добавить в начало два шаблона — {{Навигация}} и {{... век}}, напр., в Категория:1810 год
    {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:1810 год |Викиновости = |Викисклад = Category:1810 }}{{XIX век}} (без пробела между шаблонами).

Заранее спасибо, Yuri Che 10:44, 22 июля 2011 (UTC)[ответить]

Категории веков обработал моим SKbot'ом. Дополнительно расставил iwiki. -- Sergey kudryavtsev 09:06, 27 июля 2011 (UTC)[ответить]
Спасибо... Yuri Che 12:37, 27 июля 2011 (UTC)[ответить]

Выявление проблем с типографикой в названиях[править]

Полезно иметь робота, который бы периодически проходился по списку названий страниц и выявлял проблемы с типографикой ("" вместо «», ... вместо …, - вместо — и т. д.). Может быть заодно бы их и переносил и исправлял ссылки. --EugeneZelenko 04:17, 14 декабря 2010 (UTC)[ответить]

Робот для исправления ссылок тексты в старой орфографии[править]

Перенесено со страницы Викитека:Форум

Думаю было бы полезно иметь робота, который периодически проходил по страницам в старой орфографии и исправлял ссылки в них на версии в старой орфографии (если таковая имеется). --EugeneZelenko 15:15, 2 февраля 2010 (UTC)[ответить]

Упорядочивание ссылок на другие значения[править]

Сейчас ссылки на другие значения можно указывать в {{Отексте}} и с помощью {{Другие значения}}. Стоило бы договорится о стандарте и соответственно исправить существующие ссылки. --EugeneZelenko 14:10, 27 апреля 2010 (UTC)[ответить]

Сделать несложно, но вначале нужно прийти к единому мнению о том, какой способ используем. — Lozman 14:45, 27 апреля 2010 (UTC)[ответить]
Использование одного универсального шаблона, по-моему, предпочтительнее, чем использование двух. Соотв., думаю, на страницах текстов надо использовать только {{О тексте}}. Yuri Che 13:50, 21 июля 2011 (UTC)[ответить]
 Сделано — Заменил все, что поддавалось автоматической замене (около 500 страниц), вроде бы все нормально. Остальные страницы либо оставить как есть, либо править вручную. — Lozman 21:16, 21 июля 2011 (UTC)[ответить]

Автоматизация поддержки других значений[править]

Надо периодически проходиться по всем названия и создавать/добавлять в существующие другие значения ссылки на новые тексты. Критерий: одинаковые названия до скобок с автором/переводчиком. Соответственно в сами тексты добавлять ссылку на другие значения. --EugeneZelenko 14:10, 27 апреля 2010 (UTC)[ответить]

Интервики-бот[править]

Просьба ко владельцам ботов на Python'е запустить стандартного интервики-бота на страницы авторов (у меня такое ощущение, что их интервики-боты их правят редко и что тут накопилось много изменений). В w:Википедия:Рекомендации Юному ботоводу написано что, его можно запустить на категорию:

python interwiki.py -cat:'Все_авторы'

Ещё было бы неплохо запустить его на страницы авторов в иностранных доменах. -- Sergey kudryavtsev 12:08, 28 апреля 2010 (UTC)[ответить]

Прошелся по страницам авторов, результаты можно увидеть здесь (вклад за 15 декабря). — Lozman 23:09, 15 декабря 2010 (UTC)[ответить]
Спасибо. А не могли бы вы посмотреть (или поэкспериментировать), почему стандартдартный interwiki.py иногда удаляет правильные интервики (подробно я это описал в Викитека:Форум#Ошибки в стандартном скрипте для интервики-ботов)? -- Sergey kudryavtsev 21:31, 17 декабря 2010 (UTC)[ответить]
Я не специалист, но, кажется, понял, в чем тут дело: бот написан под Википедию, в которой наличие двух и более интервики-ссылок на один языковой раздел не допускается (ссылка должна быть либо одна, либо ни одной). Соответственно, удаляет все ссылки, кроме одной. Не уверен, что это можно легко исправить: вряд ли кто-то станет переписывать бота специально под Викитеку. Либо нужно самим адаптировать скрипт под наши нужды, либо хотя бы защитить такие страницы от ботов (вроде бы для этого предназначен шаблон {{nobots}}). — Lozman 22:06, 17 декабря 2010 (UTC)[ответить]
А мне кажется, что могут и должны переписать, как это было сделано для Викисловаря (там совсем особые правила обработки интервик). Может, обратится за помощью на oldwikisource, наверняка там есть хорошие специалисты по Python'у? -- Sergey kudryavtsev 22:46, 17 декабря 2010 (UTC)[ответить]
По крайней мере вопрос задать стоит. Вы там знаете кого-нибудь? — Lozman 23:43, 17 декабря 2010 (UTC)[ответить]

Отступы абзацев в прозе[править]

Во многих текстах с прозой отсутствует <div class="indent">…</div> (например, Иван Сергеевич Тургенев). Думаю, что полностью автоматизировать процесс не удастся, но даже если и полуавтоматический вариант будет проблематичен, то стоит хотя бы составить список таких страниц для последующей ручной обработки. --EugeneZelenko 03:24, 29 апреля 2010 (UTC)[ответить]

Я думаю, что расстановку div'а не автоматизировать. Единственное что, бот может составить список страниц в категориях прозы, в которых <div class="indent">…</div> не стоит. Категории можно брать по конкретному автору, ибо список по всем авторам будет огромный. -- Sergey kudryavtsev 06:12, 29 апреля 2010 (UTC)[ответить]

Список страниц для викификации[править]

Думаю, что можно использовать следующие критерии:

  • Слова/фразы на других алфавитах (прежде всего латинском) вне {{lang}}
  • Сокращённые названия языков (фр., англ., и т.д.), особенно в отсутствии сноски (<ref></ref>).
  • Фамилии известных авторов (Пушкин, Достоевский и т.д.) без ссылок.

EugeneZelenko 14:13, 5 мая 2010 (UTC)[ответить]

Ссылки на ЭСБЕ[править]

Стоило бы автоматизировать добавление ссылок на статьи ЭСБЕ со страниц авторов/переводчиков. Хотя бы в виде списка с подобными названиями (страницы автора и статьи ЭСБЕ). --EugeneZelenko 14:28, 26 июня 2010 (UTC)[ответить]

Я возьмусь за эту работу. Это интересная проблема. И мне сначала нужно хорошо подумать над стратегией её решения... -- Sergey kudryavtsev 13:33, 15 декабря 2010 (UTC)[ответить]

Готовы первые результаты — Участник:SKbot/Авторы в ЭСБЕ. Здесь перечислены все страницы, использующие {{Обавторе}}. Они разделены на две части со ссылками на ЭСБЕ и без оных. Для каждой статьи первой группы указана ссылка ЭСБЕ из параметра ЭСБЕ (как видите, есть красненькие). Для статей второй группы пока выведено ЭСБЕ/ + имя статьи (как видите, есть синенькие). Сначала я поправлю эти ошибки, а затем проанализирую обратные ссылки на статьи второй группы с подстраниц ЭСБЕ и буду выводить их во вторую колонку. Так, надеюсь, отловится ещё пара десятков авторов. Далее я попытаюсь имена из трёх компонентов (предполагая Имя Отчество Фамилия) преобразовать в ссылку «ЭСБЕ/Фамилия Имя Отчество» или «ЭСБЕ/Фамилия, Имя Отчество». Надеюсь здесь здесь отловится побольше. -- Sergey kudryavtsev 12:34, 16 декабря 2010 (UTC)[ответить]

Спасибо большое!
Стоило бы ещё для надёжности проверять год рождения/смерти.
Также надо отфильтровать страницы авторов, которые никак не могли попасть в ЭСБЕ по году рождения. Наверное это последний год издания ЭСБЕ минус 5—15 лет.
EugeneZelenko 04:18, 17 декабря 2010 (UTC)[ответить]
Вытащить год рождения из параметра ДАТАРОЖДЕНИЯ технически сложно — слишком много вариантов оформления. Лучше было бы завести специальное значение «нет» для параметра ЭСБЕ (человек его выставлял бы, сигнализируя боту: «нет, и быть не может»). Но пока овчинка выделки не стоит — ведь это лишь вопрос эффективности. Если по мере усложнения алгоритма информация станет собираться слишком долго, я заведу список обрабатываемых авторов (выкидывая из него современных). -- Sergey kudryavtsev 04:36, 17 декабря 2010 (UTC)[ответить]
Может попробовать регулярное выражение на четыре цифры, начиная с 19? Всё-таки в списке слишком много современных авторов, а такой шум не облегчает работу со списком. --EugeneZelenko 15:15, 17 декабря 2010 (UTC)[ответить]
К сожалению, мой бот ещё не научился работать с регулярными выражениями. Но, пожалуй, четыре цифры подряд можно выташить и обычными средствами. Попробую. -- Sergey kudryavtsev 21:23, 17 декабря 2010 (UTC)[ответить]

Думаю, что также не помешает проверить наличие ссылок со страниц авторов/ЭСБЕ на Википедию/Викицитатник и обратно. --EugeneZelenko 14:38, 6 января 2011 (UTC)[ответить]

либо[править]

В конвертере старой орфографии в новую была (и пока есть) ошибка и -либо заменялась на пробел+либо (когда либо, что либо и т. д.). Стоило бы роботом создать список страниц с подобными ошибками. Или даже исправить в автоматическом/полуавтоматическом режиме. --EugeneZelenko 15:12, 3 июля 2010 (UTC)[ответить]

Архив[править]

В связи с переименованием Роберт БернсРоберт Бёрнс[править]

Страничка автора переименована GreenStork'ом. Я проверил по энциклопедии (по бумажной, не Википедии) — действительно Бёрнс. Следовательно надо поменять фамилию в названиях статей и в параметре {{Отексте}}. Кто возьмётся? -- Sergey kudryavtsev 21:18, 13 мая 2010 (UTC)[ответить]

 Сделано вручную — это оказалось проще. -- Sergey kudryavtsev 10:28, 14 мая 2010 (UTC)[ответить]