Викитека:Проект:Импорт текстов/Lib.ru

Материал из Викитеки — свободной библиотеки

Начало проекта — октябрь 2020 г.

Цель проекта[править]

Импорт текстов произведений, страниц авторов и сопутствующих иллюстраций из http://az.lib.ru (раздела «классики» Библиотеки Мошкова)

Примерный план проекта[править]

1) выкачивание; 2) парсер html, чистка, конвертация в wiki-разметку, викификатор; 3) выкачивание иллюстраций;
4) создание шаблонов страниц, категоризация, заливка текстов и картинок в ВТ;
5) создание страниц авторов, интеграция со ссылками на тексты.

Дополнительно:

  • Сделать бота для импорта новых страниц по мере их появления на исходном сайте.
  • Сделать страницу в формате JSON с маппингом (установкой соответствий) имён/путей в url авторов исходного сайта и страниц этих авторов в Викитеке. Это бы помогло связать добавленные страницы произведений с авторами Викитеки. И таким образом обновлять поля АВТОР в шапках произведений и ставить категорию автора.

Новости проекта[править]