Обсуждение:Лев Николаевич Толстой

Материал из Викитеки — свободной библиотеки
Перейти к: навигация, поиск

Полное собрание сочинений[править]

Возможно, это общеизвестно, но все же довожу до сведения коллег. В сети имеются сканы советского полного собрания сочинений Толстого в 90 томах; ссылки на РГБ тут: Лев Николаевич Толстой#Библиография, сканы всех томов — на publ.lib.ru, полностью распознанный и вычитанный текст с указанием страниц печатного издания на полях (практически как у нас) — на tolstoy.ru (сканы там тоже есть).
Особенностью этого ПСС является то, что оно полностью свободное. Как указано в предисловии главного редактора:

«особенностью нашего издания является то, что оно выпускается в свет при точном и полном соблюдении своеобразного предсмертного завещательного указания Л. Н. Толстого о том, как он желал, чтобы издавались его писания. А именно — с обозначением на каждом выходящем томе, что перепечатка его разрешается безвозмездно. Другими словами, с появлением в печати каждого тома настоящего издания, он освобождается от государственной монополии, становится всеобщим достоянием, и по отношению к его содержанию отпадают всякие ограничительные права собственности. Так что впредь всё содержание этого издания может перепечатываться и на русском языке и в переводах без получения на то особых разрешений от каких-либо «литературных собственников» произведений Толстого. Для того, чтобы это освобождение от литературной собственности могло распространяться на всё содержание издания, включая не только написанное Толстым, но и редакторами, они, со своей стороны, также отказались, для всех последующих воспроизведений этого издания, от прав собственности на свою работу, т. е. на свои примечания, объяснительные статьи и пр.»

Иными словами, данное издание можно заливать на commons, создавать индексы, и переносить в них тексты с tolstoy.ru (возможно, даже ботом). Ratte (обсуждение) 19:42, 11 мая 2017 (UTC)

  • ВТ:Ф#"Весь Толстой". Кстати, сайт tolstoy.ru глючит, он может "ложиться" с перенаправлением на сайт музея, где текстов нет. --Vladis13 (обсуждение) 23:49, 30 декабря 2017 (UTC)
  • Если не ошибаюсь, для создания индексов, надо заливать на Commons pdf всех 90 томов, выкачав с http://tolstoy.ru/creativity/90-volume-collection-of-the-works/ ? Или не заливать корпус текстов в ПИ "Страница", а залить в основное пространство, добавив в шапки ссылки на сканы pdf на РГБ (если не ошибаюсь, сканы на сайте взяты оттуда)? Как сделано в РСКД, пример. --Vladis13 (обсуждение) 23:49, 30 декабря 2017 (UTC)
  • Лучше залить на commons, сделать индексы и залить в ПИ Страница. В корпусе наверняка много ошибок, с индексом удобнее проверять и исправлять. Сканы заливайте под лицензией CopyrightedFreeUse, она больше всех подходит. Ratte (обсуждение) 00:51, 31 декабря 2017 (UTC)
Yes check.svg сканы: c:Category:Leo Tolstoy's full works collection (Moscow, 1928—1958). --Vladis13 (обсуждение) 05:29, 3 января 2018 (UTC)
Отлично. Лицензию я, по размышлении, наверное, поменяю на PD-because. Только нужен заполненный индекс первого тома, чтобы я смог сделать ссылку на страницу предисловия про отказ от АП. Ratte (обсуждение) 14:31, 3 января 2018 (UTC)
Индекс:L. N. Tolstoy. All in 90 volumes. Volume 1.pdf. Остальные сделаю ботом чуть позже. --Vladis13 (обсуждение) 15:15, 3 января 2018 (UTC)
Yes check.svg индексы, --Vladis13 (обсуждение) 04:29, 4 января 2018 (UTC)
  • С индексами морока. Надо для каждого тома определять смещение страниц скана, относительно страниц книги. Их по нескольку смещений в томах, из-за наличия ненумерованных страниц-вставок. Без создания списка смещений нельзя залить в ПИ Страница. Надо a) цифру смещения для каждого диапазона страниц (пример в «offsets»), и b) желательно в страницы индексов вписать в тэги <pagelist />.Конечно можно за несколько дней разобраться со всеми 90-томами, если посидеть, но не уверен когда найду время, не мой профиль. / Поэтому предлагаю подумать в сторону заливки произведений в основное пространство, с сохранением маркеров страниц. А позже может перенести в ПИ Страница. Как думаете? --Vladis13 (обсуждение) 05:08, 4 января 2018 (UTC)
  • Давайте я просто поправлю индексы, выяснив и вписав смещения вручную. До конца недели успею, наверное. Можете пока залить текст в индекс тома 1? насколько я вижу, он правильный. Ratte (обсуждение) 14:06, 4 января 2018 (UTC)
  • UPD. Нет, до конца недели явно не успею. Вставок дофига. Пока поправил тома 1—5. Буду стараться хотя бы по 5 в день делать. Нужно заливать именно через индекс посредством pages. Иначе весь смысл теряется. Ratte (обсуждение) 15:52, 4 января 2018 (UTC)
@Ratte: я сделал рабочий список Лев Николаевич Толстой/смещения страниц в индексах 90-томника, чуть поможет с этой рутиной. Там перечислены страницы, где смещение страницы тома на странице индекса отличается от смещения предыдущей страницы индекса, т.е. вероятно смещена нумерация в томе. Т.е. надо открыть ссылку из списка и сверить номер тома в ней с номером предыдущей страницы индекса. Конечно в списке большой процент ошибок (номера страниц томов собирались из OCR сканов), но всё же сходу я нашел несколько смещений. --Vladis13 (обсуждение) 06:46, 10 января 2018 (UTC)
Ок. А вы не будете заливать, пока все тома не будут? Уже 30 томов поправлено. PS. Тома 16 и 45 оказались задвоенными, пришлось перезаливать версиями с publ.lib. Ratte (обсуждение) 19:17, 10 января 2018 (UTC)

@Vladis13: Yes check.svg Поправлены индексы томов 1—45, это вся серия «Произведения». Остались дневники и письма, их поправлю как-нибудь потом, процесс очень трудоемкий и долгий. Предлагаю залить произведения уже сейчас, поскольку они наиболее востребованы. Ratte (обсуждение) 15:51, 13 января 2018 (UTC)

Ок. В ближайшее время займусь. --Vladis13 (обсуждение) 12:12, 14 января 2018 (UTC)

@Ratte: Провозился с парсингом этих html в wiki формат... Вроде работает. Главное чтобы ничего не удалялось, просто 100% уверенности нет - текстовка огромная 170 Мб, за всем не углядеть.
Ряд html-тегов вероятно останутся и будут залиты, потом придется их чистить. Это таблицы, всякие <p class="notindentleft"> которые непонятно чем заменить (в данном случае в источнике это видимо было откл. отступа), итп. --Vladis13 (обсуждение) 13:36, 23 февраля 2018 (UTC)

Заливка[править]

«Первый пошёл»: Индекс:L. N. Tolstoy. All in 90 volumes. Volume 6.pdf.

  • Нюансы заливки. В текстовке зачастую отсутствуют разделители страниц, особенно на границах произведений возле заголовков. Поэтому в индексе страницы могут отсутствовать, ибо их текст в предыдущих залитых страницах. Надо переносить его в отсутствующие страницы, создавая их. Теги «section» не создавал. Работы там ещё очень много, из-за необходимости считать смещения диапазонов страниц в каждом томе. --Vladis13 (обсуждение) 21:31, 23 февраля 2018 (UTC)
  • Отлично. С почином! Ratte (обсуждение) 21:40, 23 февраля 2018 (UTC)
  • @Vladis13: заголовки заключайте не == ==, как в ВП-статьях, а в шаблон {{центр}}, по местной практике. И если есть возможность, ставьте страницам с вставками статус «Без текста» (пример), иначе все эти подписи без фотографий попадут в основной текст. Ratte (обсуждение) 22:08, 23 февраля 2018 (UTC)
    • Спасибо за замечания. А какие параметры шаблона указывать для разных уровней заголовков? «=», «==», «===» и тд? Статус придется ставить вручную, вместе с другой чисткой, ибо как раз эти страницы обычно без маркеров разделения страниц. --Vladis13 (обсуждение) 22:31, 23 февраля 2018 (UTC)
  • @Vladis13: увидел, что вы создали страницу Казаки (Толстой,1936). Предлагаю не создавать отдельные страницы по ПСС, а сразу заливать в имеющиеся (в данном случае в Казаки (Толстой)). Имеющиеся тексты и так взяты либо из ПСС, либо из собраний сочинений, которые перепечатывали все из ПСС (а откуда им еще тексты брать было). Незачем множить дубликаты. Ratte (обсуждение) 10:43, 24 февраля 2018 (UTC)
    • Там же по другому изданию и источнику. Я сразу спрашивал на форуме, что заливка будет дубликатной, и вы ответили что они отличаются, разные издания. Лучше давайте вопросом интеграции я заниматься не буду, вдруг какие-то конфликты с участниками радеющими за оставление обоих версий возникнут. Я займусь техн. частью. Заливаю-то всё ровно в индекс, в основном пространстве будут только включения. И вообще, сейчас рано об этом говорить, ибо надо проверить заливку (которой ещё нет). Также, разбиение на главы, как в имеющемся Казаки (Толстой) будет не скоро. - Надо секции в индексе расставлять, это вместе с другой чисткой. Вообще заливка томов может растянутся еще на месяц.
      • Ничего подобного я не говорил. См. Викитека:Форум/Архив/2017#"Весь Толстой": мои слова — «то, что есть, можно смело удалять/перезаписывать новой версией из 90-томника». Если будут конфликты, то тогда и будем обсуждать, а пока считаю нужным перезаписать непроверяемую копипасту с интернетов версией, основанной на сканах. Ratte (обсуждение) 11:23, 24 февраля 2018 (UTC)
        • А... это Lozman говорил, что лучше оставить обе редакции. Ну в общем, я больше индексами займусь. --Vladis13 (обсуждение) 11:51, 24 февраля 2018 (UTC)
          • Да, давайте. PS. Lozman говорил про проверяемые редакции. На мой взгляд, если редакция не основана на скане, ее нельзя назвать проверяемой. Даже РВБ не может гарантировать, что там не пропущено слово-другое: нет скана, чтобы это проверить. Про помойку az.lib.ru и говорить нечего. Я считаю, что мы все равно рано или поздно придем к позиции немецкой ВТ (нет скана — до свиданья), так что сохранять копипасту при наличии ПСС в индексах не вижу ни малейшего смысла. Ratte (обсуждение) 12:20, 24 февраля 2018 (UTC)
            • Таки да, но (оффтопик) как быть с МЭСБЕ для которых нет сканов? --Vladis13 (обсуждение) 12:26, 24 февраля 2018 (UTC)
              • Ключевое: при наличии индексов. Пока нет сканов и индексов — копипаста допустима, нужно ведь хоть что-то. Как только появляется индекс — непроверяемая копипаста должна быть немедленно заменена на версию со ссылками на сканы в левом поле. В этом весь смысл (и преимущество перед другими онлайн-библиотеками) проекта wikisource. Ratte (обсуждение) 14:05, 24 февраля 2018 (UTC)
                • Не припомню, чтобы я высказывался по этому поводу именно применительно к ПСС Толстого. Но моя точка зрения изложена вполне верно: оставлять, если проверяемо. А если есть уверенность, что альтернативная редакция — просто перепечатка с этого ПСС, то можно и на проверяемость особо не смотреть, а просто заменять на более авторитетное издание. — Lozman (talk) 22:54, 24 февраля 2018 (UTC)
Казаки (Толстой,1936) - пока черновик для проверки подключения Модуль:Отексте/Толстой, см. Обсуждение модуля:Отексте#Худож. произведения --Vladis13 (обсуждение) 11:06, 24 февраля 2018 (UTC)

Названия страниц[править]

Как называть страницы в основном пространстве? Например, есть Казаки (Толстой), как тогда назвать новую заливаемую редакцию, и переименовать имеющуюся? "Казаки (Толстой,1936)", или "Казаки (Толстой)/ПСС 1928—1958/СО" что приближённо к Справка:Руководство по размещению текстов#Названия статей, или иначе? И как называть категории, и разные подстраницы/шаблоны/модули? С каким префиксом, например "Полное собрание сочинений", "ПСС", "90-томник" (что не совсем корректно, ибо там 91 том)? --Vladis13 (обсуждение) 10:50, 24 февраля 2018 (UTC)

  • Никак не называть и не переименовывать, сразу заливать в имеющиеся (Казаки (Толстой), Война и мир (Толстой) и т.д.), без всяких префиксов. В данном случае я считаю излишним придерживаться системы различных редакций, поскольку все так называемые редакции основаны на ПСС или на перепечатках из ПСС. Что касается черновых вариантов и набросков, то они, строго говоря, вообще не являются редакциями, а являются по сути самостоятельными произведениями, очень часто отличающимися от окончательных вариантов, поэтому если их и нужно заливать (в чем пока у меня сомнения), то нужно называть их так, как они поименованы в ПСС, напр., Война и мир: Варианты (Толстой). Категории оставлять имеющиеся: Категория:Казаки (Толстой), при заливке отсутствующих произведений — создавать новые категории: Категория:Война и мир: Варианты (Толстой). Для шаблонов и модулей, если они нужны, можно создать служебную категорию вроде Категория:Полное собрание сочинений Льва Толстого:Служебные. Ratte (обсуждение) 11:19, 24 февраля 2018 (UTC)
    • Ok. Различные фрагменты, варианты, письма… думаю лучше тоже публиковать. Мы же заливаем Полное собрание сочинений Л. Н. Толстого, а не неизвестно чью подборку из Толстого, избранную неизвестно по каким критериями. --Vladis13 (обсуждение) 11:58, 24 февраля 2018 (UTC)

Статус заливки[править]

Залиты тома 1-8. --Vladis13 (обсуждение) 21:24, 25 февраля 2018 (UTC)

Обсуждение:Лев Николаевич Толстой/Смещения и секции в томах. — Список диапазонов страниц в индексах томов, и смещений относительно страниц книг. Обычно, на краях диапазонов расположены границы произведений. Соответственно, там следует располагать границы секций и указывать эти номера в тегах <pages>. --Vladis13 (обсуждение) 23:49, 25 февраля 2018 (UTC)

Том 20 неправильно залит (не на те страницы). Ratte (обсуждение) 19:53, 2 марта 2018 (UTC)

Поправил. Залил по 24 том. --Vladis13 (обсуждение) 05:33, 3 марта 2018 (UTC)

Бот добавил <div class="indent"> во все индексы, в том числе и туда, где эта строка уже была. В результате в томах 1—61 она повторяется два раза. Не будет ли проблем? Ratte (обсуждение) 12:19, 4 марта 2018 (UTC)

Поправил. --Vladis13 (обсуждение) 12:50, 4 марта 2018 (UTC)

По том 45. --Vladis13 (обсуждение) 19:00, 7 марта 2018 (UTC)

Хороший темп взяли. Индексы поправил до конца. Ratte (обсуждение) 19:32, 7 марта 2018 (UTC)
«Индексы поправил до конца.» — Отлично!
По заливке я попробую залить картинки, сконвертировав временные теги <img src...> в заливке в wiki-формат. --Vladis13 (обсуждение) 20:09, 7 марта 2018 (UTC)

Yes check.svg Сделано Залиты все 91 том. Пока текстовки сохраняю, на случай если спутаны где-то номера страниц и не залиты. --Vladis13 (обсуждение) 15:39, 8 марта 2018 (UTC)

Пожелания по заливке[править]

Текущие пожелания по заливке (по возможности). 1) Если на странице два и более заголовка, то каждый из них отдельно заключать в {{центр}}, без <br />, с пустой строкой между заголовками, плюс вместо {{right}} использовать {{right2}} (с отступом от правого края): Special:Diff/3137857. 2) Если на странице первая строка - красная, то перед ней должны быть две пустые строки (иначе красной строки не будет): Special:Diff/3138058. 3) Страницы с вставками нужно полностью освобождать от любого текста: он попадет в ОП даже со статусом «без текста». PS. Начинаю править индексы с дневниками и письмами. PPS. Не уверен, что вообще нужен br, а то получается что-то вроде такого. Ratte (обсуждение) 18:01, 26 февраля 2018 (UTC)

Добавил разделение заголовков по <br/>, +«right2».
А точно нужен ли class='indent'? Я как раз не стал добавлять, видя что и без него есть отступы абзацев. Вроде он теперь не нужен как и больше не используемый class «oldspell», не?
Нужен. Без него отступы не отображаются (у меня, во всяком случае). Ну и общая рекомендация есть: Справка:Вычитка#Создание индекса. Я добавил его в индексы 1—47, но в залитых томах нужно добавить его на каждую страницу ботом. Ratte (обсуждение) 19:54, 26 февраля 2018 (UTC)
Обнаружил, что технически этот css-класс абсолютно ничего не добавляет к уже имеющемуся. Викитека:Форум#class «indent» в индексе, давайте подождём комментариев. --Vladis13 (обсуждение) 20:16, 26 февраля 2018 (UTC)
Отступы в верхнем абзаце добавлю. Без «indent» достаточно одного перевода строки.
Удалять текст нежелательных страниц не нужно! Просто указать их в параметре exclude= тега «pages» для исключения из показа. Справка:Включение#Параметры команды.
Согласен, что «br» не нужен вообще. Просто там «каша» с конвертацией html в wiki. Я оставил его временно, до последующей чистки на полуавтомате. --Vladis13 (обсуждение) 19:36, 26 февраля 2018 (UTC)

На заметку для дальнейшей чистки: в томе 40 убрать курсив в заголовках, в томе томе 42 и остальных {{right}} заменить на {{right2}}. Ratte (обсуждение) 19:40, 7 марта 2018 (UTC)

Для дальнейшей чистки: в томе 6 и остальных вики-заголовки == == заменить на {{центр}}. Ratte (обсуждение) 11:51, 15 марта 2018 (UTC)

Менять ли <center>————</center> на что-либо? Менять ли тег <center></center> на {{центр}}? --Vladis13 (обсуждение) 12:56, 15 марта 2018 (UTC)

Иллюстрации[править]

Что делать с иллюстрациями? Текущие их названия просто наборы символов вроде «956748904579.png». Залить их на Commons в таком виде ботом, и потом переименовать? Или куда-то временно на сторонний хостинг, кто-то будет ими заниматься и загружать вручную? Многие из картинок — это изображения страниц скана, например, титульных страниц (думаю ненужны, в индексе и так показывается изображение страницы скана), таблиц (не распознан текст), страницы написанные на церковно-славянском. --Vladis13 (обсуждение) 12:11, 15 марта 2018 (UTC)

Ещё есть нюанс, что в заливке ширина картинок задана в процентах, а wiki понимает только в пикселях. Оставил закомментированные проценты. --Vladis13 (обсуждение) 12:11, 15 марта 2018 (UTC)
Заливайте все ботом на commons, в отдельную категорию. Потом переименуем, а если что-то лишнее, выставим на удаление. Таблицы тоже заливайте, в Азбуке некоторые таблицы настолько головоломные, что проще картинкой вставить. Церковнославянский тоже лучше картинками, он не у всех поддерживается, нужно заморачиваться со вставкой спец. шрифтов, что не все умеют (пример — у меня половина символов отображается как квадратики). Лицензию указать как в томах ПСС (напр.). Ratte (обсуждение) 12:23, 15 марта 2018 (UTC)