Обсуждение Викитеки:Проект:ТСД/Архив/2

Материал из Викитеки — свободной библиотеки
Перейти к навигации Перейти к поиску
Эта страница содержит завершившееся обсуждение. Не изменяйте её. Новое обсуждение можно создать на другой странице.
Stop hand nuvola.svg

Содержание

Развитие/заливка словаря[править]

В продолжение темы на Википедия:Вниманию участников. Порыл интернет. В электронном виде везде выложено переиздание 1998 года (в современной орфографии, без графического оформления, с мелкими изменениями расположения слов) 2-го издания, инфа о нём. Судя по сверке некоторого текста, именно оно залито в викитеку. Других вариантов нет. (Хотя на сайтах попадалось нечто похожее на 3-е издание, но не проверял.) Создавать вручную (переписывать/выверять/вычитывать) каждое из 3-х основных изданий Даля, по несколько томов в каждом, по тысяче страниц в каждом, и создавать отдельные страницы для каждого слова (суммарно в 3х изданиях примерно 300 тыс. слов)… — это фантастика сродни межзвёздным перелётам. Это невозможно сделать для 1-2 иногда активных участников проекта.

Поэтому, лучше уже залитую близкую к оригиналу адаптированную версию пометить как не вычитанную (перелить в Индекс?), но она без оформления.

На «Яндекс.Словари» выложена частичная версия, с частично уже восстановленным графическим оформлением и разделением на отдельные словарные статьи. Судя по моей сверке некоторых фрагментов текста, это переформатирование вышеупомянутого издания. Возможно для многих случаев проще и быстрее будет не сверять с оригиналом с нуля, а скопировать с сайта html-код (заменив тэги оформления на википедийные в текстовом редакторе или спец.программой) и потом уже вычитывать. Вариант — выкачать версию с оформлением и рубрикацией по отдельным словарным статьям из «Яндекс.Словари», или другого сайта уже сделавшего это. Но это вопрос уже к ботоводам — существует несложный софт для выкачки сайтов, но не ясно как заливать в викитеку, тем более массово, с созданием страниц. --Vladis13 (обсуждение) 14:16, 19 июля 2015 (UTC)

Одно другому не противоречит. Можно делать эти два дела параллельно (продолжать работу над отдельными статьями и улучшать ранее залитую версию). Проблема только в одном - предельно мало активных и заинтересованных участников. А здесь нужен был бы целый коллектив. Может быть надо дать объявление в проекте Википедия. В общем, подключайтесь. Добро пожаловать! Dmitrismirnov (обсуждение) 15:03, 19 июля 2015 (UTC)
Прежде чем делать ботозаливку, нужно доделать ТСД/Словник, добавив все недостающие слова. Без полного словника ни один из ботоводов не возьмется. А доделывать его можно только вручную. Hausratte (обсуждение) 18:19, 19 июля 2015 (UTC)
Если заливать отдельно второе издание, надо бы делать словник отдельно, назвав его, допустим ТСД2/Словник. Dmitrismirnov (обсуждение) 19:14, 19 июля 2015 (UTC)
@Dmitrismirnov: Поскольку вы объединяете в каждой статье ТСД/ все три редакции, то не вижу особого смысла в отдельных словниках по изданиям (тем более, что они на 90% будут дублировать друг друга и вести на одни и те же статьи). Будет замечательно, если вы закончите существующий словник — тогда можно будет предметно говорить о ботозаливке. Hausratte (обсуждение) 19:56, 19 июля 2015 (UTC)
В разных редакциях словники весьма отличаются друг от друга. В этой электронной (по 2 изданию) всего 44 тысячи слов и они даны только в современной орфографии. (В 3 издании слов в где-то в 3-4 раза больше и многие статьи разделены на несколько). К сожалению почти во всех интернетных выкладках все слова написаны заглавными буквамм, что трудно приводить к нормальному виду. Я нашёл одно, правда нормальное, это здесь: http://slovonline.ru/slovar_dal/b-0/p-1/ (но неизвестно насколько он полный). Dmitrismirnov (обсуждение) 20:10, 19 июля 2015 (UTC)
2-е издание в переиздании 1998 г. выложено на http://vidahl.ru (компания-оцифровщик, с которой оцифровка разошлась по интернету, приводит на сайте именно этот сайт). Лучше вариант — оригинал переиздания есть в формате .doc (торрент). Вроде регуляркой в текст.редакторе несложно скопировать из него список слов, сегодня сделаю. --Vladis13 (обсуждение) 13:55, 20 июля 2015 (UTC)
Но у меня есть некоторые сомнения по поводу качества всех этих словарей - в них нет ударений и нет никакого нормального оформления... Dmitrismirnov (обсуждение) 20:15, 19 июля 2015 (UTC)
@Dmitrismirnov: Мне все равно не совсем понятно, почему нельзя использовать словник 3-го издания для заливки 2-го. Предположим, в словнике 2-го издания есть слова А, Б, В, а в словнике 3-го — слова А, Б, В и Г (где В и Г — это разбитая на части статья В из 2-го издания). Делается ботозаливка, создаются статьи А, Б и В, в которых указывается, что это 2-е издание. Впоследствии вы дополняете статьи А, Б и В 3-м изданием, при необходимости редактируете, добавляя ударения и т. д., и создаете статью Г. В чем именно проблема? Hausratte (обсуждение) 20:20, 19 июля 2015 (UTC)::
Это большая работа. Одному не справиться, нужна серьёзная помощь. Списки нужно создавать отдельно, так как принцип их составления отличается от того, что используется в основных списках. Я называю здесь их так: В-доп, Г-доп, Д-доп, и т. д., где "доп" = дополнительный. Я создал полный список для буквы Э: Э-доп -- это можно уже "заливать". По этому примеру необходимо создать подобные списки для каждой буквы. Я сейчас работаю над списком для буквы Б: Б-доп. Списки можно брать, например, здесь: В Г Д, etc. Проблема в том, чтобы преобразовать прописные буквы в строчные: БУКВА в ТСД/Буква. Dmitrismirnov (обсуждение) 08:46, 20 июля 2015 (UTC)
В текст.редакторе notepad++ регистр букв в тексте заменяется просто (меню > правка > пробраз.регистр). Подстановки типа «БУКВА» в «ТСД/Буква» делаются в том же редакторе регулярками. --Vladis13 (обсуждение) 13:55, 20 июля 2015 (UTC)
В MS Word с текстом поудобнее, регулярки поддерживает; notepad++ вылетает - слишком большие файлы 16/30Мб. --Vladis13 (обсуждение) 06:10, 21 июля 2015 (UTC)
В любом случае словники составлять необходимо. Если у Вас имеются эти программы, было бы весьма ценно, если бы Вы проверили и помогли с составлением этих списков. Пока что приходится их редактировать вручную. -- Dmitrismirnov (обсуждение) 16:04, 20 июля 2015 (UTC)
Другой вопрос, надо ли для ботозаливки разбивать файл по словарным статьям на отдельные файлы для каждой? Или бот может брать из одного текстового файла, руководствуясь метками в нём. Надо ли конвертить текст в размеченный формат .csv, понимаемый наверно любым софтом и Excel? --Vladis13 (обсуждение) 13:55, 20 июля 2015 (UTC)
Это, наверное, лучше на форуме ботоводов в ВП спрашивать, здесь вряд ли ответят. Сначала надо словники составить. Hausratte (обсуждение) 14:46, 20 июля 2015 (UTC)
Загрузил словники: «СТРОЧНЫЕ БУКВЫ» и «ТСД/ЗаглавноСтрочные», вытащены из оригинального .doc файла, не с сайтов. Убраны названия-дубликаты, большая их часть в оригинале содержится в одной словарной статье, например «Ага» и «Ага»; могу сделать отдельным списком если надо (400 штук). В основном названия сделал как выделено жирным шрифтом в оригинале, например: в оригинале «Эбеновое дерево» — сделано «Эбеновое», «Абаз, абас» — соответственно оба слова, много вроде «Поглуздай-ка» — «-ка» убрано из названия. --Vladis13 (обсуждение) 06:10, 21 июля 2015 (UTC)
Спасибо! Это очень ценно. Теперь надо подумать как совместить все эти варианты. Есть ли у Вас конкретный план действий? Dmitrismirnov (обсуждение) 11:10, 21 июля 2015 (UTC)
Я хотел бы эту уже залитую и частью поправленную версию 2-го изд. скопировать в Индекс, пометив как «не вычитанную». Например, фрагмент включающий слово «лекарь» и соседние, на соответствующую страницу индекса в раздел «современная орфография».
По ботозаливке. Вроде есть хорошая функция заливки в AWB, проверил в ВП, но чтобы работало здесь — тоже нужен флаг AWB, и для массовых заливок — флаг бота. Вобщем, подумаю над созданием заявки на флаг, тогда выкачать каким-нить парсером с викитеки это частично поправленное переиздание 98года, сконвертить текстовку в файл CSV, и залить в индекс. --Vladis13 (обсуждение) 20:07, 21 июля 2015 (UTC)
Подал заявку на получение прав AWB. --Vladis13 (обсуждение) 13:22, 22 июля 2015 (UTC)
Я обнаружил, что в Ваш список проникли те же ошибки, что бытуют в интернете. Например: ТСД/Батвить —  во всех интернетных публикациях словаря напечатано Батвит —  ошибочно!!! я проверил по бумажным изд. первых трёх редакций. Dmitrismirnov (обсуждение) 11:18, 21 июля 2015 (UTC)
Интересно, что это за "переиздание 1998 года" -- это бумажное или электронное издание? Лучше ли оно, чем то, что у нас уже здесь имеется? Проставлены ли там ударения. Для многих пользователей (в том числе для меня) словарь Даля без ударений в словах имеет мало смысла. Dmitrismirnov (обсуждение) 11:18, 21 июля 2015 (UTC)
Электронной версии с проставленными ударениями не существует. Единичные ошибки вполне возможны, они были в самом doc-файле, часть поправил вручную, просто надо переименовать при сверке.
Сделаны дополнительные словники для букв Б, В, Г, Е и Э. Dmitrismirnov (обсуждение) 16:16, 21 июля 2015 (UTC)

Совр.орфография от переизд. 1998 года по 2-му изданию[править]

Что за переиздание98 — писал в первом комментарии темой выше, именно оно залито в викитеку, Яндекс (у них дубликат - предисловие из .doc, причём издательство/год не указали), интернеты. Издание явно было бумажным, однако за давностью лет инфы не найти. Поиск выдаёт другое переиздание того же «Цитадель», 1998 — репринт 4-го издания Бодуэна. Видимо, они в тот год выпустили этот репринт, и адаптацию 2-го издания, по которому инфа затёрлась репринтом. Переиздание выложено в свободный доступ (см. данные ранее ссылки) на Яндексе и, как официально-бесплатный словарь, в коммерческой системе словарей Lingvo, да и сайта у издания давно нет (нет и в интернет-архиве). Даже имён авторов адаптации не сохранилось, не то что лицензионного соглашения. Искал по текстовым фрагментам переиздания98, вдруг этому издательству приписали чужую адаптацию, — нет, находятся только они. Вобщем, «все концы в воду». --Vladis13 (обсуждение) 20:07, 21 июля 2015 (UTC)

  • Из предисловия к этой адаптации:

    При подготовке данного переиздания мы решили адаптировать Далев Словарь, исходя, в частности, из того, что вряд ли каждому из нас с вами по силам набрать слово для поиска не только в старой, дореформенной графике, но и в специфической орфографии В. И. Даля. Предлагаемая републикация выполнена на основе II издания (1880—1882 гг.) и не сохраняет графических и части орфографических особенностей издания. В нашей попытке приблизить текст к современным нормам мы соблюдали принципиальные требования автора. Характерные написания диалектных слов, авторская стилистика и пунктуация оставлены без изменений. В частности, позволив себе перерасположить словарные статьи в порядке современного алфавита, мы сохраняем написание и, соответственно, место некоторых словарных единиц, даже если это противоречит современным нормам в том случае, когда В. И. Даль пытался такой записью показать звучание или происхождение объясняемого слова. Рядом, в угловых скобках, мы поместили это же слово в нынешнем его виде, напр. шеромыжник <шаромыжник>.

    В предисловии Яндекса первая фраза изменена на «При подготовке этого электронного переиздания» и добавлены абзацы (2 предпоследних), про наличие оформления (жирный шрифт, курсив, петит), которое однако в версии Яндекса добавлено совсем немногим словам. // А вообще, у меня подозрение, что Яндекс забросил эту трудоёмкую работу. По многим словам словаря, яндекс не выдает ничего, хотя в основе были, наверно просто были удалены и никто не присматривает. --Vladis13 (обсуждение) 12:52, 22 июля 2015 (UTC)

Ошибочные статьи[править]

Редакторы этого словаря весьма своевольно обращались с оригинальным текстом. Вот что я только что обнаружил

  1. ТСД/Батюшка Статьи с таким названием в оригинальных бумажных изданиях словаря Даля нет. Перенесено сюда редакторами интернетной версии 2 издания (1998) из середины статьи СНЕГ. прим. ред. Викитеки. Dmitrismirnov (обсуждение) 22:20, 21 июля 2015 (UTC)
Это ошибка версии которая заливалась (похоже бралась отсюда), а не в самом переиздании98 — в doc-файле ошибки нет. (Вообще явная ошибка, ибо «батюшка» тут слово из одной поговорки, некорректно так называть целый раздел. В doc это абзац с новой строки, но как отдельная статья не выделен. Видимо они скриптом делали разделы деля по абзацам, а не по оформлению.) Обнаружил ещё несколько ложных статей, надо просто текст перенести в правильное место. (Эту перенёс.) --Vladis13 (обсуждение) 21:15, 29 августа 2015 (UTC)
Также например в doc-файле данное предложение было разделено абзацем

Сидейки хаживали из Москвы в Сергиевскую
Лавру, до железной дороги. | Сиделка,

Но в интернет-версии слово "Лавру" скрипт посчитал отдельным термином, раз оно с нового абзаца, стало две статьи: обрезанная и "статья" Лавру.
Памятка: 1. При исправлении заголовков вносить изменения также в список Участник:Vladis13/СловникДаль 2-е изд.,переизд.1998 - Заглавные-и-строчные,сТСД,без дубликатов. После обработки, ещё раз сравнить имеющиеся в викитеке заголовки с данным списком, должны быть идентичны. 2. Также скорректировать ТСД/Словник, сделанный на его основе - по истории правок списка начиная со вчерашнего дня. Для ботозаливки.
    • @Vladis13: ! Ведреный -- эта статья в оригинале отсутствует, я проверил по скану: Страница:Толковый словарь Даля (2-е издание). Том 1 (1880).pdf/267 Dmitrismirnov (обсуждение) 05:44, 15 сентября 2015 (UTC)
      • Она в Ведерный (на этой же странице скана), перенёс. Однако заметьте, в скане она отмечена жирным но не курсивным шрифтом, так отмечаются отдельные статьи, поэтому в переиздании98 вобщем верно отделили. Но пусть будет как в скане. --Vladis13 (обсуждение) 07:38, 15 сентября 2015 (UTC)
        • Спасибо! Да, Вы правы, я только что нашёл это сам, и хотел было уже давать отбой, но Вы уже нашли и приняли решение: оставить так, как в оригинале. Точно также это напечатано и в 1 издании, но в 3-ем издании это несовершенство исправлено. --Dmitrismirnov (обсуждение)
  • Ошибочная статья Пола - отсканирована частично с текстом неизвестного происхождения. Статья Нос отсутствует в doc-файле, вроде на вид идентична скану. --Vladis13 (обсуждение) 07:53, 15 сентября 2015 (UTC)

Соответствие переизданию или скану?[править]

@Dmitrismirnov: Заметил вы приводите переиздание98 в соответствие со сканом ТСД. Кое-где меняете служебные слова в современном написании на то как они были написаны в скане (вроде современного «междомет.» на «мждм.», «перм.» на «прм.» и т. п.). У меня некоторые сомнения в нужности таких изменений, например, в скане «итд», но правильней для современного написания «и т. д.».

И касательно переноса в переиздание написания из индекса. Получается, что оно становится аналогом планируемой ботозаливки на отдельные страницы, только тут тоже самое будет на одной странице. Вроде обсуждали, чтобы не делать двойную/тройную работу залить на отдельные страницы, после чего это переиздание закрыть от редактирования (пометив как архив, шаблоном и т. п.). Как вы думаете? --Vladis13 (обсуждение) 09:54, 15 сентября 2015 (UTC)

Поскольку Вы проделали огромную работу по упорядочиванию этого переиздания98, оно стало гораздо лучше, чем было, и место ему не в архиве а в открытом доступе на Викитеке. Придальнейшей доработке им будет удобно пользоваться наряду с вариантом, разбитым на отдельные статьи. Так мне кажется. Dmitrismirnov (обсуждение) 20:48, 15 сентября 2015 (UTC)
На мой взгляд, после ботозаливки следует выставить переиздание98 на удаление как дубль. И итог должен подводить Lozman как нейтральный администратор. Роль «всех статей на одной странице» должен выполнять словник. Hausratte (обсуждение) 20:59, 15 сентября 2015 (UTC)
Извините, если это создаёт сложности. Я просто обнаружил несколько серьёзных ошибок в некоторых статьях: напр. в статье "Ведро" вместо слова "хлеб", стояло "хлед" и т. п., не говоря уже об оформлении, которое почти везде не соответствует печатному изданию. Поэтому я и решил поставить исправленные тексты, вместо несверенных с источником. Источником я считаю только печатное издание. Что касается так наз. "переиздания98", то я не уверен, что оно когда-либо существовало в напечатанном на бумаге в опубликованном виде. Если я неправ, то поправьте меня. И если эти мои изменения на страницах мешают Вашим планам, можно (пока) вернуть предыдущий текст. Сокращения я привожу по оригинальному источнику, они достаточно понятны для современного читателя, и большой необходимости их переделывать («междомет.» на «мждм.», «перм.» на «прм.» и т. п.) я не вижу. Dmitrismirnov (обсуждение) 10:14, 15 сентября 2015 (UTC)
Ок. Просто надо было обговорить нюанс, а то непонятка. --Vladis13 (обсуждение) 11:46, 15 сентября 2015 (UTC)
И кроме того, при ботозаливке словаря нужно как-то исключить из общего списка те статьи, которые уже существуют в виде отдельных статей. А как раз те статьи, которые я добавил сегодня, слеланы не только на общих страницах, но также в виде отдельных статей. Dmitrismirnov (обсуждение) 10:37, 15 сентября 2015 (UTC)
Я планирую пока залить буквы, по которым нет статей вообще. По другим, в боте есть опция "пропускать если страница существует", поэтому перезаписи не случится. --Vladis13 (обсуждение) 11:46, 15 сентября 2015 (UTC)
А разве есть такие буквы? Dmitrismirnov (обсуждение) 11:50, 15 сентября 2015 (UTC)
  • Внёс дополнение в шаблон заливки. Текст статьи буду обрамлять тэгами <section begin="termin1" /> <section end="termin1" />, как в индексе. Читателю его не видно, не мешает, а при ручном и автоматическом переносе в индекс с ним удобство, и для бота крайне полезный ибо помечает начало и конец нужного фрагмента. --Vladis13 (обсуждение) 23:03, 17 сентября 2015 (UTC)
В принципе, могу его вставить прямо в "переиздание98", будет ещё удобней, ибо текст берётся оттуда. Сделать? --Vladis13 (обсуждение) 23:03, 17 сентября 2015 (UTC)

Копирование переиздания98 в Индекс[править]

Вопрос, что делать с переизданием98? Перенести в Индекс, и текущую версию удалить? Или оставить две версии - распознавание оригинала в современную орфографию + перездание98? --Vladis13 (обсуждение) 13:00, 22 июля 2015 (UTC)

  • Я бы не торопился удалять версию, над которой уже проделано столько работы (частичное оформление, сверка с оригиналом, проставление ударений и т. д.). Удалить это будет разумно, когда будет выложена эта работа в более совершенном виде. Так что я за то, чтобы пока оставить обе версии. Dmitrismirnov (обсуждение) 13:13, 22 июля 2015 (UTC)
  • @Vladis13: В индекс надо переносить в любом случае. Сканы 2-го издания распознаны довольно неважно, доводка текста на их основе займет кучу времени. Давайте сначала перенесем в индекс худо-бедно сделанную электронную версию. Hausratte (обсуждение) 13:25, 22 июля 2015 (UTC)
Это и предлагаю. А существует ли общая страница, куда выводятся страницы из Индекса 2-го издания? Например, эта страница индекса/оригинала выводится только на словник и словарные статьи, например сюда, но не выводится на статью типа этой, где, как в книге, все статьи на одной странице. --Vladis13 (обсуждение) 13:40, 22 июля 2015 (UTC)
Индекс:Толковый словарь Даля (1-е издание). Часть 1 (1863).pdf -- Вы имеете в виде это? Dmitrismirnov (обсуждение) 13:47, 22 июля 2015 (UTC)
Вроде этой, Или такой вывод в викитеке не применяется, предпочтительны отдельные страницы для каждой словарной статьи? --Vladis13 (обсуждение) 14:13, 22 июля 2015 (UTC)
Создаются отдельные страницы для каждой статьи. Формат, при котором на одной странице много статей, используется только в пространстве «Страница», например. Hausratte (обсуждение) 14:16, 22 июля 2015 (UTC)
Грязная версия не основана на индексе через тег pages, там просто сразу вставлен текст. Поэтому страницы из индекса-2 выводятся только на статьи с префиксом ТСД/. Hausratte (обсуждение) 13:45, 22 июля 2015 (UTC)
Если копировать переиздание98 в индекс-2, то будут две копии, которые участники будут править в обоих местах. Двойная идентичная ненужная работа. Может в грязную версию ставить тег pages с индекса-2? Или переименовать понятно, — что это именно адаптация 98года, а не адаптация скана редакторами викитеки, т.е. две разных версии? --Vladis13 (обсуждение) 14:00, 22 июля 2015 (UTC)
Двойной работы не надо... Может быть тогда старую версию поместить в архив (на всякий случай для возможной сверки)? Dmitrismirnov (обсуждение) 14:08, 22 июля 2015 (UTC)
@Vladis13: Я не вижу особой двойной работы. Индекс надо делать в любом случае, его для этого и создавали, и текст там будет правиться согласно скану и выводиться в статьи ТСД/ через тег pages. Грязная версия - это временная версия, над ней вообще не нужно работать, и по создании статей ТСД/ ее надо будет удалить. Hausratte (обсуждение) 14:15, 22 июля 2015 (UTC)
А можно закрывать на редактирование, с уведомлением сверху, что мол «правьте оригинал /ссылка/»? И при копировании где-то помечать, какие словарные статьи копировались, чтобы к их редактированию закрывать доступ. --Vladis13 (обсуждение) 14:19, 22 июля 2015 (UTC)
Можно повесить на все страницы грязной версии плашку {{Перерабатываю}}, ботом (@Lozman:). Помечать не обязательно, просто повесить плашку и все (там вообще ничего не нужно править, работа в корзину). Потом удалить. Hausratte (обсуждение) 14:29, 22 июля 2015 (UTC)
Можно повесить такое объявление {{Недействующая редакция документа}}, или сделать нечто подобное на этой основе. 14:36, 22 июля 2015 (UTC)
Может быть есть возможность сделать новый индекс основанный на более читаемом скане с разделением на левую и правую колонки? - пока здесь всё смешано в полном беспоряде. Dmitrismirnov (обсуждение) 13:50, 22 июля 2015 (UTC)
Зачем? Если Vladis13 перенесет в имеющийся индекс-2 обработанную электронную версию, там работы будет - просто добавить на ее основе ДО-версию и все. Индекс-1 я сейчас переделаю - скачал из РГБ более качественные сканы. Hausratte (обсуждение) 13:53, 22 июля 2015 (UTC)
Мне кажется, что если Vladis13 это и сделает, что было бы замечательно конечно, это всё же будет достаточно далеко от оригинала... Dmitrismirnov (обсуждение) 14:05, 22 июля 2015 (UTC)
В любом случае это будет лучше, чем сейчас. Можно, конечно, ждать, пока Hinote вернется, но я не знаю, когда это будет. А работать лучше уже сейчас, пока к проекту есть какой-то интерес. Hausratte (обсуждение) 14:09, 22 июля 2015 (UTC)
Hinote сказал, что он ничего не может с этим сделать... Dmitrismirnov (обсуждение) 14:11, 22 июля 2015 (UTC)
Ну тогда тем более надо переносить. Hausratte (обсуждение) 14:15, 22 июля 2015 (UTC)
  1. В Индексе словарные статьи расположены по своим страницам оригинала. В выложенном перездании98 число словарных статей на интернет-страницах какое-то иное. Чтобы заливать в индекс, надо оглавление сделать — какие словарные статьи на какие номера страниц индекса заливать. Вижу не лучший вариант: рубрикация по буквам, которое есть в оглавлении томов, например в томе 1-м буква Б со стр. 32 (это 122 стр. индекса) по 161 стр. Хоть какая-то привязка. Может на каких-то сайтах есть словник привязанный к страницам скана, чтобы «велосипед не изобретать»? --Vladis13 (обсуждение) 04:37, 26 июля 2015 (UTC)
  2. Был залит словник, как понимаю часть слов в нём исправлена, нужен обновлённый список. Из этого списка убрать статьи, которые уже залиты (в теории можно будет AWB прогнать список, просто пропуская существующие.)--Vladis13 (обсуждение) 04:37, 26 июля 2015 (UTC)
Страницы в оригинале расположены по алфавиту в дореформенной орфографии, а в выложенном перездании98 —  по алфавиту в современной. Разница большая, поскольку сама орфография, порядок букв и их количество в обоих алфавитах существеноо отличаются. В основных списках я исходил из оригинала. Я уже писал, что сделал дополнительные словники для букв Б, В, Г, Е и Э - это надо будет продолжить и сделать для всех остальных букв. Работа эта трудоёмкая, если делать вручную. Dmitrismirnov (обсуждение) 05:47, 26 июля 2015 (UTC)
В словнике смешано 2-е и 3-е издание? Например в Б-доп части статей может не быть во 2-м издании? --Vladis13 (обсуждение) 18:24, 26 июля 2015 (UTC)
Заливка в индекс невозможна без списка привязки словника к страницам индекса (неясно что и куда заливать). По беглому поиску в интернет не нашёл, похоже никто составлением пословного оглавления скана не заморачивался. Вручную ~3000 страниц просматривать и делать оглавление… уйма труда.
В энциклопедии ЭСБЕ примерно такое же титаническое число словарных статей как во 2-м изд. Даля, но там с индексами вообще не заморачивались: индекс пустой, статьи сделаны обычным способом. Наверно смысла нет делать также, — переливать переиздания98 на отдельные страницы для каждой словарной статьи, «менять шило на мыло»? Надо обязательно в индекс? --Vladis13 (обсуждение) 15:58, 26 июля 2015 (UTC)
Как мне кажется, все статьи интернетного переиздания98 имеются во втором издании словаря. Но расположение их отличается от книжного издания в силу того, что мы уже обсудили. Например, ТСД/Бегать, ТСД/Беда, ТСД/Бедный и т. п. находятся в самом конце буквы Б так как в оригинале вторая буква не "е", а "ѣ" Бѣг, Бѣгать, Бѣда, Бѣдный. В букве "Б" только одна статья ТСД/Батюшка -- перенесена сюда из статьи на букву "С" -- ТСД/Снег что очень странно и малообоснованно. Остальные статьи из списка в Б-доп имеются в индексе 2-го издания (я проверил первые 1230 статей) Dmitrismirnov (обсуждение) 20:15, 26 июля 2015 (UTC)
Только сейчас заметил, что в списках первых букв которые не «-доп» частично есть номера страниц, пример ТСД/Словник/В. А что значит «-доп», современный порядок слов? --Vladis13 (обсуждение) 17:42, 27 июля 2015 (UTC)
«-доп» означает "дополнительный", чтоб не путать с основным списком, который делается по 3-му изданию словаря. В основном списке везде указываюься страницы индекса. Я создал сегодня полный список Э-доп, в котором тоже указаны страницы индекса, и все слова расположены в том же порядке, что и в оригинальном издании. Прошу внимательно его посмотреть. Я обнаружил, что редакторы интернетного издания, переводя текст в современную орфографию, допустили несколько серьёзных ошибок в заглавиях статей. Я всё это подробно прокомментировал в словнике. Dmitrismirnov (обсуждение) 18:07, 27 июля 2015 (UTC)
Сделал шаблон {{pag2}} для удобной подстановки пагинации в словник (вместо такой длинной записи) для 2-го издания. UPD: Сделал аналогичный {{pag3}} для 3-го. --Vladis13 (обсуждение) 03:15, 29 июля 2015 (UTC)
Что «доп» — «дополнительный», в совр. и оригинальной орфографии разный порядок слов, возможны ошибки в адаптации98… — это понятно, уже обсуждали. Вопрос в другом: «-доп» — это 2-е издание с порядком слов по оригиналу, а без «-доп» — по 3-е изданию? --Vladis13 (обсуждение) 18:18, 27 июля 2015 (UTC)
Да! Dmitrismirnov (обсуждение) 18:46, 27 июля 2015 (UTC)
Не, путаница... ТСД/Словник/Б-доп - должно быть 2-е издание, как сказано выше, вроде много статей залито-сделано, а жму там например ТСД/Бесповоротный - это из 3-го издания. И также по другим буквам. --Vladis13 (обсуждение) 00:46, 28 июля 2015 (UTC)
Синие ссылки ТСД просто не трогайте. Заливайте только туда, где красные. Hausratte (обсуждение) 20:27, 28 июля 2015 (UTC)
@Vladis13: Ну так залейте переиздание98 сразу «обычным способом» в основное пространство (отдельная страница ТСД/ для каждой словарной статьи), ботом. Индекс можно не трогать, если с ним такие проблемы. Только при такой заливке надо будет поставить в каждой статье ссылку на скан в РГБ, как это сделано в РБС. Hausratte (обсуждение) 20:49, 26 июля 2015 (UTC)
Проблема, что пространство ТСД/Слово уже занято 3-м изданием. Программы заливки могут только добавить текст в конец (под нижние шаблоны и категории), начало, или перезаписать страницу. Код имеющихся страниц с 3-м изданием, например см. код ТСД/Бесповоротный, содержит шаблон-заголовок с источником "3-е изд" и нижние шаблоны. Заливка текста вниз под категории и нижний шаблон не комильфо. (Может можно что-то придумать с регулярками и двойным проходом, чтобы после заливки при повторном проходе смещать шаблоны и тэг pages 3-го издания вниз страницы под залитый текст.)
Кроме этого обнаружилось, что словник например ТСД/Словник/Б-доп, содержит не 2-е изд, а 3-е, непонятно какие статьи уже залиты. Сделать дополнительное пространство ТСД-2/ с 44 тыс. статей, параллельно ТСД/ с 3-м изданием с 220 тыс. статей? (Во всей викитеке всего 313 тыс. статей.) Можно было бы взять словник, что я недавно делал взятый из переиздания98 и заливать по нему, но вероятно заливка наткнётся на вышеупомянутые страницы со статьями из 3-го издания.
Ещё приведу цифры: в AWB (без прав бота) при работе на автопилоте минимальная (upd: автозапись правок не доступна без прав бота) пауза между страницами 30 секунд, заливка 44 тыс. статей займёт 366 часов = 15.2 суток непрерывной работы компьютера, не считая прогрузок. Реально если считать заливку в личное свободное время — это займёт полгода минимум, не говоря о том что за массовые заливки не с бот-аккаунта прав AWB лишат. Вроде при получении прав бота можно снизить паузу, при паузе 5 секунд = займёт 61 час. (К слову, в 3-м издании 220 тыс. статей — это в 5 раз больше и дольше.) Сложность, что всё постоянно меняется — правится словник, выложенное переиздание98, поэтому видимо надо работать по каждой букве отдельно и циклично. (Что вносит кучу мороки, по подготовке каждой текстовки по отдельности, вместо всего текста сразу. - Парсинг, потом в Word там менять несколько регулярок, конвертить в CSV, Excel, сверка со словником, опять туда-сюда несколько программ... и так по каждому загружаемому фрагменту каждой буквы.)
Или всё же лить в индекс - вручную указатель статей составить (список с пагинацией). Но 44 тыс.статей на 3 тыс. страниц... я за такое не возьмусь. :) --Vladis13 (обсуждение) 02:07, 28 июля 2015 (UTC)
Ещё вариант, просто улучшать залитое переиздание98, там всего ~850 страниц. Пока словник улучшается. Если дело до заливки дойдёт, не надо будет текст форматировать. Привести в приличный вид страницы, где словарные статьи не имеют заголовков (пример отсюда ниже) и где первое слово словарных статей перенесено (а не скопированно) в заголовок, примеры там же. Это просто. Только я не уверен, надо для этого аккаунт бота, всё же быстрые массовые правки. --Vladis13 (обсуждение) 02:07, 28 июля 2015 (UTC)
@Vladis13: «Проблема, что пространство ТСД/Слово уже занято 3-м изданием» — боюсь, я вас не совсем понял. Пространство ТСД/ «занято» 3-м изданием примерно на 10%, остальных слов просто нет. Остальные 90% что мешает ботом залить? См., напр., ТСД/Словник/Г-доп — берете и заливаете, где красные ссылки. В чем проблема? Hausratte (обсуждение) 20:11, 28 июля 2015 (UTC)

Статус обработки[править]

  1. Созданы заголовки, отсутствовавшие у множества словарных статей.
  2. Нормализована проблема, что у большинства статей отсутствовали термины (первые слова-заголовки статей).
  3. Оформление терминов нормализовано: шрифт из заглавных букв в строчный и выделены жирным. (Решилась скачкой, обработкой самописным скриптом и перезаливкой.)
  4. Объединены статьи, разделённые на абзацы. (Как в оригинале.)
  5. Ряд замен, "|" → ″||″.
Желательно, если нетрудно, заменить ″||″ на {{!}}{{!}}, чтобы они могли работать внутри текстов с "выступом" (как в 1 и 2 издании) и внутри других шаблонов. Я уже однажды об этом писал где-то здесь. Dmitrismirnov (обсуждение) 19:55, 8 сентября 2015 (UTC)
Сделано. --Vladis13 (обсуждение) 23:56, 8 сентября 2015 (UTC)

Обработка с переносом фрагментов текста сделана. Следующий этап: вставка тэгов оформления для типичных специальных слов, описанная 1-2 разделами ниже. После максимально возможного автообработкой уподобления переиздания98 оригиналу можно будет делать ботозаливку. --Vladis13 (обсуждение) 05:20, 16 августа 2015 (UTC)

6. +Оформление терминов гнёзд (в жирный курсив).
7. +Служебные слова в курсив и в петит-курсив.

Остальной текст не формализован, поэтому распознать по каким-то признакам определённые фрагменты для оформления нет возможности. Это: поговорки (выделяются курсивом) и термины гнёзд (жирным курсивом), их только вручную. --Vladis13 (обсуждение) 08:24, 22 августа 2015 (UTC)

8. Обнаружились ещё кое-какие массовые закономерности, 2 недели оформлял их.
9. Заменены дефисы на тире (как в оригинале), коррекция пунктуации. Убраны ударения из заголовков разделов (некорректно, усложняют создание ссылок, есть в самих статьях). --Vladis13 (обсуждение) 17:25, 8 сентября 2015 (UTC)
Я не уверен, что в оригинале дефисы заменены на тире. Покажите, пожалуйста конкретные примеры. Dmitrismirnov (обсуждение) 19:58, 8 сентября 2015 (UTC)
Любая страница скана, например, том 3 стр.5, «Пай» — «—щица», «—ница» — сделано также, там же «В паю — в бою». Естественно, где дефис между словами, как в Афанасия-ломоноса, там он и должен быть, не менял. --Vladis13 (обсуждение) 21:41, 8 сентября 2015 (UTC)
А, теперь понятно! Это Вы правильно исправили. Линия перед окончаниями типа: «—щица», «—ница» — это не дефис, и не тире по своей функции, но, я даже не знаю как назвать... символическое сокращение первой части слова. Dmitrismirnov (обсуждение) 22:43, 8 сентября 2015 (UTC)
10. Заголовки заглавными буквами → в строчные.
@Dmitrismirnov: думаю перевести заголовки в строчные буквы. Единственное основание их нынешнего написаны заглавными - что так было в переиздани98, где было удалено оригинальное оформление текста, и регистр букв был единственным способом выделения терминов. Не вижу причин так оставлять, к тому же усложняет работу (создание ссылок, списков и т.д.). Что думаете? --Vladis13 (обсуждение) 20:39, 9 сентября 2015 (UTC)
Согласен, в строчные, но начиная с заглавной, как в оригинале, не правда ли? Dmitrismirnov (обсуждение) 23:48, 9 сентября 2015 (UTC)
Сделал. (Хотя стало непривычно, заголовки оформлением дублируют термины, в глазах двоиться.) --Vladis13 (обсуждение) 09:33, 10 сентября 2015 (UTC)
Когда добавятся ударения, эти заголовки и начальные слова в статьях в своём большинстве будут всё же как-то различаться. Dmitrismirnov (обсуждение) 12:38, 10 сентября 2015 (UTC)
А что если сменить уровень заголовков? (Число "=====".) Сейчас они 5 уровня - мелкий шрифт, но выравниваются по левому краю в отличие от 2-4 уровней. Пример с 3 уровнем. --Vladis13 (обсуждение) 19:16, 10 сентября 2015 (UTC)
Да, так, конечно, нагляднее. Можете поменять на 3 уровень, если Вам так больше нравится. (Но по большому счёту, названия эти не нужны совсем -- в оригинале они отсутствуют. Если бы можно было здесь обойтись без них или сделать их невидимыми, было бы лучше... Как Вы думаете?) Dmitrismirnov (обсуждение) 21:15, 10 сентября 2015 (UTC)
Уровень заголовков изменён. --Vladis13 (обсуждение) 06:23, 12 сентября 2015 (UTC)
Технически это просто сделать с помощью якорей, просто заменив ===== Заголовок ====={{якорь|Заголовок}}. Но это будет непонятно читателям пытающихся создать ссылку, и удалит блок Содержания, сделав невозможным поиск статьи через него и удобный переход, удалит кнопки редактирования разделов. Поэтому лучше не надо. В принципе, якоря можно использовать для создания ссылок на гнёзда, но это тоже «на любителя». --Vladis13 (обсуждение) 01:00, 12 сентября 2015 (UTC)
  • Сделал пример невидимых заголовков с помощью css-стилей. Оглавление при этом остаётся, также остаётся крайне важные кнопки «править» раздел (на примере не видны по причине, что пример является отменённой правкой). Можно было бы сделать шаблон, который вставлять вместо заголовков (например {{h|Ведро}}), а он бы подставлял «=== ===» и тэги стиля. Однако, всплывает другой недостаток — для читателя неясно как делать ссылку, ведь обычно ссылки делают просто копируя заголовок, хотя иногда копируется ссылка из оглавления. Что думаете? --Vladis13 (обсуждение) 06:38, 12 сентября 2015 (UTC)
Честно говоря, я не знаю. Выглядит это хорошо, но если это создаёт неудобства, то лучше не надо. Удобство важнее. Dmitrismirnov (обсуждение) 10:25, 12 сентября 2015 (UTC)
11. Доделан и проверен словник: Викитека:Проект:ТСД/ТСД2-98 - Словник. Дополнительный список неоднозначностей: Викитека:Проект:ТСД/ТСД2-98 - Словник-омонимы. --Vladis13 (обсуждение) 08:55, 15 сентября 2015 (UTC)
12. Сделан шаблон {{tom}} для заголовков. --Vladis13 (обсуждение) 18:36, 15 сентября 2015 (UTC)
13. Залит пяток статей на пробу на буквы "Яш". @Dmitrismirnov: проверьте пожалуйста. Нужны какие-то коррективы? --Vladis13 (обсуждение) 18:44, 15 сентября 2015 (UTC)
Да, нормально. Можно продолжать. Понятно, что ударения, оформление и ссылки на страницы скана надо будет делать потом от руки. Но это следующий этап, так сказать... Dmitrismirnov (обсуждение) 19:37, 15 сентября 2015 (UTC)
Ура, наконец-то! С почином. Hausratte (обсуждение) 20:09, 15 сентября 2015 (UTC)

Извлечение пагинации из колонтитулов скана[править]

Для заливки в индекс необходимы номера страниц на которые заливать статьи. Оказывается они есть в колонтитулах скана, рядом с номерами страниц, в формате "статьяпервая - последняя номерстраницы". Как бы только их распознать в FineReader, без остального текста? --Vladis13 (обсуждение) 10:53, 1 сентября 2015 (UTC)

  • Попробовал, но тоже проблемы: Плохое распознавание. Там не названия статей, а гнёзда (например, не статья «Авось», а её гнездо «авосьничать»). Тратится куча времени на распознавание не только колонтитула, а всей страницы (что не отключить). В результате получается строка <p>7</p><p>Авангурйиный—авоеьничать.</p><p>8</p>, на приведение которой в норму +другие описанные трудозатраты, потратится усилий больше чем, на просто написание этого вручную (или ещё проще — перетаскивания диапазона мышкой из словника). Также необходим словник статей, с которым сравнивать этот диапазон, словник есть только для 2-го издания. --Vladis13 (обсуждение) 14:33, 25 сентября 2015 (UTC)

Статьи-редиректы[править]

≈10 % словарных статей — это редиректы-синонимы на другие статьи в формате «Термин, см. Другойтермин». Например: «Забороздить, см. заборазживать.» или «Забросать, забросить, заброс и пр. см. забрасывать.» От 44000 статей 10 % это ≈5000 лишних статей. Лишняя нагрузка для викитеки, за которой надо будет следить, при этом на них никто не будет ссылаться. Т. е. польза от них даже не нулевая, а отрицательная. Понятно, что необходима копия всего оригинала где-то в индексе. Но отдельные статьи бесполезны, ибо термин-синоним уже содержится в основной статье, и ищутся статьи обычно через поисковик. Может сделать список таких статей-редиректов? Их формат прост для автоматического распознавания. --Vladis13 (обсуждение) 10:02, 10 сентября 2015 (UTC)

Думаю, можно сделать и отдельную страницу, куда построчно их выложить, со ссылками на основные статьи. Т. е. не 5000 статей из 5 слов, а например страниц 10 по 500 строк? --Vladis13 (обсуждение) 10:01, 10 сентября 2015 (UTC)
Статьи-перенаправления должны быть обязательно сохранены, такова общая практика во всех словарях, выложенных в ВТ. С аргументом про лишнюю нагрузку не согласен категорически: в ВТ и так довольно мало контента по сравнению с другими вики-проектами, заниматься ненужной экономией места нет смысла. Hausratte (обсуждение) 12:17, 10 сентября 2015 (UTC)
Уточню на случай если плохо пояснил мою идею. Я не предлагаю что-то удалять, а просто при ботозаливке не делать пустых, по сути, статей. При этом их контент потерян не будет, а просто будет на одной странице построчно, например:

Забороздить, см. заборазживать.

Забросать, забросить, заброс и пр. см. забрасывать.

Термин, см. Другойтермин

--Vladis13 (обсуждение) 19:26, 10 сентября 2015 (UTC)
Я вас прекрасно понял. То, что вы называете «пустыми статьями» — это статьи-перенаправления, они в ВТ аккуратно переносятся из источника (напр., Категория:ЭСБЕ:Перенаправления — таких статей около 16 тыс.). На одной странице они не нужны, они нужны постатейно. И непонятно, откуда вы взяли, что такие статьи-перенаправления не нужны. Вам, может, и не нужны, а другим нужны. Hausratte (обсуждение) 22:46, 10 сентября 2015 (UTC)
Тогда надо будет сделать аналогичную категорию для ТСД. Насчёт нужности не вижу ни единой пользы, но ок. --Vladis13 (обсуждение) 20:22, 11 сентября 2015 (UTC)
Рад, что вы прислушались :) Категория уже есть: Категория:ТСД:Перенаправления. Hausratte (обсуждение) 21:55, 11 сентября 2015 (UTC)

Статьи-омонимы[править]

Имеется много статей, являющихся омонимами соседних. Например: Ведро и Ведро 2. При этом, почти в каждой обычной статье среднего размера в толковании есть несколько омонимов не вынесенных в отдельные абзацы; примеры прямо ниже приведённого «Ведра», например Векша это: белка, сорока, каток в бытовой механике.
Мне кажется омонимы надо приводить в одной статье, под одним заголовком, разделять просто абзацем, это наглядно, пример: А. Не делать на отдельных страницах, где часть омонимов будет в толковании, а часть на другой странице. К тому же, значения часто близко связаны, в данном примере с Ведром, во втором значении (о дожде) приведены поговорки имеющие прямую связь с первым значением (о посуде): «Не ситечком сеет, ведром поливает (дождь). Придет пора, польет, что из ведра.» --Vladis13 (обсуждение) 05:09, 12 сентября 2015 (UTC)

  • @Dmitrismirnov, Hausratte: какие мнения? Надо что-то решить по данному пункту, чтобы доделать словник. --Vladis13 (обсуждение) 11:40, 13 сентября 2015 (UTC)
    • Я думал об этом, и у меня были сображения и за и против разделения этих одноимённых статей. Вопрос немного сложнее, чем кажется на первый взгляд. Поскольку я в основном занимался 3 изданием Словаря, я решил для себя точно следовать его плану, создавая для каждой статьи отдельную страницу. Я объясню свои соображения чуть позднее. Dmitrismirnov (обсуждение) 13:13, 13 сентября 2015 (UTC)
      • Ну раз делать, тогда делать. В каком формате называть? "1 Ведро" и "2 Ведро", или цифра сзади, иначе? --Vladis13 (обсуждение) 14:08, 13 сентября 2015 (UTC)
        • Отвечаю на ваш вопрос: в заголовке статьи я добавляю цифру после слова, чтобы в списке категорий статья попадала на правильную букву: "Ведро 1" и "Ведро 2", а не на цифру. Dmitrismirnov (обсуждение) 15:29, 13 сентября 2015 (UTC)
          • Однако внутри статьи в начале текста следует ставить цифру перед словом, как в 3-ем издании словаря: "1. Ве́дро" и "2. Ведро́" -- при этом жирным выделять слово, но не цифру. -- Dmitrismirnov (обсуждение) 15:41, 13 сентября 2015 (UTC)
            • Ниже вы привели пример, где для первого омонима название "Бес" и для второго "Бес 1". Цифра в заголовке и в статье перед термином должна совпадать, т.е. не быть в заголовке "Бес 1" а в тексте "2. Бес". Думаю правильней помечать и первый термин, считая с единицы, как в примере с "Ведро". --Vladis13 (обсуждение) 16:53, 13 сентября 2015 (UTC)
              • Может быть. Потом можно переделать. Dmitrismirnov (обсуждение) 18:11, 13 сентября 2015 (UTC)
              • @Vladis13:!!! Но всё это касается только 3-го издания. Во втором же издании, как мне кажется, в текст словарных статей ничего этого вносить не надо, а следовать точно печатной (бумажной) версии, воспроизводить её как можно ближе к оригиналу. Dmitrismirnov (обсуждение) 12:07, 14 сентября 2015 (UTC)
                  • Хм... Я уже сделал, пример. Убрать? --Vladis13 (обсуждение) 12:22, 14 сентября 2015 (UTC)
                    • @Vladis13:!! Я сказал: "как мне кажется"... То есть мы должны это решить вместе с Вами. Мне кажется, что текст статьи должен быть таким, как в оригинале. Заголовка статьи это не касается, в нём мы спокойно можем добавлять то, что ститаем необходимым. Если мы с Вами что-то вносим в сам текст статьи, например, нумрацию, нужно как-то дать понять читателю, что это добавлено редактором викитеки. Я до сих пор делал так: (1.) с примечанием: Добавлено ред. викитеки. Согласны ли вы с этим, и если нет, что Вы можете предложить? Dmitrismirnov (обсуждение) 13:02, 14 сентября 2015 (UTC)
                      • Вы поставили "!!!", показывая важность замечания. Я согласен, лучше убрать из статьи. Ибо необходима идентичность оригиналу, +номер значения есть в заголовке. Если будет отдельная статья для 2-го значения, и там цифра 2, особенно если нет ссылок на 1-е значение, читатель не поймёт что за "2". --Vladis13 (обсуждение) 13:25, 14 сентября 2015 (UTC)
                      • В других словарях в ВТ у заголовков-омонимов есть уточнения. В виде "Омонимпервый, в физике" и "Омонимвторой, в литературе". Во 2-м издании их немного - 920 шт., список есть Викитека:Проект:ТСД/ТСД2-98 - Словник-омонимы, при желании можно будет переименовать. --Vladis13 (обсуждение) 13:32, 14 сентября 2015 (UTC)

Основное соображениe то, что в 3 издании была проделана серьёзная работа по упорядочиванию и разделению статей, которые в первых двух изданиях объединяли различные понятия . Мне показалась такая работа логичной. Иван Бодуэн де Куртенэ в Предисловии подробно объяснил и обосновал эти изменения. Приведу только две цитаты:

« Выше я упомянулъ, что иногда мнѣ приходилось выдѣлять изъ гнѣздъ цѣликомъ и безусловно отдѣльныя слова, попавшія туда только по смѣшенію понятій или же по недоразумѣнію. Но я не ограничивался выдѣленіемъ отдѣльныхъ словъ, а то и дѣло просто разбивалъ гнѣзда и изъ одного дѣлалъ два или даже болѣе. Такъ напримѣръ:

Изъ одного гнѣзда Аба́зъ 2-го изданія у меня получились два: Абаза́ и Аба́зъ.

Изъ одного гнѣзда Аˊвва у меня два: Аˊвва и Авваку́мовщина.
Изъ одного гнѣзда Адони́съ у меня два: Адони́съ и Адони́ческій-стихъ.
Изъ одного гнѣзда Аля́кишъ у меня два слова: Аля́кишъ и Аля́люшки.
Изъ одного гнѣзда Ахъ 2-го изданія у меня вышли два: Ахва́, и Ахъ.
»
« Одинаково написанныя слова (графическіе гомонизмы), — кромѣ, впрочемъ, ударенія, которое можетъ быть различно, — если они являются начальными (заглавными) словами отдѣльныхъ словарныхъ статей или, по Далю, гнѣздъ, снабжены мною, для отличія и для точности ссылокъ, порядковыми цифрами (числами): 1, 2, 3 ...

Такъ напримѣръ:

1. А, 2. А,
1. Ага́, 2. Ага́,
1. Адъ, 2. Адъ, и т. д.
»

Конечно можно было бы вернуться назад к принципам первых двух изданий и объединить на одной странице все «статьи-омонимы».

Но здесь возникают две или три проблемы:

  1. Это займёт много времени и сил, так как сделано уже более 7400 страниц словаря. Кто возьмётся за это дело? Поскольку этим занимаются только 1-2 участника и обчёлся, мне такое решение кажется нереальным.
  2. Как быть со словами, которые в дореформенной орфографии омонимами не считаются, например «Миръ» и «Міpъ», или «Бесъ» и «Бѣcъ». Подобные слова могут находиться рядом друг с другом (и потому объединяться на одной странице) только в словарях в соременной орфографии. Здесь же выбрано расположение словарных статей по оригиналу в дореформенной орфографии и потому они расположены в самых разных местах, а иногда даже начинаются с разных букв, например: ѣ, е и э; и, і и Ѵ; ф и Ѳ и т. д. Какое может быть решение это проблемы?

и т. п. Пока я выхожу из этого положения, добавляя ко второму из этих слов в названии статьи цифру 1:

в дореформенной орфографии: / в соременной орфографии:

Dmitrismirnov (обсуждение) 15:24, 13 сентября 2015 (UTC)

  • Вопрос скорее в надобности, чем в сложности ручной реализации. Ботом можно сделать много рутинных задач.
  1. В других словарях в ВТ вроде есть категории для страниц неоднозначностей (дизамбигов), т.е. для страниц со списками омонимов. Гипотетически можно сделать также в ТСД, но поскольку в 3-м издании 270 тыс.терминов (потенциальных статей), и разделом выше о статьях-синонимах сказано страниц-списков не делать... - То это задача с очень низким приоритетом, ибо имеет мало смысла и нереальна по трудозатратам. Технически можно было бы написать скрипт для создания списка терминов, совпадающих с другими терминами допустим по первым 4 буквам. Хотя в таком списке будут тысячи слов, где вначале не достаточно уникальный корень, а приставка, например "пере-" - всяческих слов с такой приставкой тыщи. Можно было бы сделать фильтры для самых распространённых длинных приставок, но это лишняя морока, и какие-то не приставочные слова тоже отфильтруются (например "перец, переправа", или для "воз-" - "воздух, вознесение, возможность").
  2. Омонимы которые отличаются и значением и написанием (омографы) думаю правильно помещать в отдельные статьи. Но то что они говорятся идентично (омофоны) их сближает. По идее, для таких слов правильней на страницу добавить раздел "См. также" и там ссылку на омоним, или вверху шаблон "У этого слова есть другие значения" и ссылку на дизамбиг или на конкретную статью.
Давайте тогда пока я сделаю для омонимов названия с цифрой? Потом, если дело дойдёт до заливки, помечу созданные статьи с ними категорией "ТСД/Неоднозначности". А потом, если захочется, думаю будет не сложно опять же ботом перелинковать эти статьи-омонимы. --Vladis13 (обсуждение) 16:33, 13 сентября 2015 (UTC)
Да, Вам виднее. Я ботом не владею, и потому не могу об этом судить. Делаем пока так, а потом решим. Dmitrismirnov (обсуждение) 18:14, 13 сентября 2015 (UTC)

Дозаливка[править]

@Dmitrismirnov: Пожалуйста не снимайте и не добавляйте категории Категория:ТСД:Ботозаливка 2 изд. и Категория:ТСД:Без статей из 2-го издания. Дозаливку приходится делать по сложному алгоритму. (Я писал, что многое прописано в разных местах и шаблонах страниц, что доставляет массу неудобств, поэтому требуется много проходов, для увязки друг с другом каждого элемента.) Надеюсь сегодня отстаток долить, поправить, и эти категории уберу. --Vladis13 (обсуждение) 16:51, 30 сентября 2015 (UTC)

Понял. Не буду Вам мешать, пока Вы не закончили ботозаливку. Dmitrismirnov (обсуждение) 18:33, 30 сентября 2015 (UTC)

Разнобой размера шрифта в скане[править]

В оригинальных сканах присутствует разнобой размеров шрифтов, часто в одной фразе. Быть может это было ошибкой или небрежностью в типографиях рубежа 19-20 веков. На дублирование их тратится большая часть сил и времени. При этом читателю это не надо, в словарях (например Lingvo и Яндекс) опускается. Мне кажется это только для мимолётного интереса ценителей раритетных шрифтов — но пусть они тогда смотрят оригинальный скан. По сути, о чём сказано и у Яндекса (2 предпоследних абзаца) в словарных статьях есть конкретные элементы: термин, его варианты, трактовка, служебные слова (род, часть речи, место употребления), фразеологизмы-примеры (поговорки и пословицы); и есть конкретные типографские шрифты для выделения этих элементов: жирный шрифт, курсив, разрядка, крупный шрифт и петит. Может унифицировать эти элементы? А то зачастую получается разброд вроде: «Поговорка слов1 слово2 слово3 слово4 последнее слово поговорки.» И кстати, тогда можно и с помощью AWB/ботов быстро править орфографию, например автозаменой «перм.» на «перм.», можно было бы и список подобных правил прописать. --Vladis13 (обсуждение) 14:47, 22 июля 2015 (UTC)

А ещё в современных адаптациях заменено «м.» и «ж.» на «муж.» и «жен» соответственно. Современному читателю зачастую, чтобы понять сокращения надо отдельно искать раздел пояснения сокращений у Даля. Это надо приводить в современную форму? --Vladis13 (обсуждение) 14:47, 22 июля 2015 (UTC)
Моё мнение такое: это не разнобой, а глубоко продуманная система. Каждое такое изменение в шрифте имеет свой смысл. Все нестандартные сокращения лучше оставлять, как в оригинале - для них имееются короткий (в начале) и развёрнутый (в конце) списки сокращений. Но на данном этапе, если поставить целью просто воспроизвести текст данной электронной версии как можно полнее и быстрее, это можно ПОКА игнорировать. А в идеале, если думать о качестве, всё это следует воспроизвести с максимальным приближением к оригиналу. Dmitrismirnov (обсуждение) 15:11, 22 июля 2015 (UTC)
Это не ошибка и не небрежность. ТСД был весьма известным изданием, печатали его тщательно, да и если бы было ошибкой — не повторялось бы из страницы в страницу и из издания в издание. Если Даль счел, что нужны такие шрифты — значит, так и надо, не нам за него цензурить, что оставлять, что нет, и не нам решать за всех читателей, кому нужны шрифты, а кому не нужны. В введении к словарю есть объяснение всех шрифтов. «Но пусть они тогда смотрят оригинальный скан» — ну тогда и Викитека не нужна, пускай все смотрят оригинальные сканы. Яндекс с Лингво не авторитеты, они выложили Даля довольно неряшливо. Нужно полное соответствие оригиналу, в т.ч. и в сокращениях. Hausratte (обсуждение) 15:13, 22 июля 2015 (UTC)
(комментарий) Во всяком случае, то, что сейчас определяемые слова в вычитываемом 3-м издании оформляются тегом <big>...</big> не соответствует скану-оригиналу. В оригинале, скорее всего, используется просто жирный шрифт. А, в принципе, имхо, да, вариации шрифта в тексте желательно сохранять при вычитке/оцифровке. -- Badger M. (обсуждение) 15:26, 22 июля 2015 (UTC)
Ну посмотрите оригинал. Как раз большой шрифт. Hausratte (обсуждение) 15:29, 22 июля 2015 (UTC)
Да, в заголовках статей это большой и чуть более жирный шрифт. Я стараюсь максимально приблизить шрифты к оригинальным, насколько позволяют возможности викитеки, но это удаётся не всегда. В оригинале это ещё более сложно, например, там имеется более высокий и узкий шрифт, которого здесь воспроизвести не удалось. Dmitrismirnov (обсуждение) 15:54, 22 июля 2015 (UTC)
Я уже смотрел и вычитывал несколько страниц. Викитечному тегу <big> никак это не соответствует. -- Badger M. (обсуждение) 15:56, 22 июля 2015 (UTC)
PS. Ниже привели ссылку на пояснение по поводу шрифтов -- так там явным образом заголовочный шрифт гнёзд статей охарактеризован просто как жирный [точнее самый жирный, хотя не оч. ясно, что в контексте это означает], а далее поясняется, что жирный текст разрядки -- мельче размером. Что касается разрядки, то в соотв. шаблоне {{razs}}, как понимаю, отмеченное уменьшение размера шрифта обработано (стоит 95%). -- Badger M. (обсуждение) 22:47, 22 июля 2015 (UTC)
В 3-м издании есть пояснение каким шрифтом отмечаются какие элементы статьи. Всего задумывалось авторами 6 шрифтов + обычный. Про большие шрифты там не сказано, если только жирный заголовков считать одновременно и большим. Во 2-м издании нет подобного пояснения и объяснения сокращений. --Vladis13 (обсуждение) 18:49, 22 июля 2015 (UTC)


Если говорить о высоте букв, то Вы, пожалуй, правы. Но видно даже невооружённым глазом, что все буквы в заголовках статей не только жирнее, но как минимум раза в полтора шире обычных и потому выглядят гораздо крупнее их. Как это точно воспроизвести в простых используемых нами на Викитеке шрифтах я не знаю. Но мне кажется, выбор тега <big> для заголовков и <small> для петита, успешно решает эту проблему. Если Вы с этим не согласны, предложите своё решение. Dmitrismirnov (обсуждение) 23:19, 22 июля 2015 (UTC)
(мнение) Есть шаблон {{fs}} (= Font-size). С его помощью можно более аккуратно подстраивать размер шрифтов, чем просто тегами big и small. Возможно, для заголовков статей жирный шрифт где-то размера 105%—115% был бы в данном случае более подходящим вариантом [если просто жирный шрифт 100%-размера не может подойти]. (Кроме того, я бы предпочел не использовать class oldspell, но это уже, видимо, менее принципиально) -- Badger M. (обсуждение) 12:06, 23 июля 2015 (UTC)
Абецадло.png
Вот сводная таблица размеров шрифтов. Какой, по-вашему больше подходит для заголовков статей?
1. Текст 150%, 2. Текст 125%, 3. Текст big, 4. Текст 120%, 5. Текст 115%, 6. Текст 110%, 7. Текст 100%, 8. Текст 90%, 9. Текст 80%, 10. Текст small.
Сейчас это выглядит так:
[Аˊбзацъ м. Тип. Начало текста съ новой или красной строки. || Архит. Уступъ, обрѣзъ въ каменной стѣнѣ. Ак.].
Абана́тъ, абану́съ? (об?) м. пск. упрямецъ, своевольникъ; [своенравіе Опд.]. Абану́сливый, —систый? упрямый, своенравный.
Dmitrismirnov (обсуждение) 14:07, 23 июля 2015 (UTC)
Я не берусь в точности сказать, свое мнение в целом я уже высказал. Отображение может зависеть от браузера, используемой темы оформления. Свойства шрифта для каких-то классов в личных настройках участника, вообще говоря, могут быть переопределены.
В оформлении ТСД, как я сейчас понял, идут вперемешку шрифты с засечками и без засечек (без засечек -- в шаблоне {{razs}}, общий стиль, определяемый class oldspell -- с засечками), а визуальный размер шрифта даже определенного одного размера зависит от семейства шрифтов (с засечками или без; т.е. уменьшение размера до 95% в шаблоне razs может быть обусловлено выравниванием размеров шрифтов разных семейств (?)).
Могу сказать более-менее определенно, что размер текста big у меня визуально близко соответствует тексту 125% (а у вас big помещен между 115% и 120%) [вероятно, причина в разных браузерах; смотрел в Opera 12]. -- Badger M. (обсуждение) 14:57, 23 июля 2015 (UTC)
Я переделал таблицу, но не вижу большой разницы между 3. Текст big и 4. Текст 120%, а 2. Текст 125% мне всё же кажется чуть крупнее. Но не в этом дело. По мне то что есть (с тэгом <big>...</big>) меня вполне устраивает, но Вам не нравится. Мне хочется, чтобы Вы показали мне пример того, что Вы считеете идеальным соотношением шрифтов. Вот, например, статья. Отредактируйте её шрифты так, чтобы Вас это устраивало (Dmitrismirnov (обсуждение) 15:14, 23 июля 2015 (UTC)):
Абана́тъ, абану́съ? (об?) м. пск. упрямецъ, своевольникъ; [своенравіе Опд.]. Абану́сливый, —систый? упрямый, своенравный.
или
Абана́тъ, абану́съ? (об?) м. пск. упрямецъ, своевольникъ; [своенравіе Опд.]. Абану́сливый, —систый? упрямый, своенравный.
Так я и не возражаю, что у вас big выглядит иначе -- это зависит, предполагаю, скорее всего, от вашего браузера. По мне, идеальный вариант пока -- это 100% или 105% жирный шрифт (отредактировал для примера; 1-й вариант -- 100%, 2-й -- 105%). -- Badger M. (обсуждение) 15:37, 23 июля 2015 (UTC)


Спасибо. Видимо, Вы правы, проблема наверное в том, что в разных браузерах и на разных экранах шрифты эти выглядят по-разному. К сожалению, в моих двух браузерах (Google Chrom & Fire Fox) оба Ваши варианта выглядят неудовлетворительными по двум причинам: 1) ширина букв в заголовках мало отличается от обычного шрифта (а в оригинале буквы заголовка шире существенно - раза в полтора); 2) следующие за заголовком слова, выделенные прямым жирным шрифтом без засечек выглядят значительно крупнее самого заглавия - а в оригинале наоборот -- они мельче). Dmitrismirnov (обсуждение) 16:11, 23 июля 2015 (UTC)
По поводу перемешивания шрифтов с засечками и без (пункт 2) я уже написал (не знаю, что с этим делать в общем случае; либо пытаться подстраивать величину шрифта без гарантии на получение приемлемого результата, либо радикально отказаться от перемешивания). По поводу пункта 1 (но и как общее замечание): полное воспроизведение типографики в html -- это, на мой взгляд, утопическое дело, чем-то все равно приходится пренебрегать (вам в данном конкретном случае важна ширина, а мне, получается, высота шрифта, а вместе это в простейшем варианте, выходит, пока не выглядит реализуемо). Желаю успехов. -- Badger M. (обсуждение) 16:35, 23 июля 2015 (UTC)

@Badger M.:! Кажется я нашёл как примирить это противоречие: уменьшил размер шрифта в шаблоне {{razs}} с 95% до 85% (!!!), и теперь жирный прямой шрифт у меня выглядит не больше, чем простой жирный текст. Таким образом, можно отказаться от примерения тега <big>...</big> для заголовков статей. См.ТСД/Эдакий/ДО / ТСД/Эдакий. Меня интересует Ваше мнение. Скажите, хорошо ли это выглядит на Вашем экране? Dmitrismirnov (обсуждение) 16:17, 25 июля 2015 (UTC)

Автоматическое оформление текста[править]

Предлагаю правила для автоподстановки тэгов оформления в «черновом» тексте, чтобы уменьшить ручную рутину. В 3-м издании есть пояснение каким шрифтом отмечаются типичные служебным слова. Имеется также объяснение сокращений в 3-м изд., во 2-м издании нет объяснения сокращений, сокращения из переиздания98. Предлагается заменять оформление типичным служебным словам. Примечания:

  • При ручной работе в редакторе браузера, или в другом оффлайн-редакторе, используется виджет «поиск и замена». В нём, для обрамления тэгом < small > искомых подстрок:
    1. Включить «Считать строку поиска регулярным выражением».
    2. В поле «найти» скопировать выражение: ([\s\n])(м\., латн\.|мждмт\.|сев\. вост.|почти то же, что,|то же;|\[м\.\] ошибч\.|ж\., фрн\.|м\.|ж\.|ср\.|греч\.|латн\.|лат\.|политч\.|католич\.|врчб\.|матем\.|нем\. воен\.|нем\.|воен\.), где "|" разделены искомые подстроки из списка ниже без начальных пробелов. Внимание, знаки препинания, кроме некоторых типа «,;», по правилам регулярных выражений должны экранироваться символом «\», например «\[м\.\]».
    3. В поле «заменить на» скопировать: $1<small>$2</small>..
  • Заменять при условии, что такого оформления там ещё нет, и делать это как предварительную работу на невыверенных страницах.
  • Проверять на наличие уже проставленных тэгов в подстроке. При ручной обработке это надо визуально смотреть по каждой замене, при работе в каком-то софте, например в MS Word или AWB, можно настроить автопроверку.
  • Если замена идёт не предлагаемым выше способом, то учитывать пробел перед словом, иначе замена «м.» захватит и другие слова кончающиеся на эту букву с точкой.
  • Сначала лучше указать более широкие правила, например « м. латн.», а только затем частность вроде просто « м.» и «латн.», чтобы избежать излишка тэгов в одной последовательности, вроде: «<small>м.</small>, <small>латн.</small>».
 м., латн. => <small> м., латн.</small>
мждмт. => <small>мждмт.</small>
 сев. вост. => <small>сев. вост.</small>
почти то же, что, => <small>почти то же, что, </small>
 то же; => <small>то же;</small>
[м.] ошибч. => <small>[м.] ошибч.</small>
 ж., фрн. => <small>ж., фрн.</small>
 м. => <small>м.</small>
 ж. => <small>ж.</small>
 ср. => <small>ср.</small>
греч. => <small>греч.</small>
латн. => <small>латн.</small>
 лат. => <small>лат.</small>
политч. => <small>политч.</small>
католич. => <small>католич.</small>
врчб. => <small>врчб.</small>
матем. => <small>матем.</small>
 нем. воен. => <small>нем. воен.</small>
 нем. => <small>нем.</small>
воен. => <small>воен.</small>
 ряз. тмб. => <small>''ряз. тмб.''</small>
 ряз. => <small>''ряз. тмб.''</small>
тмб. => <small>''ряз. тмб.''</small>
ярс., прм. => <small>ярс., прм.</small>
ярс. => <small>ярс.</small>
прм. => <small>прм.</small>
мжд. => <small>мжд.</small>
кмч. => <small>''кмч.''</small>
морск. фрнц. => <small>морск. фрнц.</small>
морск. => <small>морск.</small>
фрнц. => <small>фрнц.</small>
''влд.'' то же. => <small>''влд.'' то же.</small>
как немецк. => <small>как немецк.</small>
нар. ''уф.'' => <small>нар. ''уф.''</small>
вост. тмб. => <small>вост. тмб.</small>
нвг. => <small>нвг.</small>
 вят.</small> => <small>''вят.''</small>
(Наум.). => <small>(Наум.).</small>
(на длинной). => <small>(на длинной).</small>
укорно: => <small>укорно:</small>
или: => <small>или:</small>
 ж., ''арх.-шнк.'' => <small>ж., ''арх.-шнк.''</small>

--Vladis13 (обсуждение) 19:54, 27 июля 2015 (UTC)


Ну что ж, будем надеяться, что это получится. Dmitrismirnov (обсуждение) 21:09, 27 июля 2015 (UTC)
Добавил выше регулярку для редактора браузера для ручной автозамены. --Vladis13 (обсуждение) 21:52, 27 июля 2015 (UTC)
Есть одна тонкость в отношении сокращения ср. Оно используется в двух разных смыслах: 1) ср. петитом означает средний род. 2) Ср. обычным шрифтом означает сравни со словом таким-то. Dmitrismirnov (обсуждение) 21:13, 27 июля 2015 (UTC)

Другие автозамены[править]

Жирный шрифт для первых слов с абзаце.

Поисковая регулярка: (\n\s*)([-А-ЯЁа-яё]+)(\W), заменить на $1'''$2'''$3

Автозамены
яросл.-мол. => ярс.-мол.
Курсив
ярс.-мол.
влд.
кмч.
арх.-шнк.
уф.
вят.
ряз. тмб.
ряз. 
тмб.

--Vladis13 (обсуждение) 21:04, 29 июля 2015 (UTC)


Тройная навигация[править]

Здесь показано три разных версии навигации между предыдущий/следующий:

  1. Во многих случаях одной навигации достаточно,
a) если данная статья и смежные с ней статьи имеются во всех трёх изданиях, напр. ТСД/Абдикация, ТСД/Абдраган,
б) либо, если данная статья и смежные с ней статьи имеются только в 3-ем издании, напр. ТСД/Аангич
  1. В других случаях нужна навигация двойная, напр. (если смежные с данной статьёй статьи отсутствуют в первых двух изданиях): ТСД/Абажур, ТСД/Абаз, и т. п.
  2. Но вот тот случай, когда необходима тройная навигация (по причине отсутствия какой-либо статьи в одном из трёх изданий): ТСД/Абанат ТСД/Абапал ТСД/Аббат -- Dmitrismirnov (обсуждение) 09:47, 31 июля 2015 (UTC)

Расположение ссылки на источник[править]

Перенесено с Форума Dmitrismirnov (обсуждение) 09:10, 31 августа 2015 (UTC)

Имеются страницы, со словарными статьями из 1-3 изданий словаря Даля. Непонятно, где располагать ссылку на издание. Есть 3 возможные позиции: 1. в поле «Источник» шаблона {{ТСД}} (основан на шаблоне {{Отексте}}), 2. в [номерах страниц] слева от словарных статей, и 3. заголовками над статьёй. При размещении во всех 3-х позициях получается избыток идентичных ссылок, особенно когда на странице статьи из 2-3 изданий, пример офомления. В поле «Источник» шаблона: вроде общепринято, и если сделать в шаблоне специальные поля для пагинации (номера тома и страниц), даже если их не отображать, это упрощает различные последующие обработки ботом. В заголовках словарных статей: улучшает визуальное разделение статей разных изданий. Вопрос важен, ибо планируется ботозаливка многих тысяч статей с выбранным оформлением. --Vladis13 (обсуждение) 21:11, 31 июля 2015 (UTC)

  • Оставьте позиции 1 и 2. В заголовках различных редакций ссылки излишни, в таких случаях оформляется по типу БСЭ1/А или ЭСБЕ/Альморавиды и Альмогады. В случае с Далем: оставляете заголовки «1-е издание, том 1 (1863)», «2-е издание, том 1 (1880)» и «3-е издание, том 1 (1903)», но не делаете их ссылками. Hausratte (обсуждение) 21:55, 31 июля 2015 (UTC)
Вообще-то я могу согласиться с идеей не делать заголовки «1-е издание, том 1 (1863)» и т. п. ссылками, если это загромождает страницу. Dmitrismirnov (обсуждение) 22:02, 31 июля 2015 (UTC)
1) Я уже выразил свою точку зрения на помещение сразу нескольких ссылок в графе источник -- я считаю их излишними, не привязанными непосредственно к тексту, а также увеличивающими размер и так большой шапки.
2) Можно было бы пожертвовать номерами страниц, но их наличие создаёт дополнительное удобство, особенно если статья большая, так как ведёт непосредственно на страницу индекса с источником текста. И поскольку эти номера выставляются автоматически, их можно было бы оставить при условии, исправления существующего в настоящее время дефекта -- при суживании страницы, цифры налезают на текст. Но я надеюсь, что технически эту проблему можно решить.
3) Ссылка прямо над текстом удобна и наглядна -- она самая важная. Её использование было согласовано с @Lozman:'ом, который и предложил использовать такой дизайн. -- Dmitrismirnov (обсуждение) 21:58, 31 июля 2015 (UTC)
«который и предложил использовать такой дизайн» — ссылку, пожалуйста. Hausratte (обсуждение) 22:03, 31 июля 2015 (UTC)
Я так понял из Ваших слов. Dmitrismirnov (обсуждение) 22:08, 31 июля 2015 (UTC)
Из каких?.. Уф, неважно. В общем, свою точку зрения я высказал выше. Есть определенная практика оформления разных редакций, предпочтительнее следовать ей во имя единоообразия. Hausratte (обсуждение) 22:12, 31 июля 2015 (UTC)
Вот ссылка на Ваши слова: [1] Вы их потом поправили (выделено мной):

@Dmitrismirnov: Дело оказалось не в шаблоне. Lozman поправил статью ТСД/А 1/ДО. Используйте ее как образец (в частности, нужен тег pages index, а не lst). Hausratte (обсуждение) 20:53, 27 июня 2015 (UTC)

-- Dmitrismirnov (обсуждение) 23:03, 31 июля 2015 (UTC)
Спасибо, теперь понятно. Я имел в виду, что следует использовать pages index вместо #lst:Страница. Вот и все Smiley.svg Использование ссылок в заголовках, в общем-то, не критично, но излишне, так как они и так уже есть в номерах страниц в левом поле. Hausratte (обсуждение) 23:29, 31 июля 2015 (UTC)
Я не вполне понимаю выражение "использовать pages index вместо #lst:Страница." -- что конкретно имеется в виду под этими словами "pages index" и "#lst:Страница"? Dmitrismirnov (обсуждение) 23:48, 31 июля 2015 (UTC)
Викитека:Проект:OCR#Тексты. Hausratte (обсуждение) 12:03, 1 августа 2015 (UTC)
Технического языка я не понимаю. Переводов этих терминов "pages index" и "#lst:Страница" на человеческий язык по Вашей ссылке я не нашёл. Dmitrismirnov (обсуждение) 12:15, 1 августа 2015 (UTC)
Насколько я понимаю, консенсус склоняется к тому, что ссылки в [пагинации] слева нужны. А вот насчёт размещения в шапке и заголовке непонятно. По общепринятым принципам оформления, анкор какой-то из ссылок на источник должен содержать ясное название издания/тома, поэтому выбор одного из двух: в поле «источник» шапки или в заголовке. Высказано в 21:58 что ссылки в заголовке нужны, в шапке лишние. Но сразу после этого в 22:02, что излишни в заголовках при наличии других ссылок. Оставить всё же в шапке? --Vladis13 (обсуждение) 02:05, 1 августа 2015 (UTC)
О консенсусе рано ещё говорить, поскольку было высказано всего два мнения. Было бы полезно услышать что думают и другие участники. Даже Вы не высказали Вашего собственного мнения, а это было бы интересно. Dmitrismirnov (обсуждение) 06:46, 1 августа 2015 (UTC)
С точки зрения оформления — не могу ничего сказать, спрашиваю, интересует консенсус сообщества. Мою позицию высказал в первом сообщении. Надо определиться по этому вопросу перед возможной ботозаливкой статей. --Vladis13 (обсуждение) 20:46, 1 августа 2015 (UTC)
Я, если честно, не совсем понимаю, в чем проблема. Заполнение поля «Источник» является обязательным во всех текстах; Даль — единственный проект в ВТ, где это правило не соблюдается. Чтобы шапка {{ТСД}} сильно не раздувалась, ее можно оптимизировать по образцу других шапок ({{ЭСБЕ}}, {{ПБЭ}}, {{ВЭ}}, {{БСЭ1}} и т. д.) — в частности, убрав алфавит и поместив на одной строчке ссылки на словник, источники и «другие источники». Размещение ссылок в заголовках — это чисто изобретение Дмитрия, нигде в ВТ подобного нет и Лоцман не предлагал использовать такой дизайн (если что, уточните у него сами). Hausratte (обсуждение) 21:42, 1 августа 2015 (UTC)
Алфавит необходимо оставить. Он сильно облегчает пользование словарём. В остальном могу согласиться с предыдущим мнением: добавить ссылки в графу ИСТОЧНИК, а указания на 1, 2 и 3 издания перед текстом делать без ссылок. Номера страниц оставить, но желательно поправить дефект, чтобы не налезали на текст при сужении страницы. То есть страница может выглядеть приблизительно так: Участник:Dmitrismirnov/ТДК/Абаз/test (только надо бы поправить ссылки в графе ИСТОЧНИК, расположив их в порядке: 1, 2 и затем 3 издание. Если все согласны и никто не возражает, можно сказать что консенсус достигнут. Dmitrismirnov (обсуждение) 22:15, 1 августа 2015 (UTC)
Порядок ссылок 1-2-3 в графе «источник» поправил в тестовой странице. --Vladis13 (обсуждение) 23:51, 1 августа 2015 (UTC)
Хорошо! Dmitrismirnov (обсуждение) 23:59, 1 августа 2015 (UTC)
Заголовки оформлять именно так малым шрифтом и курсивом? --Vladis13 (обсуждение) 23:24, 1 августа 2015 (UTC)
Да, если у Вас нет возражений. Я просто хотел, чтоб это не слишком бросалось в глаза и отличалось от текста самой статьи. Dmitrismirnov (обсуждение) 23:31, 1 августа 2015 (UTC)

Категории[править]

Статьи содержатся в 4 категориях, не много ли? Например ТСД/Я в: Категория:ТСД:Я Категория:ТСД:Современная орфография, Категория:ТСД, Категория:Словарные статьи Владимира Ивановича Даля. В последних двух, добавляемых шаблоном {{ТСД}}, вверху есть оглавление с переходом на букву (в данном примере "Я"). Мне кажется они излишни, может убрать их из шаблона и из статей? --Vladis13 (обсуждение) 18:55, 15 сентября 2015 (UTC)

Они не мешают. Иногда удобно поискать страницы в конкретных категориях. Dmitrismirnov (обсуждение) 19:41, 15 сентября 2015 (UTC)
Может убрать всёже словарные статьи из Категория:ТСД? Это всё же верхняя распределительная категория. Там бардак. Под звёздочкой например Словник, дальше навалено словарных статей (сейчас 7.5 тыс., после заливки 2го изд. будет 50тыс., с другими изданиями и ДО в потенциале 300-800 тыс.), при этом Словник на букву С надо искать на "С" а не на звёздочке, а на "Т" вообще верхняя старница Толковый словарь В. Даля. --Vladis13 (обсуждение) 11:11, 19 сентября 2015 (UTC)
Нашёл дикую Категория:Толковый словарь В. Даля, в которую входит Категория:ТСД. Всё её содержимое - только переиздание98, т.е. дублирует Категория:ТСД-2, переиздание '98, совр.орф.. Также в ней есть непонятная Категория:Толковый словарь живаго великорусскаго языка с подкатегориями, и статьи вроде: Толковый словарь В. Даля/Ангинга — Антихрист/ДО, Толковый словарь В. Даля/Атанде — Аутопсия/ДО. Похоже это всё давно не актуально, последние правки там были 7 лет назад. Мне кажется, эти категории надо зачистить, после чего туда перенести всё содержимое категории ТСД (с учётом предложения абзацем выше), ибо название "Толковый словарь В. Даля" более понятное, чем "ТСД". --Vladis13 (обсуждение) 16:53, 19 сентября 2015 (UTC)
С категориями действительно есть некоторая путаница, поскольку работа над словарём началась давно (7-8 лет назад) без хорошо продуманного плана. Идеи менялись в процессе работы, и только теперь стало проясняться её направление. Конечно, категории желательно унифицировать. Категория:ТСД была введена только 2-3 года назад по общему решению и является сокращением категории Категория:Толковый словарь В. Даля. Да была и такая категория Категория:Толковый словарь живаго великорусскаго языка, которая точнее, так как воспроизводит оригинальное название словаря, но она чересчур громоздка. Категория:ТСД удобна благодаря своей краткости (наподобие БСЭ или ЭСБЕ). Поэтому, мне кажется, из соображений удобства, предпочтительнее оставить её, а старые категории можно было было бы переименовать. Но прежде, чем это делать, нужно чёткое решение сообщества. Dmitrismirnov (обсуждение) 17:18, 19 сентября 2015 (UTC)
@Vladis13: Напишите, пожалуйста, на ВТ:Ф ваши конкретные предложения, и если никто не будет возражать — можно делать. В целом желательно следовать логике категоризации других словарей (см., напр., Категория:Энциклопедический словарь Брокгауза и Ефрона — заметьте, что туда входит Категория:ЭСБЕ). Если какие-то категории в результате останутся пустыми как ненужные, на них следует поставить плашку КБУ ({{d}}). Hausratte (обсуждение) 17:45, 19 сентября 2015 (UTC)
Открыл тему на форуме. --Vladis13 (обсуждение) 19:09, 19 сентября 2015 (UTC)

Служебные[править]

Добавил скрытые категории на время обработки. Выборка из Категория:ТСД:Современная орфография, ДО не смотрел.

  • Категория:ТСД:Имеется закомментаренный код - код старый, лишний. Также исправил проблему, что в коде страниц не было завершающего тэга "-->". Бот добавляет и автовикифицирует страницы, перенося код категорий вниз кода страницы (это не отключить), а если выше есть незакрытый тэг закомментирования "<!--", то страницы вылетают из всех категорий. Тэги надобы закрывать.
  • Категория:ТСД:Перенаправления?‎ - много страниц где есть закомментированная категория Категория:ТСД:Перенаправления, зачастую ошибочная. Некоторые такие перенёс в данную категорию с "?". Потом после заливки лучше пройти ботом, отслеживая страницы со словом "см. " - это точный признак перенаправления.
Что касается категории ТСД:Перенаправления, то думаю её можно было бы упразднить, но в этом я не вполне уверен, и мне было бы важно знать Ваше мнение. В большинстве случаев перенаправление явно отличается от статьи, но не всегда и бывают случаи, когда разницу трудно точно определить. Например:
1) иногда в одних изданиях это статья, а в других перенаправление, как здесь: ТСД/Алей, ТСД/Аблава/ДО;
2) или иногда перенаправление состоит из большого списка разных названий: ТСД/Бабуля, ТСД/Бабушка, а в некоторых случаях при этом даётся целая серия перенаправлений на разные слова, и даже наименование нового гнезда ТСД/Багривать, 1. Багрить, что больше смахивает на статью.
3) или когда перенаправление содержит краткий комментарий, что приближает его к функции статьи: ТСД/Баркан 2/ДО, ТСД/Басран, ТСД/Басалык 1
4) иногда ссылка "см." и даже не одна содержится в большой статье, так что на самом деле ссылка "см." не служит обязательным признаком перенаправления: ТСД/Баса ТСД/Баланец
Таким образом, определение функции текста (статья или перенаправление) может быть затруднительно, и устранение этой категории упростило бы процесс работы. Как Вы думаете? Или может быть всё-таки оставить эту категорию для бесспорных случаев? Dmitrismirnov (обсуждение) 07:26, 21 сентября 2015 (UTC)
Действительно, это актуальные аргументы. Учтём, что вручную без бота добавить данную категорию невозможно для десятков и сотен тысяч статей. Да и с ботом надо хитрый алгоритм придумывать и вручную проверять очень много статей, отлаживая алгоритм, а потом зачищая. Крайне много работы и затрат времени, сомнительной нужности, есть полным-полно более важных задач в Проекте. Вики — это добровольный проект. Если я не буду этот алгоритм придумывать и недели сидеть вручную проверяя по тысяче правок в день, а вы не будете крайне сложно их вручную отмечать — никто другой этим заниматься не будет. Т. е. если кому-то это надо пусть и делает, однако никто не делает значит не надо. Я за упразднение, — создаёт слишком много ненужных сложностей. --Vladis13 (обсуждение) 18:47, 21 сентября 2015 (UTC)
Тогда давайте пока упраздним эту категорию. Только что делать с теми, которые уже стоят? Оставлять или убирать? Dmitrismirnov (обсуждение) 19:16, 21 сентября 2015 (UTC)
Давайте пока оставим для бота. Потом буду использовать так: поставлю категорию на все статьи со ссылками на др. статьи (содержащие "см. "). А потом по этой категории может будет проще исправить их на викиссылки. (Если понадобится делать несколько операций, то не придётся заново статьи искать - будут в категории). Т.е. вручную заморачиваться с ней не стоит, чисто служебная для автопоиска ботом. --Vladis13 (обсуждение) 20:24, 21 сентября 2015 (UTC)
Сделал «Категория:ТСД:Перенаправления» скрытой и перенёс в служебные в «Категория:ТСД:Нуждаются в викификации», чтоб не отвлекала. --Vladis13 (обсуждение) 00:28, 22 сентября 2015 (UTC)
У меня есть такая идея: считать перенаправлениями все статьи, в которых есть ссылка "см." независимо от их размера и функции. В таком случае в данную категорию войдут все перенаправления. Как вы думаете. есть в этом рациональное зерно? Dmitrismirnov (обсуждение) 07:18, 22 сентября 2015 (UTC)
Для бота так и сделаю. А кроме как для бота я не понимаю зачем нужна эта категория. --Vladis13 (обсуждение) 14:08, 22 сентября 2015 (UTC)


Шаблон ТСД[править]

В шаблоне есть поле «список», куда вводится первая буква статьи. Вставил в шаблон автоподстановку категории по букве. Поэтому отдельно добавлять в статью категорию, например [[Категория:ТСД:А]], не нужно. Я нигде не ошибся?

Надеюсь, что нет. Я проверил несколько разных букв - всё работает. Спасибо за это упрощение. Нельзя ли также сделать автоматической подстановку Категорий ТСД:Дореформенная орфография и ТСД:Современная орфография? Dmitrismirnov (обсуждение) 07:27, 21 сентября 2015 (UTC)
Сделал. Автоподстановка по названию статьи — с «/ДО» или без. ТСД/Абака/ДО, ТСД/Абака. --Vladis13 (обсуждение) 18:13, 21 сентября 2015 (UTC)
Спасибо! Работает!! Dmitrismirnov (обсуждение) 19:16, 21 сентября 2015 (UTC)
При этом было бы хорошо, если можно так сделать, чтобы категория Категория:ТСД:Дореформенная орфография включалась в категорию Категория:Дореформенная орфография, но при этом сама Категория:Дореформенная орфография не появлялась внизу под каждой статьёй. Dmitrismirnov (обсуждение) 07:26, 21 сентября 2015 (UTC)
«Категория:Дореформенная орфография» добавляется шаблоном {{Отексте}}, который вызывается {{ТСД}}. «Отексте» шаблон значимый и сложный. Пока не знаю как убрать. Надо на форуме спрашивать. --Vladis13 (обсуждение) 18:13, 21 сентября 2015 (UTC)
Ну, это не обязательно, не заморачивайтесь! Dmitrismirnov (обсуждение) 19:16, 21 сентября 2015 (UTC)
И ещё одна просьба: Ни в одной статье ТСД нет прямой ссылки на имя автора, а хотелось бы, чтобы она там была. Нельзя ли в шапке в надписи «Толковый словарь живого великорусского языка Владимира Даля» сделать такую ссылку? Dmitrismirnov (обсуждение) 12:01, 21 сентября 2015 (UTC)
Добавил в имеющуюся так: Толковый словарь живого великорусского языка Владимира Даля. Нормально? --Vladis13 (обсуждение) 16:52, 21 сентября 2015 (UTC)
Спасибо, наконец-то читатель может добраться до автора :) Dmitrismirnov (обсуждение) 19:16, 21 сентября 2015 (UTC)
Незачто, предлагайте ещё идеи. --Vladis13 (обсуждение) 20:24, 21 сентября 2015 (UTC)

две маленьие идеи[править]

1) Я не знаю заметили Вы или нет, что ссылка на |ВИКИСЛОВАРЬ=яла должна начинаться не с прописной, но со строчной буква (так как там почти все слова с маленькой буквы). Когда Вы пишете
|ВИКИСЛОВАРЬ=Яла и т. п.
то ссылка не приводит к желаемой странице (см. ТСД/Яла).

Это проблема викисловаря, в википедии регистр первой буквы нормально распознаётся. Сделал поправку в шаблоне, сейчас работает. Но есть нюансы что некоторые слова имеют разные значения при разном регистре, а в викисловаре между такими статьями нет перекрёстных ссылок (зато есть крайняя косность участников), например небыло в wikt:Ял и wikt:ял (сейчас добавил, но пока правку не подтвердили). Поэтому следующие заливки сделаю со строчной буквой. --Vladis13 (обсуждение) 16:07, 22 сентября 2015 (UTC)
Уже залитые на «Я» тоже поправил. --Vladis13 (обсуждение) 19:39, 22 сентября 2015 (UTC)
Кстати, в словнике стоят «Другие источники» на данную букву, хотя там списки и про конкретное слово (букву) они не к месту. Например, в ТСД/Словник/В: «Другие источники: МЭСБЕ, ЭСБЕ. Википроекты: Википедия, Словарь» — всё только про букву «В», эти ссылки к месту в статье ТСД/В. Предлагаю убрать из словника. --Vladis13 (обсуждение) 19:47, 22 сентября 2015 (UTC)

2) в шаблоне в графе источник издания приводятся сверху вниз в порядке от последего к первому:

 |ИСТОЧНИК=
   |3-ИЗД.ТОМ= 4
   |3-ИЗД.ЧАСТЬ ТОМА=
   |3-ИЗД.СТРАНИЦА СКАНА=
   |3-ИЗД.СТРАНИЦЫ КНИГИ=
   |2-ИЗД.ТОМ= 4
   |2-ИЗД.СТРАНИЦА СКАНА=
   |2-ИЗД.СТРАНИЦЫ КНИГИ=
   |1-ИЗД.ТОМ= 4
   |1-ИЗД.СТРАНИЦА СКАНА=
   |1-ИЗД.СТРАНИЦЫ КНИГИ=

Мне более привычно и удобно было бы располагать их сверху вниз в порядке от первого к ппоследнему:

 |ИСТОЧНИК=
   |1-ИЗД.ТОМ= 4
   |1-ИЗД.СТРАНИЦА СКАНА=
   |1-ИЗД.СТРАНИЦЫ КНИГИ=
   |2-ИЗД.ТОМ= 4
   |2-ИЗД.СТРАНИЦА СКАНА=
   |2-ИЗД.СТРАНИЦЫ КНИГИ=
   |3-ИЗД.ТОМ= 4
   |3-ИЗД.ЧАСТЬ ТОМА=
   |3-ИЗД.СТРАНИЦА СКАНА=
   |3-ИЗД.СТРАНИЦЫ КНИГИ=

-- Dmitrismirnov (обсуждение) 10:45, 22 сентября 2015 (UTC)

  • Поправил шаблон заливки, следующие будут заливаться так. --Vladis13 (обсуждение) 16:07, 22 сентября 2015 (UTC)
Спасибо! Dmitrismirnov (обсуждение) 17:39, 22 сентября 2015 (UTC)

Модуль:ТСД[править]

Написал Модуль:ТСД, куда вынес нагромождение кода из {{ТСД}}. Добавьте его в список наблюдения. --Vladis13 (обсуждение) 18:31, 26 сентября 2015 (UTC)

  • @Vladis13: pagecalc не работает, см. Участник:Hinote/Песочница. Hinote (обсуждение) 09:00, 17 октября 2015 (UTC)
    • Починил. Поскольку высчитывание страницы книги по стр.скана не нужно, убрал это из вызова и возврата. --Vladis13 (обсуждение) 11:52, 17 октября 2015 (UTC)
      • Супер, спасибо! (Я что-то эту простейшую ошибку не заметил...) Hinote (обсуждение) 13:03, 17 октября 2015 (UTC)
        • У меня на Lua почему-то постоянно заморочки с приведением типов переменных. Сорри. --Vladis13 (обсуждение) 14:06, 17 октября 2015 (UTC)
  • @Hinote: Сломались все ссылки на источник в статьях. Думаю, надо поменять if (linkonly ~= nil) на if (linkonly == nil), с соотв.изменением кода. Чтобы по умолчанию, без этого параметра, работал прежний код, а с ним - что вы хотели. --Vladis13 (обсуждение) 14:19, 17 октября 2015 (UTC)
    • Значит я ошибся, значит там условие наоборот, да... Yes check.svg Сделано Hinote (обсуждение)

Параметр СПИСОК[править]

  • С параметром |СПИСОК= не ясно. В нём для обоих орфографий указывается буква-ДО (или СО)? Или для тут — СО, а в пространстве «/ДО» — ДО? --Vladis13 (обсуждение) 05:02, 5 октября 2015 (UTC)

Параметры СЛЕДУЮЩИЙ-ПРЕДЫДУЩИЙ-НАВИГАЦИЯ[править]

Предлагаю разобраться с полем навигации. Нужны 2 навигации: для 1-2 изданий и для ТСД-3. При их идентичности достаточно имеющихся параметров СЛЕДУЮЩИЙ/ПРЕДЫДУЩИЙ (пример). Если они различаются, я обычно очищаю в них значения (чтобы не перекрывали), и добавляю поле НАВИГАЦИЯ, где ставлю 2 шаблона «sub-nav» (пример):
|НАВИГАЦИЯ= {{sub-nav|[[ТСД/Абажур|Абажур]] | [[ТСД/Абаим|Абаим]] | [[ТСД/Словник/А-доп|1—2 издан{{и}}я]]}}
{{sub-nav|[[ТСД/Абазурить|Абазурить]] | [[ТСД/Абаим|Абаим]] | [[ТСД/Словник/А|3 издан{{и}}е]]}}

Предлагаю добавить в шапку поля «|1-2 ИЗД.СЛЕДУЮЩИЙ», «|1-2 ИЗД.ПРЕДЫДУЩИЙ», «|3 ИЗД.СЛЕДУЮЩИЙ», «|3 ИЗД.ПРЕДЫДУЩИЙ». (Или назвать как получше.) Если данные поля пусты, то значение будет браться как сейчас из обычных СЛЕДУЮЩИЙ/ПРЕДЫДУЩИЙ. --Vladis13 (обсуждение) 05:27, 5 октября 2015 (UTC)


Шаблон для автоподстановки всего[править]

Идея. В шаблоне {{ТСД}} уже содержатся все данные. Но сейчас при написании страницы источник надо указывать трижды, а то и больше: в этом шаблоне, ниже в тэге page или #lst, и ещё в заголовках (шаблон {{tom}}). Это вручную заморочно, повышает риск напутать цифры. И заморочно ботом, приходится гонять бот по залитым 7600 страницам, ставя и снимая несколько служебных категорий и шаблонов.
Бот обрабатывает 1-2 тыс. страниц за час, поэтому 1 операция (изменение категории или одной буквы) по этим 7600 страницам занимает 4-7 часов, при наличии 44000 страниц изменение всех займёт ≈40 часов. Поэтому, всё что можно надо бы выносить в шаблоны.
Предлагаю просто использовать шаблон "ТСД". Добавить в него поле, куда вводится метка из тэга "section" Индекса. И шаблон сам будет подставлять статью из индекса с заголовком.
Нюанс вижу только один: Статья выводимая через "ТСД" будет сразу под шапкой. Т.е. если, например, в индексе статья только из 3-го издания и она выводится через шаблон, а другие статьи не в индексе и их текст на странице ниже шаблона - то выводится будут не по порядку, а так: 3, ниже 1 и 2. Два решения:

1) Текст таких статей тоже вводить в поля шаблона, пример:
{{ТСД
   |3-ИЗД.ТОМ=1
   |3-ИЗД.ЧАСТЬ ТОМА=2
   |3-ИЗД.СТРАНИЦА СКАНА=45
   |3-ИЗД.СТРАНИЦЫ КНИГИ=85-87
|1-ИЗД.МЕТКА В ИНДЕКСЕ = 
|1-ИЗД.ТЕКСТ           = '''Термин''' <small>м.</small> текст статьи. 
|2-ИЗД.МЕТКА В ИНДЕКСЕ = 
|2-ИЗД.ТЕКСТ           = '''Термин''' <small>м.</small> текст статьи.
|3-ИЗД.МЕТКА В ИНДЕКСЕ = термин1 <!-- метка из тэга "section", при её наличии выводится статья из индекса -->
|3-ИЗД.ТЕКСТ           = 
}}
== Примечание == <!-- если надо -->
{{примечания}}
2) Сделать новый шаблон только для текста статьи и заголовка на источник. Т.е. в формате например: {{статья-из-индекса|метка-в-индексе1|издание=3|том=2|часть=2|страницаскана=23|страницыкниги=150-152}}.

И он подставит:

<center><small>''3-е издан{{и}}е, том{{ъ}} 2(2) (1905):''</small></center>
{{#lst:Страница:.............."метка-в-индексе1"...|метка-в-индексе1}}

Первый вариант с одним шаблоном "ТСД" мне кажется наилучшим. --Vladis13 (обсуждение) 06:34, 23 сентября 2015 (UTC)

Только объясните мне, а можно вместо текста вводить в этот шаблон ссылку на вычитанную страницу, например такую:
<pages index="Толковый словрь Даля (2-е издание). Том 4 (1882).pdf" from=705 to=705 onlysection="Яла1" /> ? Dmitrismirnov (обсуждение) 19:57, 23 сентября 2015 (UTC)
Я хотел как раз отойти от использования сложных тэгов. Чтобы один раз в шапке ввести номер тома, страниц, названия секции — и автозаполнялась шапка, и подставлялась статья с индекса с заголовком. Наверно не получится, тэг pages не работает из шаблона если подставлять в него параметры в «{{{» типа {{{3-ИЗД.ТОМ|}}}. Работает другой шаблон — {{#lst:. Но он имеет недостатки: как я понял нельзя указать диапазон страниц (если статья продолжается на следующей странице), и не показывает ссылку на страницу источника (слева от текста). Поэтому массово использовать его наверно не стоит. --Vladis13 (обсуждение) 21:48, 24 сентября 2015 (UTC)
Да, вот я чего боюсь, если шаблон станет слишком сложным, для многих будет непонятно как им пользоваться. Хотелось бы, чтобы работа с шаблоном была максимально простой и допускала бы самую обычную работу вручную. Автоматизация ручного процесса это конечно хорошо, но для меня главной трудностью являются две проблемы: 1) вычитка текста в сканах с источников и 2) составление словника 3-го издания. Есть ещё много проблем которые стоит обсудить, но нелья всё всё сразу... Dmitrismirnov (обсуждение) 22:03, 24 сентября 2015 (UTC)
С шаблоном то всё просто, сделал документацию, достаточно просто скопировать оттуда на страницу. С вычиткой, вроде в Finereader можно сделать обучение распознавания, чтоб лучше распознавал, и уже ботом эту лучше распознанную версию ДО залить в индекс. А словника 3-го издания в интернетах нет? Вроде видел на сайтах выложено это издание... --Vladis13 (обсуждение) 14:35, 25 сентября 2015 (UTC)
Здесь я не могу быть Вашим хорошим советчиком ввиду своей полной некомпетентности в технических вопросах. Но если Вы уверены, что эти новшества надёжны и пойдут на пользу проекту, то делайте то, что считаете необходимым. Это касается также упорядочивания категорий, действуйте согласно Вашему плану. Я не думаю, что кто-либо станет возражать. --Dmitrismirnov (обсуждение) 11:01, 23 сентября 2015 (UTC)


Пагинация в словнике[править]

В словники номера страниц добавляются вручную, их число весьма невелико, ибо над этим трудится один участник. Наверно сделано 100—1000 номеров страниц, при 44 тыс. статей во 2 издании и 270 тыс. статей в 3-м. Нюанс, что в словнике кое-где номера страниц книги указаны для диапазона статей на этих страницах. При этом сами статьи могут вычитываться по отдельности, поэтому для страницы книги только часть статей будет с пагинацией. Просто по алфавиту статьи не расположишь — в старой орфографии они шли в другом порядке, словника в ДО нет. (Что-то можно высчитать из словника в СО, учитывая правила старой орфографии, но это отдельное задача, требующая обсуждения и тестов.) Также пока не обсуждался формат отображения пагинации в словнике. Например: номера страницы выводить для диапазона статей или для каждой отдельно, для ДО или СО, подзаголовком над диапазоном, ввиде таблицы, или справа-слева от названия статьи? --Vladis13 (обсуждение) 17:53, 30 сентября 2015 (UTC)

Здесь на логику рассчитывать не приходится, так как статьи расположены не всегда в строго алфавитном порядке. Dmitrismirnov (обсуждение) 18:41, 30 сентября 2015 (UTC)
По-моему вы изобретаете велосипед. Инфраструктура словников (уже имеющиеся шаблоны, этот модуль, функции в нем) как раз и рассчитаны на то, что статьи могут быть в хитром порядке, а не в алфавитном. Это все уже готово и работает. Посмотрите на упомянутые мной выше словники: там даже говорится явно для читателей: "Порядок расположения статей соответствует печатному изданию.", а не в алфавитном. Для алфавитного порядка есть категории, в них все как раз в алфавитном порядке все прекрасно собирается, для тех читателей, кто хочет в таком порядке просматривать и находить статьи. А словники (те, которые используют этот модуль и сопутствующие шаблоны), как правило, строятся в том порядке, как статьи расположены в издании. Кроме, вроде, ЭСБЕ -- но там это по историческим причинам, там при начале проекта было решено делать словник в алфавитном порядке... Hinote (обсуждение) 19:56, 30 сентября 2015 (UTC)
  • Представляется такой формат словника и алгоритм:
  1. Строка словника «Термин в СО / Тѣрмін въ ДО 56-58» — СО, слэш, ДО, номера страниц книги. В приведённых выше примерах это сделано через шаблон {{Статья в словнике}} для каждой ссылки, пример: {{Статья в словнике|Абаза, Константин Константинович|Абаза, Константинъ Константиновичъ|2—3|28}}. (Кстати, судя по последним цифрам тут пагинация в скане не высчитывается?) В приведённых примерах словников ВТ и РЭБ название в другой орфографии не отображается, — отдельные страницы словников для каждой орфографии. Или лучше показывать их на одной странице рядом как сейчас в ТСД?
    1.1 Не понял первое предложение. Hinote (обсуждение) 22:02, 1 октября 2015 (UTC)
    Я про текущий формат словника, например: "Абажу́ръ / Абажу́р". Но если всё уже продумано в шаблоне {{Статья в словнике}}, то ок. --Vladis13 (обсуждение) 07:17, 2 октября 2015 (UTC)
    1.2 @Vladis13: "Кстати, судя по последним цифрам тут пагинация в скане не высчитывается" -- высчитывается. Это оно сначала не высчитывалась, поэтому там прописывались номера страниц. Потом уже обнаружили способ, что можно высчитывать из диапазона страниц. Поэтому, строго говоря, этот параметр там не нужен. Но его оставили и оставили не пустым, чтобы делать меньше изменений в существующем коде модуля Header, где там все это парсится, чтобы не разрушить ничего. Надо будет там это вычистить и поменять словники, убрать этот параметр... Это отложено на потом... Т.е. просто в одном из проектов, где номера страниц в сканах уже были проставлены в словниках -- они оставлены как есть, но не используются, а в другом -- в этот параметр просто дублировалось значение предыдущего, т.е. диапазона страниц в книге, и он тоже не используется, посмотрите на один и на другой словник... "отдельные страницы словников для каждой орфографии" -- нет, для второй орфографии словник -- это просто включение (transclusion) страницы словника в другой орфографии. (Посмотрите на них) Просто для одного из проектов собственно словник -- это страница ВТ (т.е. СО), а ДО -- его включает, а для другого -- наоборот. Т.е. тут тоже подход развивался со временем. Надо тут тоже будет порядок навести и сделать одинаково... "Или лучше показывать их на одной странице рядом как сейчас в ТСД?" -- давайте сделаем пока отдельно, это совсем несложно, а потом посмотрим на результат и если захотим на странице словника ВТ (т.е. СО) показывать и вариант названий статей в ДО -- поменяем код соответственно... Hinote (обсуждение) 23:06, 3 октября 2015 (UTC)
  2. Скрипт отображает сделанную ссылку в шапке словарной статьи, вместо со ссылкой ведущую на страницу скана (которую высчитывает по смещению данной страницы книги). Любопытно, что в ВЭ/ВТ/Абаза, Константин Константинович параметры шапки все пустые, а всё показывается.
    2.1 Не понял, что такое "отображает сделанную ссылку", точнее, что такое "сделанную ссылку". Отображается название статьи, взятое из словника (СО, ДО или СО [ДО] -- это как договоримся) Hinote (обсуждение) 22:00, 1 октября 2015 (UTC)
    2.2 "параметры шапки все пустые, а всё показывается" -- да, и это как раз результат работы инфраструктуры словников: название статьи, ссылка на нужный словник, номер тома (кстати: и номер тома вам в шапке тоже не нужен, это тоже может "подбираться" из словника, точнее высчитываться по номеру словника, в котором есть соотв. элемент для статьи), диапазон страниц -- это все берется из словника, страница в скане для ссылки на скан -- вычисляется из диапазона страниц, который берется из словника, плюс из Викиданных берутся ссылки на внешние проекты и на другие проекты в ВТ, если там есть данные... Так что, да, параметров нет, но все отображается. ;-) И для ТСД так же сделаем, и даже еще лучше... Hinote (обсуждение) 22:00, 1 октября 2015 (UTC)
    Великолепно. А где эти функции парсинга находятся? В модуле Header? Там нет документации и комментариев к функциям, сложно что-либо понять к сожалению. --Vladis13 (обсуждение) 07:17, 2 октября 2015 (UTC)
    Да, «номер тома» можно убрать. Тома разделены по буквам алфавита, в шаблоне уже есть параметр для буквы. Кстати, и его можно убрать, ибо буква алфавита = 1-й букве названия статьи. @Dmitrismirnov: есть ли случаи, где первая буква названия статьи отличается от оглавления-буквы словника и следовательно от тома с этой буквой? --Vladis13 (обсуждение) 07:57, 2 октября 2015 (UTC)
  1. Мне кажется надо добавить в {{ТСД}} поле «Оригинальное название» (или «НАЗВАНИЕ В ДО», хотя новым редакторам будет непонятно что за «ДО»), сейчас название статей в ДО в ряде статей дописывается вручную к названию (пример). И ещё связать этот параметр с подпространством «ДО» страниц. Если не ошибаюсь, вышеупомянутый скрипт это делает?
    Это хорошая идея. Dmitrismirnov (обсуждение) 20:55, 1 октября 2015 (UTC)
    Название в ДО для каждой из статей, если их сделать как в ВЭ и РБС, и так будет в словнике в качестве второго параметра шаблона "Статья в словнике". В ВЭ и в РБС название в ДО используется только в вариантах ДО статей, т.е. в отдельных страницах, но если вы хотите, как и сейчас, отображать название статьи в ДО и в ее варианте в СО, то это тоже можно будет сделать. Надо определиться: сделать как в остальных словарях, когда на странице статьи в СО отображается только название СО, а на странице статьи в ДО -- только в ДО, или же на странице статьи в СО отображать оба варианта, как сейчас... И, да, такой параметр можно будет добавить к шапке, для того, чтобы, как Дмитрий говорит, "подправить" непосредственно на странице статьи это значение, которое оказалось почему-то неправильным в словнике (и отслеживать в отдельной категории такие страницы) с тем, чтобы другой участник, который не боится "лезть" в словник, сделал бы потом правку в словнике и удалил этот параметр из шапки страницы статьи. (Если так, то, имхо, лучше использовать название параметра вида НАЗВАНИЕ В ДО, т.к. ДО -- это часто используемый активными участниками в ВТ акроним, кому надо -- тот поймет. К тому же -- есть документация шаблона, где это можно будет описать, что это за параметр и что там можно записывать, когда и для чего...) Hinote (обсуждение) 21:41, 1 октября 2015 (UTC)
    Мне кажется, лучше название в ДО в шапке показывать. Ибо словарь часто используется как этимологический, в этом он наверно на втором месте после словаря Фасмера.
    Хотя т. н. «название» — это просто первый термин в статье, а их может быть несколько, причём дальше в статье идут однокоренные слова и омонимы. И некоторые статьи названы по 3-му изданию, где Бодуэн на первое место поставил непонятные термины в скобках, которых у Даля в 1-2 изданиях нет, но вроде это единичные случаи. --Vladis13 (обсуждение) 09:39, 2 октября 2015 (UTC)
  1. Я могу спарсить пагинацию из имеющихся словарных статей ТСД, сделать в виде списка, и залить в словник в таком формате. После чего удалить из шапок статей. В шаблон ТСД надо будет написать дополнение к инструкции, +в код всех статей добавить комментарий «пагинацию добавляйте в словник». Также можно добавить автодобавление категории для страниц, где в шапке заполнена пагинация, так будет элементарно отслеживать страницы где она добавлена вручную, а не в словник. --Vladis13 (обсуждение) 19:29, 1 октября 2015 (UTC)
    Только удалять, по-моему, не надо, чтобы,если ошибка, можно было бы подконтролировать и поправить вручную. Dmitrismirnov (обсуждение) 20:55, 1 октября 2015 (UTC)
    Дмитрий, не волнуйтесь -- мы все сделаем аккуратно и красиво... ;-) (И, да, можно будет при необходимости "подправить" и в шапке указать другие, корректные значения с тем, чтобы потом подправить словник или правило для вычисления страниц скана из страниц книги. Вы будете иметь такую возможность.) Hinote (обсуждение) 20:58, 1 октября 2015 (UTC)


Парсинг пагинации[править]

  • Кстати, вот у вас в страницах ТСД параметры страницы сканов, страницы книги -- отдельными параметрами непосредственно в страницах. А ведь это можно было бы "вытягивать" непосредственно из словников. По крайней мере номера страниц в книге. А номера страниц в сканах -- из страниц в книге получать, как я это сделал для РБС, например... Потом когда-нибудь это все равно придется переделать и поудалять эти параметры из страниц ТСД... Hinote (обсуждение) 23:53, 28 сентября 2015 (UTC)
    • В том и проблема, что словников, тем более с указаниями страниц не существует. Я сделал имеющийся словник без указания страниц, спарсив первые слова статей из одного переиздания в современной орфографии. Или я вас не правильно понял? Словник с пагинацией очень нужен. --Vladis13 (обсуждение) 15:04, 29 сентября 2015 (UTC)
    • Или вы имеете ввиду высчитывание страниц скана из страниц книги (и наоборот), вроде если у скана стр. 50, смещение например 32, то страница книги = 50+32 ? Это будет не корректно, ибо не учитываются диапазоны. Страница скана в ссылке поля «источник» шапки должна выводится только на 1 конкретную страницу скана. А фактически статья может располагаться на нескольких страницах скана (это задаётся в тэге «<pages index»). При этом, в ссылке на источник читателю должен быть показан диапазон страниц книги. Поэтому прямой связи нет. --Vladis13 (обсуждение) 19:45, 29 сентября 2015 (UTC)
      • Наоборот. Из диапазона страниц книги -- номер страницы в скане. Т.е. у статьи, например, диапазон "400—403". Всего то надо, выделить первую часть (в этом модуле даже есть уже весь имеющийся для этого функционал) и преобразовать (добавить смещение, где-то его изменить, если в скане есть страницы-дубликаты или наоборот пропущены страницы). Посмотрите на {{РБС/Ссылка на РГБ}}. Там это сделано шаблоном, но можно (и наверное даже лучше) вычислять в модуле, более по-человечьи будет выглядеть, чем эти ужасные лестницы условий в шаблоне. Причем, это даст возможность размещать ссылки на несколько источников. Посмотрите на любую статью ВЭ -- там есть недоделанная пока "заготовка" для ссылки не только на РГБ, но и на ГПИБ. Для этого из номера первой страницы диапазона страниц статьи надо просто пересчитать номер страницы в другом скане по-другому (другим шаблоном или другой ф-цией в модуле)... Посмотрите на шапки РБС, ВЭ -- там реализованы "самые последние наработки" ;-) в этой части... Т.е. первое здесь -- это то, что на самом деле номера страниц в сканах как параметры шапки страниц вам на самом деле не нужны, их можно легко высчитывать из параметров-диапазонов страниц в книге... А второе -- что и номера страниц в книге как параметры в шапке вам тоже не нужны. Их можно переместить из страниц в словники. Там с этим гораздо удобнее обращаться... Нет таких словников -- понятно. Но номера страниц в книге в параметрах шапки откуда то взялись? Подумайте о перемещении их в словники. Для этого, правда, нужно будет поправить этот модуль, в котором есть ф-ции, которые работают со словником и с номерами страниц для статей в нем -- у вас же сразу 3 издания и у каждой статьи будет 3 диапазона страниц, а не 1, как в других проектах, надо будет это дорюхать... Если решитесь -- я могу здесь это допилить, чтобы все 3 диапазона страниц можно было указывать в словниках... Hinote (обсуждение) 22:10, 29 сентября 2015 (UTC)
        • Вроде будет удобней. Интересует мнение @Dmitrismirnov: а как вы считаете, убрать из {{ТСД}} параметр «страница скана»? Он будет автоматом высчитывался из параметра «страница книги». --Vladis13 (обсуждение) 17:35, 30 сентября 2015 (UTC)
Мне кажется, что этого делать не стоит. Но если Вы считаете, что это имеет смысл... тогда делайте по-вашему. В идеале было бы хорошо это автоматизировать, однако при этом иметь возможность поправить вручную, если что не так. Поэтому я и думаю, что лучше оставить этот параметр. Dmitrismirnov (обсуждение) 18:39, 30 сентября 2015 (UTC)
Когда диапазоны страниц из книги (и страницы в скане) берутся из словника -- поправить все так же легко, как и в каждой конкретной странице. Просто посмотрите на словник РБС, словник ВЭ -- берете значение страниц для соотв. статьи и правите... И это даже удобнее для сопровождения, чем отдельные страницы: можно занести несколько страниц словника себе в список наблюдения и смотреть за исправлениями, исправление ошибки это или вандализм. С сотней тысяч статей это проблематично... Hinote (обсуждение) 19:48, 30 сентября 2015 (UTC)
Да но словника-то ещё нет, и неизвестно когда будет. И Вы это прекрасно знаете. Расположение статей в словнике 2-го изд. в совр. орф. не соответствует печатному изданию. Для 1-го издания словника не существует, для 3-го -- он пока в самом зачатке. Одному участнику составить его не по силам. Это огромный труд. Dmitrismirnov (обсуждение) 20:04, 30 сентября 2015 (UTC)
Хмм, а я думал есть... А откуда тогда берутся ссылки на предыд. и след. статьи? Hinote (обсуждение) 20:08, 30 сентября 2015 (UTC)
Я просто посмотрел на пример статьи, та, которая мне понравилась, как я написал в другом обсуждении -- там сразу три линейки ссылок на предыдущие и следующие, и ссылки на сканы есть для всех изданий... Я подумал, что все это уже есть -- и словники (раз ссылки вперед/назад есть) и номера страниц и проблема только в том, что вы номера страниц принялись хранить непосредственно в страницах, хотя, как я тут поясняю, это можно и не делать... Если словников нет, тогда ёк, надо с них начинать, да... А вот тот корпус статей, который заливается -- это что, а то я не особо, получается, ориентируюсь -- это второе издание или как? Номера страниц там есть при заливке? Тогда можно было бы словник собрать... P.S. Давайте это все перенесем в обсуждение проекта ТСД, а то здесь этому не особо место подходящее... Hinote (обсуждение) 20:18, 30 сентября 2015 (UTC)
Я занимаюсь 2-м изданием (оно заливается), Dmitrismirnov преимущественно 3-м. Не знаю точно про словник для 3-го издания, вроде видел (но не уверен) что оно выложено в интернет, значит его можно спарсить с сайтов, но мне кажется Dmitrismirnov делает его вручную. Для 2-го издания я сделал словник для современной орфографии, спарсив первые термины (слова) словарных статей из переиздания в современной орфографии. На его основе сделаны «следующие» и «предыдущие» статьи по алфавиту. Не существует словников с номерами страниц, для ДО, а также каких-либо для 1-го издания. --Vladis13 (обсуждение) 22:04, 30 сентября 2015 (UTC)
Пробовал извлекать пагинацию из колонтитулов скана. Но это не вариант. --Vladis13 (обсуждение) 22:04, 30 сентября 2015 (UTC)
Да, я видел. Да, это сложно и может быть и недостижимо. Кстати, если текстовый слой представленных в коммонс сканов не очень хороший, можно попробовать сделать новый слой (своей локальной OCR программой, только не tesseract, у него качество точно хуже будет, а ABBY, например; или же через archive.org) и перезалить в коммонс новые версии книг... Hinote (обсуждение) 21:24, 1 октября 2015 (UTC)
Этот уже перезалитый с РГБ, лучше сканов вроде нет (на rutracker выложены хуже). Распознавать колонтитулы пробовал локально с помощью ABBY Finereader, результат привёл, да ещё она саму страницу распознаёт долго, потеря времени. Возможно, распознование можно улучшить функцией обучения в ABBY. Может у кого-то из участников викитеки уже есть файл обучения для старой офрографии и поделится? Хотя, как-то я сидел целый день, обучая ABBY одной книге в старой орфографии, а результат был такой же, если не хуже. --Vladis13 (обсуждение) 06:59, 2 октября 2015 (UTC)
Я понял, о чем вы -- чтобы иметь возможность "подправить" номер страницы скана непосредственно в параметре шаблона-шапки страницы. Так одно другому не мешает. Я не помню, удалил я из шапок ВЭ и РБС за ненадобностью или оставил, но там есть (или была) следующая логика: номер страниц (-ы) книги берется из словника, номер страницы скана из этого вычисляется (с учетом пропущенных или задвоенных страниц в некоторых сканах), а вот если в параметре шаблона-шапки явно определено иное значение -- то используется оно. И для страницы в книге и для странице в скане. Так что вы можете сначала аккуратно добавить подбор страниц книги из словника (и/или вычисление страниц скана из страниц книги) по такой же схеме, т.е. с использованием явно указанных в параметре значений, если они есть, затем удалить из страниц эти параметры, ну а потом вы сможете на некоторых из страниц поправлять это, задавая соотв. параметры как и сейчас. Тогда это будет означать, что значение, подбираемое из словника или вычисляемое значение страницы скана неверно и надо другому участнику, который не боится лезть и править шаблоны или модули, посмотреть на несоответствие и исправить... Hinote (обсуждение) 20:06, 30 сентября 2015 (UTC)
  • @Hinote: Если возражений нет, тогда я только «за» убирание параметра «страница скана». Ибо при ручном редактировании необходимость заполнения дублирующейся рутины — это огромная заморочка. --Vladis13 (обсуждение) 19:35, 1 октября 2015 (UTC)
  • Ок. Тогда давайте запишем это пока как open task, я подумаю, как это лучше увязать с изготовлением "правильного" словника (т.е. с другими шагами, с эти связанными), когда именно и что поменять, чтобы было проще и лучше... Hinote (обсуждение) 21:27, 1 октября 2015 (UTC)

Текущий статус заливки[править]

А каков текущий статус ботозаливки? Все страницы статей этого корпуса существуют в ВТ и делаются уже только глобальные изменения в них, или пока не все? Hinote (обсуждение) 23:20, 30 сентября 2015 (UTC)

  • Сегодня доделаю. --Vladis13 (обсуждение) 18:33, 1 октября 2015 (UTC)
    • Просто я, когда будут все статьи, попробую, если вы не против, сделать "правильный" словник, с порядком статей, соответствующим изданию и со страницами... Дайте тогда отмашку... Это 2-е издание? Из яндекса? Диапазоны страниц там в параметре шапки только вручную размещаются или есть какие-то данные, которые вы ботом помещаете? Hinote (обсуждение) 18:41, 1 октября 2015 (UTC)
      • Я только за. Начинайте когда вам удобно, мне осталось доделать совсем немного страниц, мелочи. Да, 2-е издание (ТСД-2), оно не из яндекса, наоборот яндекс его опубликовал из другого источника в сильном сокращении. Есть два словника: 1) Опубликованный - он делается вручную, сейчас сделан только для первых нескольких букв (более полный для 3-го издания), и в нём одна пагинация для диапазона страниц тоже добавляемая вручную. 2) Викитека:Проект:ТСД/ТСД2-98 - Словник - словник заливаемых страниц 2-го издания. Он достаточно актуальный. Только этой ночью как доделаю заливку - некоторые названия страниц в нём надо будет актуализировать (переименованы). Ботом/скриптами в них ничего не добавляется. --Vladis13 (обсуждение) 20:02, 1 октября 2015 (UTC)
        Дмитрий дополнил «опубликованный» словник (из второго) почти для всех букв. --Vladis13 (обсуждение) 21:46, 1 октября 2015 (UTC)
        Словники для ТСД-2 имеют суффикс «-доп». Кстати, может переименовать их понятнее? --Vladis13 (обсуждение) 03:14, 3 октября 2015 (UTC)
        • "Ботом/скриптами в них ничего не добавляется." -- Я имел в виду не в словники, а в сами залитые страницы, в параметры шапки -- добавляются ли как то диапазоны страниц ботом (может быть у вас есть номера страниц для статей) или же это делается только вручную? (Речь везде только о корпусе статей 2-го издания, который вами заливается, т.к. относительно остальных изданий я уже понял, что все делается Дмитрием и вами вручную...) Hinote (обсуждение) 20:56, 1 октября 2015 (UTC)
          • Пагинация нигде ботом/скриптами не добавляется. --Vladis13 (обсуждение) 21:46, 1 октября 2015 (UTC)
            • Понял, жаль. Я просто по правкам это не понял -- бот ваш их добавляет из какого-то списка, который у вас возможно есть вместе с заливаемыми статьями, или же только вручную для каждой из просматриваемых вручную статей... Значит придется поиспользовать те уже установленные значения в статьях, где это уже вручную сделано в соотв. параметре в шапках страниц статей, а для остальных статей, где этот параметр не установлен -- пролистать книги постатейно в рамках изготовления словников... Hinote (обсуждение) 21:52, 1 октября 2015 (UTC)
              • Я вытаскивал пагинацию в шапку из тегов «< pages» и «{{#lst:» статьей (тэги заполняются вручную). Кое-где ещё не вытащено, — отложил эту задачу на время завершения заливки. Завтра-послезавтра пройдусь ботом, может ещё найдётся. --Vladis13 (обсуждение) 23:05, 1 октября 2015 (UTC)
  • Ботозаливка окончена. Осталось "причесать" кое-что, и актуализировать словник (некоторые статьи переименованы). --Vladis13 (обсуждение) 03:46, 2 октября 2015 (UTC)
Поздравляю с окончанием первого основного этапа этой работы. Да, я заметил. Там ещё много чего надо переименовать. Статьи часто дублируют друг друга под разными названиями (начальными гнёздами). Мне кажется предпочтительней называть их по 3-му изданию. Dmitrismirnov (обсуждение) 05:45, 2 октября 2015 (UTC)
Дублежа не обнаружил — сравнивал буквально списки переиздания98 и заливаемых. В переиздании98 44330 статей (считая омонимы-неоднозначности), в Категория:ТСД:Статьи из 2-го издания 44359 шт. (за вычитом ДО и несловарных статей), учитывая что там есть редиректы. Если дубликаты и затесались их буквально единицы.
Местами названия статей по 3-му изданию смущает. Но таких лишь несколько штук. Например, не ТСД/Ведение от слова «водить», а непонятная «веделица», не ТСД/Боровик от «бор», а «Боровика». Сделал по 3-му, — ибо всеровно статьи ищутся через поиск а он выдаёт текст а не названия, и перенаправления есть. --Vladis13 (обсуждение) 07:31, 2 октября 2015 (UTC)
Хорошо, если дубли мне попадутся, я дам Вам знать. Так буквально 20 минут назад статью ТСД/Е пришлось перенаправить в ТСД/Е 1, потому что она её дублировала. Dmitrismirnov (обсуждение) 11:37, 2 октября 2015 (UTC)
Интересно, что во всех трёх изданиях в этой статье (ТСД/Е 1 и ТСД/Е 1/ДО) имеются значительные различия. Dmitrismirnov (обсуждение) 11:44, 2 октября 2015 (UTC)
Понял. Это была парочка таких случаев. Ботозаливка создавала страницы которых ещё нет. А тут омонимы-неоднозначность, были страницы «Е 1» и «Е 2», но небыло страницы «Е», вот бот её и создал. --Vladis13 (обсуждение) 21:20, 2 октября 2015 (UTC)


Кунсткамера[править]

Отсутствие статей[править]

следует добавить текст из Переиздания98

В ТСД-2 и ТСД-3 она по разному названа. Поправил по оригиналу, перенёс в ту как называется в ТСД-3. --Vladis13 (обсуждение) 23:10, 5 октября 2015 (UTC)
ТСД/Залужить - не нашёл текста 2 издания в ботозаливке. Попробую восстановить по оригиналу. Dmitrismirnov (обсуждение) 23:00, 13 октября 2015 (UTC)
Это из-за упомянутой ошибки дозаливки, пропустил. В переиздании она есть. --Vladis13 (обсуждение) 00:21, 14 октября 2015 (UTC)
  • ТСД/Залп, ТСД/Зал, ТСД/Залывье — не нашёл текста 2 издания в ботозаливке. Восстановил по оригиналу. --Dmitrismirnov (обсуждение) 06:59, 14 октября 2015 (UTC)
  • @Vladis13:! Не нашёл статьи 2-го издания на стр. ТСД/Багровый а также в переиздании 98. Текст есть только в оригинале: Страница:Толковый словарь Даля (2-е издание). Том 1 (1880).pdf/126 Dmitrismirnov (обсуждение) 21:49, 16 октября 2015 (UTC)
  • Есть редкие случаи отсутствия статей в имеющимся переиздании98. Нашёл подобную статью только на сайте http://www.classes.ru/all-russian/russian-dictionary-Dal.htm, причём с оформлением. Это явно переиздание98, признаки: первый термин заглавными буквами, характерные сокращения (вологод. вместо далевского влгд., умалит. вместо умал. и т.п.). --Vladis13 (обсуждение) 21:42, 23 октября 2015 (UTC)
  • Да, Влад, я уже не раз и не два обнаруживал отсутствие статей 2-го издания, и восстанавливал их по скану с оригинала. Я не предупреждал Вас об этом, а наверное надо было, чтобы не забыть потом включить эти статьи в словник. Но при сверке словника с оригиналом они всё равно должны обнаружиться. Не так ли? Может быть нам следует завести для этих случаев отдельную папку или специальный раздел? Dmitrismirnov (обсуждение) 00:17, 24 октября 2015 (UTC)
  • Думаю не надо, при вычитке словника обнаружатся. Я тоже восстаналивал ряд статей не сообщая. Мне кажется, отсутствующие статьи обычно попадались с буквами ѣ и ѵ, но не суть. Я просто сообщаю, с какого сайта их можно скопировать, чтобы вручную не писать. Сейчас восстановил длинющую статью ТСД/Пола. В заливке она была сканирована частично с посторонним текстом, в вышеназванном сайте была только 1/3 статьи, хоть и с оформлением, нашлась полностью только на яндексе с 1-го издания с частичным оформлением (хотя там вроде тоже переиздание98). --Vladis13 (обсуждение) 00:36, 24 октября 2015 (UTC)

Дубляжи[править]

следует перенести текст (соединив с текстом 3-го изд.) и перенаправить (на название по словнику ТДК-3):

  1. Yes check.svg Сделано: ТСД/Амбар, анбар дублирует статью ТСД/Амбар
  2. Yes check.svg Сделано: ТСД/Амброзия, амвросия дублирует статью ТСД/Амброзия..
  3. Yes check.svg Сделано: ТСД/Анда, анно дублирует статью ТСД/Анда.
  4. Yes check.svg Сделано: ТСД/Антрепренер, антресоль дублирует ТСД/Антрепренёр (нет нужды в в двух страницах для одной статьи). Исправил Dmitrismirnov (обсуждение) 20:14, 2 октября 2015 (UTC)
  5. Yes check.svg Сделано: ТСД/Армянский камень весь текст входит в статью ТСД/Армянка как её составная часть.
  6. Yes check.svg Сделано: ТСД/Артезианский колодезь дублирует статью ТСД/Артезианский колодец в качестве сост. части.
  7. Yes check.svg Сделано: ТСД/Бабарская пшеница? (название со знаком вопроса!) дублирует статью ТСД/Бабарская песчица?.
  8. Yes check.svg Сделано: ТСД/Бабка, бабочка текст входит в более развёрнутую статью ТСД/Бабистый/ДО.
  9. Yes check.svg Сделано: ТСД/Байка, ТСД/Байка/ДО vТСД/Байка 2 текст 2-го издания соответствует тексту ТСД/Байка 3 и должен быть перенесён туда.
    @Dmitrismirnov: Может объединить ТСД/Байка 1 и ТСД/Байка 2? В 1-2 издании у Даля это одна статья, в 3-м Бодуэен зачем-то разделил их абзацем, хотя оба ссылаются на баять и баю - корень и смысл один. Объединить как я сделал в ТСД/Безрукий с "Безручка". --Vladis13 (обсуждение) 23:08, 2 октября 2015 (UTC)
    Хорошая идея. -- Dmitrismirnov (обсуждение) 23:32, 2 октября 2015 (UTC)
  10. Yes check.svg Сделано: ТСД/Бакша 2 текст 2-го издания соответствует тексту ТСД/Бакша 3 и должен быть перенесён туда.
  11. Yes check.svg Сделано: ТСД/Балл, бал дублирует статью ТСД/Балл
  12. Yes check.svg Сделано: ТСД/Бамьи сучья дублирует статью ТСД/Бамьи-стручья
  13. Yes check.svg Сделано: ТСД/Баркан 2 более соответствует тексту ТСД/Барканица и должен быть перенесён туда.
  14. Yes check.svg Сделано: ТСД/Баркан 1 в точности соответствует тексту ТСД/Баркан 2 и должен быть перенесён туда.
  15. Yes check.svg Сделано: ТСД/Борец 2 текст 2-го издания соответствует тексту ТСД/Борец 3 и должен быть перенесён туда.
  16. Yes check.svg Сделано: Упорядочил: ТСД/О, ТСД/О 1, ТСД/О 2, ТСД/О/ДО, ТСД/О 1/ДО, ТСД/О 2/ДО, Превратил в перенаправление: ТСД/О 3

-- Dmitrismirnov (обсуждение) 15:14, 2 октября 2015 (UTC)

  • Почему в статье ТСД/Веретено два раза идет «2-е издание»? Hausratte (обсуждение) 17:08, 2 октября 2015 (UTC) / Исправил ошибку бота. Дубль. Страница уже была оформлена ранее. Dmitrismirnov (обсуждение) 19:41, 2 октября 2015 (UTC)
    • Я писал, что алгоритм дозаливки сложный, и что пометил её категорией и в течении пары дней всякие её нюансы «причешу». Проверил, других таких ошибок нет. --Vladis13 (обсуждение) 01:09, 3 октября 2015 (UTC)


Объединение одноименных страниц в одну[править]

Как показал опыт, в некоторых случаях логичнее слить несколько страниц-омонимов в одну

Здесь список подобных страниц:

в СО в ДО как это было раньше
ТСД/Алабор, ТСД/Алабор/ДО (2 с. - слил вместе 2 страницы: Алабор 1-2)
ТСД/Алое, ТСД/Алое/ДО (2 с.: Алое 1-2)
ТСД/Арса, ТСД/Арса/ДО (2 с.: Арса 1-2)
ТСД/Арца, ТСД/Арца/ДО (2 с.: Арца 1-2)
ТСД/Арча, ТСД/Арча/ДО (2 с.: Арча 1-2)
ТСД/Аршан, ТСД/Аршан/ДО (2 с.: Аршан 1-2)
ТСД/Ат, ТСД/Ат/ДО (2 с.: Ат 1-2)
ТСД/Ата, ТСД/Ата/ДО (2 с.: Ата 1-2)
ТСД/Атлас, ТСД/Атлас/ДО (2 с.: Атлас 1-2)
ТСД/Атя, ТСД/Атя/ДО (2 с.: Атя 1-2, Атька)
ТСД/Аще, ТСД/Аще/ДО (2 с.: Аще 1-2)
ТСД/Багор, ТСД/Багор/ДО (2 с.: Багор 1-2)
ТСД/Багровый, ТСД/Багровый/ДО (2 с.: Багровый 1-2)
ТСД/Бава, ТСД/Бава/ДО (2 с.: Бава 1-2)
ТСД/Байка, ТСД/Байка/ДО (3 с.: Байка 1-3)
ТСД/Бака, ТСД/Бака/ДО (2 с.: Бака 1-2)
ТСД/Бакан, ТСД/Бакан/ДО (2 с.: Бакан 1-2)
ТСД/Бакля, бакляга, ТСД/Бакля, бакляга/ДО (2 с.: Бакля, бакляга - во 2 изд. в одной статье)
ТСД/Бакса, ТСД/Бакса/ДО (2 с.: Бакса, бакса 1)
ТСД/Бакша, ТСД/Бакша/ДО (3 с.: Бакша 1-3)
ТСД/Бодяга, ТСД/Бодяга/ДО (3 с.: Бодяга 1-3)
ТСД/Болтовой,   ТСД/Болтовой/ДО   (2 с.: Болтовой 1-2)
ТСД/Болт, ТСД/Болт/ДО (2 с.: Болт 1-2)
ТСД/Болтыхать ТСД/Болтыхать/ДО (2 с.: Болтыхать 1-2)
ТСД/Борец, ТСД/Борец/ДО (2 с.: Борец 2-3)
ТСД/Бон, ТСД/Бон/ДО (2 с.: Бон 1-2)
ТСД/Борок ТСД/Борок/ДО (2 с.: Борок 1-2)
ТСД/Боронение, ТСД/Боронение/ДО, (2 с.: Боронение 1-2)
ТСД/Боронить, ТСД/Боронить/ДО, (2 с.: Боронить 1-2)
ТСД/Бороний, боронка, ТСД/Бороний, боронка/ДО (2 с.: Бороний, боронка 1-2)
ТСД/Боронник, бороньба, ТСД/Боронник, бороньба/ДО (2 с.: Боронник, бороньба 1-2)
ТСД/Бортн-, бортный, ТСД/Бортн-, бортный/ДО (2 с.: Бортн-, бортный 1-2)
ТСД/Волжанка, ТСД/Волжанка/ДО (2 с.: Волжанка 1-2)
ТСД/Волженка, ТСД/Волженка/ДО (2 с.: Волженка 1-2)
ТСД/Еда 1, ТСД/Еда 1/ДО (2 с.: Еда 1-2, Ёда 2, см. также Еда 3 (Ѣда) = Еда)
ТСД/Залудить, залуживать, ТСД/Залудить, залуживать/ДО, (2 с.: Залудить 1-2, залуживать)
ТСД/Зябра, ТСД/Зябра/ДО, (2 с.: Зябра 1-2)
ТСД/Мак, ТСД/Мак/ДО, (2 с.: Мак 1-2)
ТСД/Одерябить - ТСД/Одерябить/ДО (2 с.: Одерябить 1-2)
ТСД/Отава, ТСД/Отава/ДО (3 с.: Отава 1-3)
ТСД/Отай, ТСД/Отай/ДО (2 с.: Отай 1-2)
ТСД/Теология ТСД/Теология/ДО (Статьи 3-го изд. «Теократия» и «Теология», объеденены на одной стр., как в 1х двух изданиях)
ТСД/У!/ДО, ТСД/У!/ДО (4 с.: У 1-4)
ТСД/Фаз, ТСД/Фаз/ДО (2 с.: Фаз 1-2)
ТСД/Фухтель, ТСД/Фухтель/ДО (2 с.: Фухтель 1-2)
ТСД/Хабарка, ТСД/Хабарка/ДО, (2 с.: Хабарка 1-2)
ТСД/Хабарник, ТСД/Хабарник/ДО, (2 с.: Хабарник 1-2)
ТСД/Юга, ТСД/Юга/ДО (2 с.: Юга 1-2)
ТСД/Юк ТСД/Юк/ДО (2 с.: Юк 1-2)
ТСД/Юс, ТСД/Юс/ДО (3 с.: Юс 1-2 + Юсы*)
ТСД/Юхала, ТСД/Юхала/ДО (2 с.: Юхала 1-2)
ТСД/Вып (2 с.: Вып и Выпь) я разделил эти две статьи. Dmitrismirnov (обсуждение) 14:29, 11 октября 2015 (UTC)

А эти может объединить, как которые выше? В ТСД-2 это одна статья, в ТСД-3 отдельные.

--Vladis13 (обсуждение) 07:22, 3 октября 2015 (UTC)

Просто они вроде омонимы. Не уверен. --Vladis13 (обсуждение) 09:16, 3 октября 2015 (UTC)

Обработал поиск дубликатов по символам: [-,!?1]. --Vladis13 (обсуждение) 07:56, 3 октября 2015 (UTC)

@Vladis13: на всякий случай, если Вы будете сливать вместе статьи-омонимы, присоединяйте их к моему списку (чуть выше), чтобы не терять контроля над этим процессом. Я понял, что в словнике при этом менять ничего не надо, но следует сделать все необходимые редиректы. Dmitrismirnov (обсуждение) 13:10, 10 октября 2015 (UTC)
@Vladis13: думаю, не стоит объединять статьи ТСД/Вып и ТСД/Выпь на одной странице, поскольку между ними (в 3 изд.) 2 других статьи (Выпырять и Выпытать). Dmitrismirnov (обсуждение) 21:11, 10 октября 2015 (UTC)

Дубляжи в оригинале[править]

  • Статьи ТСД/Боровец и ТСД/Буровец даны в двух почти идентичных вариантах в первых двух изданиях с очень небольшими изменениями (о на у, добавлено м. кур.). В третьем исправлено на перенаправление. Оставлено, как в оригинале. --Dmitrismirnov (обсуждение) 08:04, 3 октября 2015 (UTC)


"Волкан" и "Вулкан"[править]

Я сделал это для уточнения, так как с удивлением обнаружил что Вы поставили (наверное случайно) вместо статьи всего три слова:
https://ru.wikisource.org/w/index.php?title=%D0%A2%D0%A1%D0%94/%D0%92%D1%83%D0%BB%D0%BA%D0%B0%D0%BD&diff=1807737&oldid=1798225
Когда позднее я сверил с переизданием98 -- там была вся статья, но не редактированная, и я поставил туда отредактированный текст. Этот случай ещё раз доказывает, что текст с полным переизданием98 очень нужен для сверки. Подобных случаев может ещё оказаться немало. --Dmitrismirnov (обсуждение) 11:54, 9 октября 2015 (UTC)
Это не ошибка. Есть "ТСД/Волкан", а есть "ТСД/Вулкан" которая в переиздании98 именно в 3-х словах. Также в оригинале книги: Страница:Толковый словарь Даля (2-е издание). Том 1 (1880).pdf/326 и Страница:Толковый словарь Даля (2-е издание). Том 1 (1880).pdf/371. Также в ТСД-3: Страница:Толковый словарь. Том 1(2) (Даль 1903).djvu/54. Стоит их объединить, или сделать отдельные страницы? --Vladis13 (обсуждение) 12:25, 9 октября 2015 (UTC)
Спасибо, что сказали! Я не знал... Исправил свою ошибку. Dmitrismirnov (обсуждение) 14:33, 9 октября 2015 (UTC)

Статья "С"[править]

Влад, заметили ли Вы, что в статью С (2 изд.) было добавлено содержание статьи С 2 (Съ), которая находится на стр. скана: 390-391 ? Dmitrismirnov (обсуждение) 11:32, 31 октября 2015 (UTC)

Да, сейчас разделено на отдельные страницы. --Vladis13 (обсуждение) 12:52, 31 октября 2015 (UTC)

Ошибки[править]

223. Алексѣя теплаго / Алексея теплого
224. Алексѣя-теплаго / Алексея-тёплого
Dmitrismirnov (обсуждение) 12:57, 12 октября 2015 (UTC)
199. Алажъ / Алаж
Dmitrismirnov (обсуждение) 13:03, 12 октября 2015 (UTC)
165. Акклиматизировать / Акклиматизировать
166. Аккомпанировать / Аккомпанировать
167. Аккордъ / Аккорд
168. Аккредитовать / Аккредитовать
169. Аккуратный / Аккуратный

Dmitrismirnov (обсуждение) 13:14, 12 октября 2015 (UTC)

239. Аллегорія / Аллегория
240. Аллегро / Аллегро
241. Аллея / Аллея
242. Аллигаторъ / Аллигатор
243. Аллилуйя / Аллилуйя ---исключение (в оригинале с двойным первым "лл": Аллилуія !!!)
244. Аллодіальный / Аллодиальный
245. Аллопатія / Аллопатия
246. Аллювій / Аллювий
247. Аллюръ / Аллюр
Dmitrismirnov (обсуждение) 13:22, 12 октября 2015 (UTC)
Дмитрий, так может сразу там и исправите названия ДО? (Название ДО -- это второй параметр). И переставить сразу можно на нужное место... Это и есть часть ручного прохода при корректировке сгенерированного словника... Как бы там это все для этого и присутствует: видите несоответствие -- правите... Название ДО можно просто поправить, но поскольку по этому названию и проводилась автоматическая сортировка, то исправление этого названия как правило означает, что нужно соотв. строку переместить, т.к. изменился и лексикографический порядок. Название СО в первом параметре -- это название страницы статьи, если его правите, то нужно и переименовывать страницу статьи (и наоборот, если переименовывается страница статьи, то нужно в словнике поменять этот параметр). Если же название статьи в СО по каким-то причинам должно отличаться от названия страницы статьи -- то для этого есть 3-й параметр. Сейчас он не заполнен, но если нужно указать название статьи в СО, отличное от названия страницы (напр., название без суффикса " 1", " 2", который вы добавляли в названия страниц одноименных статей) -- то нужно его прописать в третьем параметре. Все достаточно просто. Hinote (обсуждение) 17:12, 12 октября 2015 (UTC)
Боюсь, что это для меня слишком сложно, и я мало что понял из данного объяснения. Здесь должен править специалист... :) Dmitrismirnov (обсуждение) 18:55, 12 октября 2015 (UTC)
Ну почему же, у вас прекрасно получается (посмотрел ваши правки до Авантюрина). Сразу скажу, что надо переставить статьи Б, В, и т.д. (они записаны в ДО как БЪ, ВЪ, поэтому находятся совсем не в том месте, в конце списка статей на Б, В и т.д.) Не стал сам править, чтобы не было конфликта с вашими правками, если вы правите в то же время, чтобы не усложнять... Может, нам в начало страницы словника, которую вы, Vladis13, я взялись править, ставить на время работы (просмотр списка, внесение исправлений), например, маркер {{Перерабатываю}}, чтобы исключить конфликты правок и упростить взаимную работу?... Hinote (обсуждение) 19:47, 12 октября 2015 (UTC)
С {{перерабатываю}} хорошая идея! Только лучше приостановить сейчас вычитку словника, надо доделать его разделение на части. Затем можно всем одновременно с ним заниматься, каждый своим делом, дел много: подключить скрипты/шаблоны, вычитка-орфография-порядок, пагинация. --Vladis13 (обсуждение) 20:25, 12 октября 2015 (UTC)
Да, действительно, так наверное будет удобнее, т.к. списки огромные. Поскольку сейчас в списках -- сортировка по ДО, хоть и с огрехами, то больших перемещений статей из одной части словника в другую не предвидится, так что, действительно, удобнее побить на части. Hinote (обсуждение) 21:28, 12 октября 2015 (UTC)
У меня сразу такой вопрос: в список 2-го издания почему-то попало название статьи ТСД/Абапал, которая есть в 1-м и 3-м изданиях. Однако этой статьи во 2-м издании нет. Есть правда статья ТСД/Обапол в соответствующем месте (другое написание этого же слова). Так что делать, изъять её из списка, или снабдить примечанием, что данная статья с таким названием именно в этом издании отсутствует? Dmitrismirnov (обсуждение) 21:06, 12 октября 2015 (UTC)
Со статьей, которой нет во 2-м издании, но есть в 1-м: м.б. поместить ее в комментарий? Без дополнительных пояснений, просто эту строку в комментарий -- будем знать, что это из 1-го издания... Или же пояснение написать, тоже в комментарии, что это из 1-го издания? А потом когда-нибудь потом поймем, что с ней делать... (3-е издание отдельно стоит, там список сильно отличается, так что пока на него предлагаю не смотреть в этой части работы над словниками...) Hinote (обсуждение) 21:28, 12 октября 2015 (UTC)
Yes check.svg Сделано Для ТСД/Абапал указал (вчера еще) это в примечании, Дмитрий, посмотрите. Так можно (наверное лучше именно так) указывать доп. информацию о статьях, чтобы потом решить, что делать в каких-то особых случаях. Hinote (обсуждение) 04:53, 14 октября 2015 (UTC)

Я видел это:
# {{Статья в словнике ТСД|Абапал |Абапалъ || || }} <!-- (нет во 2-м изд.[!!!] - только в 1-м и 3-м.) -->
...но не понял, почему эта информация скрыта -- её нигде нельзя увидеть (кроме как в режиме редактирования), и почему это название оставлено в словнике 2 издания, хотя статьи с таким названием в этом издании нет. Мне кажется, что в словнике должны быть только статьи, входящие в издание, а для таких и подобных случаев нам надо завести отдельное место типа "примечания к словнику 2-го издания ТСД" (может быть внизу на той же странице). Dmitrismirnov (обсуждение) 07:49, 14 октября 2015 (UTC)

  • Дмитрий, можно и просто текстом, и примечанием (переделал строку Абапал из комментария на просто текст, для примера). Почему не удалять пока: пока мы не знаем, будет отдельный словник для 1-го издания или же он будет совмещен с этим делающимся нами словником для 2-го издания, правильно? Поэтому, если статья есть в 1-м издании (не важно, есть она в 3-м или нет) или же наоборот -- статья есть во 2-м и ее нет в 1-м, то это лучше пока просто как-то пометить. А потом уже придумаем, что с ними делать: переносить в отдельный словник для 1-го издания или как-то скомпоновать в одном словнике для 1-го и 2-го. Я так думаю. Конечно же, если статья есть только в 3-м издании, ее нет ни в 1-м, ни 2-м, но она по каким-то причинам все равно попала в эти сгенерированные словники -- то ее можно (нужно?) удалить, пока мы на 3-е издание не смотрим в части словников, т.к. и так понятно, что там большие отличия... (Дмитрий, Vladis13 -- я на своей странице участника указал свое имя в юзербоксе, можете его использовать в обсуждениях для обращения, если это проще, чем писать ник (как я использую имя Дмитрия вместо его более длинного имени пользователя)) Hinote (обсуждение) 15:40, 14 октября 2015 (UTC)

Статьи-омонимы[править]

Это Вам для справки и для введения в словник: я разобрался и упорядочил нумерацию статей "О". У Вас ботом были сделаны ТСД/О 1/ДО, ТСД/О 2/ДО и ТСД/О 3. А в 3-ем издании всё сдвинуто на 1: ТСД/О, ТСД/О 1 и ТСД/О 2. Я сделал всё по 3-му изданию а ТСД/О 3 переправил на ТСД/О 2/ДО. Таким образом в словнике должны быть следующие шесть страниц:

  1. ТСД/О
  2. ТСД/О 1
  3. ТСД/О 2
  4. ТСД/О/ДО
  5. ТСД/О 1/ДО
  6. ТСД/О 2/ДО --Dmitrismirnov (обсуждение) 14:43, 6 октября 2015 (UTC)
  • @Dmitrismirnov: Было обсуждение с какого числа нумировать омонимы-неоднозначности. Обсуждение Викитеки:Проект:ТСД/Архив#Статьи-омонимы Решили же с единицы. Вы тогда привели цитату самого Бодуэна, нумирующего с "1", а также сами переименовали "Бес" и "Бес 1" в "Бес 1" и "Бес 2". --Vladis13 (обсуждение) 16:19, 6 октября 2015 (UTC)
    • Вы исходите из общей логики, а я из того что имеется на самом деле. Факт заключается в том, что Даль не нумеровал эти статьи, а Бодуэн это сделал, и я стараюсь воспроизвести его логику, пусть не всегда последовательную. Я не думаю, что мы сможем всё унифицировать. Так можно далеко зайти. Но такие вещи не очень важны. И если Вы против, можно всё это обсудить и прийти к какому-то обоюдно-согласованному решению. Гораздо важнее, чтобы тексты разных изданий соответствовали друг другу на одной странице, а не не разных. Dmitrismirnov (обсуждение) 19:01, 6 октября 2015 (UTC)
      • случай с бесом совсем особенный: там в источнике нет нумерации, но есть бесъ и бѣсъ - два разных написания этого слова. Dmitrismirnov (обсуждение) 19:04, 6 октября 2015 (UTC)
        • С единицы нумерация человечней. Это же не массивы в программировании, где нумерация с нуля, "1" = 2. Тогда и все другие омонимы с цифрами переименовывать надо. А то "А" и "О" с нуля (если А опять не переименовано), а у 573 остальных омонимов нумерация с "1". --Vladis13 (обсуждение) 07:49, 7 октября 2015 (UTC)
        По другим омонимам. Статей с номерами у Даля нет, у Бодуэна многие разделены на несколько гнёзд и названы с номерами. Лучше по возможности так и оставить. Чтобы словники были адекватны статьям оригиналов. Например, чтобы в словнике ТСД-2 было «ТСД/Ять», а в словнике ТСД-3 было «ТСД/Ять 1» и «ТСД/Ять 2» — это статьи которые есть в оригиналах. --Vladis13 (обсуждение) 10:31, 7 октября 2015 (UTC)
        • Может быть. Сложность наша в том, что здесь объединяются 3 разных издания с разными принципами наименования статей. Вопрос кажется неразрешимым однозначно. Всё время приходится решать, исходя из конкретной ситуации. Может быть было бы хорошим решением объединить статьи-омонимы на одной странице, как мы уже начали это делать (хотя мы иногда и рискуем, что страницы могут оказаться довольно длинными?) И тогда можно было бы оставить авторские наименования статей... То есть, сделать одну статью "О", одну статью "А" и т. д. Только для случаев как "бесъ" и "бѣсъ" сделать нумерацию 1 и 2. Каково Ваше мнение? Dmitrismirnov (обсуждение) 10:52, 7 октября 2015 (UTC)
Согласен, и с вашим предложением, и что вопрос сложный, и с логикой Бодуэна разделять омонимы на отдельные словарные статьи. Мне кажется довольно симпатично получилось на ТСД/Бодяга и ТСД/Юга, +не плодятся лишние страницы. Я ранее поднимал вопрос о статьях-редиректах, предлагая их как раз объединить на одной странице. Но Hausratte ответил: «Статьи-перенаправления должны быть обязательно сохранены, такова общая практика во всех словарях, выложенных в ВТ. … (напр., Категория:ЭСБЕ:Перенаправления — таких статей около 16 тыс.). На одной странице они не нужны, они нужны постатейно. Категория:ТСД:Перенаправления — и вы не прокомментировали. Как быть с этим противоречием? --Vladis13 (обсуждение) 13:34, 7 октября 2015 (UTC)
  • Я думаю, что с объединением подобных статей мы упростили бы координацию, а также работу со словниками. Давайте спросим мнение участника @Hinote:, поскольку он собирается принять участие в их составлении. Dmitrismirnov (обсуждение) 13:45, 7 октября 2015 (UTC)
    С редиректами это немного другой вопрос, поскольку там не омонимы, а скорее синонимы, то есть другие слова с подобными значениями, и поэтому если человек хочет найти какое-то слово, он обратится именно на эти страницы, которые его приведут на правильную страницу. Структура этих редиректов не всегда простая, иногда она объединяет по нескольку слов со сходным написанием, включая некоторые пояснения, что приближает их по значению к статьям. Так что, наверное, их стоит оставить как есть. Dmitrismirnov (обсуждение) 13:55, 7 октября 2015 (UTC)
  • Ещё можно оформлять дизамбигами (страницами неоднозначностей). Пример: ТСД/Весь, в тсд2 и тсд3 это разные статьи, хоть и соседние и в тсд3 нумерованы. Мне кажется в таком случае объединять их не стоит, или может ещё лучше переименовать вторую статью в "Весь, вся, все"? --Vladis13 (обсуждение) 11:23, 11 октября 2015 (UTC)
Категория:ТСД:Неоднозначность‎. --Vladis13 (обсуждение) 14:50, 11 октября 2015 (UTC)

Высчитываемый словник с пагинацией[править]

Словник с пагинацией можно сделать так:

  1. Имеется словник в СО. Зная некоторые правила старой орфографии можно перевести словник в ДО. Правила такие: в конце слов после согласных ставится «ъ», «е» может быть ѣ, и — і, ф — ѳ. Слова с «ъ» перекодировать элементарно. А с остальными указанными буквами можно пропустить, ввиду их неопределённости, или продублировать с обоими вариантами букв. Получится фрагментарный словник в ДО.
  2. В словаре слова идут по алфавиту в ДО. Если в словнике известно, что некая статья1 на 86 странице, статья5 на 86 странице, значит и статьи 2-4 на этой странице.
  3. Так можно точно вычислить пагинацию ряда статей. А других — достаточно точно, чтобы привести на непроверенных вручную страницах, и залить эти страницы в индекс для последующей выверки. Также можно автоматом переводить названия статей в ДО, и выводить в шапке. --Vladis13 (обсуждение) 07:52, 2 октября 2015 (UTC)
  • Почти так, см. ниже тему "Задачи по изготовлению словников (залитый корпус 2-го издание)". Большую задачу всегда удобнее разделить на небольшие шаги/фазы. Hinote (обсуждение) 23:28, 3 октября 2015 (UTC)


Скриптом «следующая/предыдущая» страница из категории[править]

@Hinote: Через скрипты возможно сделать выборку «следующей/предыдущей» страницы из категории, где статьи уже идут по алфавиту? А то страницы могут переименовываться, для каждого издания свой порядок… вручную следить невозможно. --Vladis13 (обсуждение) 22:02, 3 октября 2015 (UTC)

Нет, они берутся из словников. Т.е., при переименовании страницы статьи нужно соответственно поменять и запись в словнике... А зачем вообще предыдущий и следующий брать из категории? В категории же они будут браться по правилам СО, причем по названиям страниц статей, которые в общем случае могут не совпадать с названием собственно статьи в издании (вы же добавляете всякие суффиксы "1", и прочие -- все это влияет на порядок, в котором страницы показываются в категории), плюс это часто не совпадает с порядком в ДО в оригинальном издании. Так что только словник, в котором ссылки на страницы статей проставлены в нужном порядке (соответственно оригинальному изданию). Если это сделать однажды, то потом при работе над статьями нужно будет делать только разовые редкие исправления, когда меняется название страницы статьи -- нужно будет изменять и ее название в словнике. Это не так уж и сложно, исходя из опыта работы над другими проектами. Для разных изданий -- разные словники. Причем после создания словника для одного из изданий (для 2-го), их не нужно будет делать "с нуля" -- нужно будет взять готовый словник для этого 2-го издания и пройтись по томам другого издания, добавляя статьи, меняя их названия или перемещая, если порядок отличается... Это гораздо менее затратно, чем делать словник с нуля... Hinote (обсуждение) 22:51, 3 октября 2015 (UTC)
Порядок статей алфавитный (иного не замечал), для СО он согласно СО, для ДО свой. Суффиксы "1" (номера омонимов-неоднозначностей) идут в конце после слова, поэтому на порядок не влияют, ибо он алфавитный с начала слова. Из категории порядок подставлялся бы автоматически для десятков и сотен тысяч статей. Вручную его сделать можно (ботом по имеющемуся словнику), но проверять и следить за изминенениями... лучше бы это делал безошибочный автомат мгновенно и актуально. Для заполнения полей "следующий/предыдущий" сейчас используются несколько полей: два соответствующих поля, но если порядок статей отличается во 2-м издании то используется дважды шаблон {{sub-nav}}, в каждом из которых надо заполнить поля соответственно изданию, а из полей "следующий/предыдущий" убрать чтобы не перекрывали значения. См. пример ТСД/Абаз. Аналогично у статей в ДО. Надо ещё придумать как бы это ботом обработать после сделанной ботозаливки...
Это не единственно место применения. В версии словаря Категория:ТСД-2, переиздание '98, совр.орф. до сих пор (спустя несколько лет после его заливки) у множества страниц недоделаны поля "следующий/предыдущий", а с недавней его коррекцией и переименованием ряда страниц, всё ещё больше сбилось. Такой скрипт был бы очень полезен и для других книг и энциклопедий как вариант. В частных случаях ничто не мешает использовать улучшенный вариант, который вы предлагаете. (Хотя пока такого скрипта нет не сверить что лучше.)
Но вроде функций в Lua для такой цели нет mw:Extension:Scribunto/Lua reference manual. --Vladis13 (обсуждение) 00:03, 4 октября 2015 (UTC)
Признаюсь, я почти ничего из этого не понял, что вы тут имеете в виду... Про sub-nav, разумеется, я знаю, я знаю как реализуется навигация в шаблонах-шапках и посмотрел, как это делается для ТСД... "Алфавитный порядок" в категориях довольно своеобразный. Он отражает то, как викидвижок реализует лексикографический порядок. Можно несколько таких способов придумать. Например, утилита sort сортирует совсем иначе... И нам он, этот порядок в категориях, вообще не нужен: нам нужен порядок по изданию. И такой порядок будет отражен (и будет подбираться) из словников. И параметры ПРЕДЫДУЩИЙ и СЛЕДУЮЩИЙ тоже не нужны: ведь скоро они станут неиспользуемыми (ну, только в единичных случаях, где временно "подправить", как Дмитрий хочет), а все будет браться из словников... Зачем заполнять эти параметры? Это лишнее... Да, а технически: в вики нет способа получить список статей из категории. Ни в шаблоне, ни через Lua... Только через вики-API, но там надо это делать долго и нудно кусками по сколько-то ссылок из категории, правильно продляя запросы для каждого последующего куска... Hinote (обсуждение) 00:42, 4 октября 2015 (UTC)


О словниках 3-го издания[править]

Я думаю, что нужно делать словник 3-го издания -- так как он самый полный и включает практически все статьи предыдущих двух изданий. Dmitrismirnov (обсуждение) 23:48, 3 октября 2015 (UTC)

  • Словник 3-го издания невозможно сделать в течении пары дней/недели. Его только вручную, 270 тыс. статей. Может быть издание выложено в интернет? - скажите где, спарсю. --Vladis13 (обсуждение) 00:18, 4 октября 2015 (UTC)
    • Именно так. Дмитрий, мы же не хотим делать словник вручную полностью с нуля -- это очень трудоемко. Надо максимально поиспользовать то, что есть. Для 2-го издания -- это список статей, который полон. Поэтому из него сделаем словник, а потом будем корректировать -- перемещать статьи, чтобы соотв. изданию, корректировать названия статей в ДО, добавлять пагинацию там, где она не прописана... Ну а потом уже можно будет сделать словник и для 3-го издания, используя уже этот готовый словник как наработку, так что тоже не с нуля... Hinote (обсуждение) 00:29, 4 октября 2015 (UTC)
      • Для справки (чтобы не делать двойную работу): В словаре 36 букв (в ДО). Для 3-го издания уже составлены словники полностью для 12 13 букв:
ТСД/Словник: АЕІЪЫЬѢЭЮѦЯѲѴ
Так что основные усилия стоит сосредоточить на словниках для остальных 24 23 букв. Dmitrismirnov (обсуждение) 07:38, 4 октября 2015 (UTC)
Не уверен, что эти буквы составят и 20% (от 270тыс.) статей. --Vladis13 (обсуждение) 21:17, 4 октября 2015 (UTC)
Только что сделал полный словник для буквы І, также дополнительные (-доп) словники для всех букв. Dmitrismirnov (обсуждение) 08:36, 4 октября 2015 (UTC)
А что такое -доп словники? Я что-то не допонял... Hinote (обсуждение) 17:59, 4 октября 2015 (UTC)
«-доп» словники это словники 2-го издания для каждой буквы, но названия статей даются только в СО, и расположены они по порядку так-называемого "переиздания98 года" (то естъ по современному алфавиту). В словнике на букву А: ТСД/Словник/А-доп я попробовал указать страницы оригинального издания. Такое (и нужно) можно было бы проделать со всеми остальными словниками. Dmitrismirnov (обсуждение) 19:37, 4 октября 2015 (UTC)
Уже не раз поднимались вопросы: «что такое словники "-доп"» и «где словники 2-го издания». Не заходящим сюда читателям не догадаться. Может переименуем «-доп» во что-то понятнее? --Vladis13 (обсуждение) 21:22, 4 октября 2015 (UTC)
«-доп» - это приставка временная. Эти словники можно считать заготовкой к созданию полноценного словника 2-го издания, когда:
*1) заголовки статей будут расположены в том порядке, как они даны в печатном издании;
*2) будут добавлены оригинальные заголовки в ДО;
*3) будут указаны номера страниц по печатному изданию.
Тогда их можно будет переименовать в словник соответствующего издания, например в: ТСД-1/Словник/А, ТСД-2/Словник/А, ТСД-3/Словник/А и т. д. Или предложите другой вариант названия... Dmitrismirnov (обсуждение) 23:36, 4 октября 2015 (UTC)
  • Несомненно, нужно по максимуму поиспользовать те наработки, которые уже есть.

    Так, давайте тут, прежде чем двигаться дальше, поговорим о том, сколько нам словников нужно и какие. Т.е., понятно, что список в 3-м издании наиболее полный (так ведь?). Т.е. можно было бы взять список статей из 3-го издания и добавить в него пагинацию -- и для 3-го издания и для 2-го и для 1-го. Если для какого-то издания для статьи нет пагинации (значение пустое) -- значит и этой статьи нет в издании. Но так можно сделать только в том случае, если нет статей, которые в разном издании расположены в разном порядке -- одна в одном издании перед второй, а в другом издании -- наоборот. Соответственно, вопрос: есть ли такие статьи, известны ли они вам (Vladis, Дмитрий), как знающим эти издания? Если такие статьи есть (или мы сейчас не знаем, но допускаем, что такие статьи могут быть), то нужно делать 3 разных комплекта словников, каждый из которых будет определять порядок статей только своего издания (и отсюда формировать ссылки на предыдущий и следующий)... Да, это не означает, что мы не будем в таком случае использовать наработки или, по-крайней мере, пытаться их использовать... Итак, что насчет разного порядка следования каких-либо статей, которые есть в более чем одном издании, но следуют в них в разном порядке -- @Dmitrismirnov, Vladis13:, что скажете? Hinote (обсуждение) 17:58, 4 октября 2015 (UTC)
Я думаю, что нет нужды создавать двойную и тройную навигацию, или так называемую "субнавигацию" по каждому из изданий в отдельности, но ограничиться одной простой навигацией, и расположить статьи по порядку 3-го издания. В таком случае подробные словники 2-го издания создавать большого смысла не имеет. Зато словник 3-го издания необходим. Dmitrismirnov (обсуждение) 20:10, 4 октября 2015 (UTC)
Так она сейчас уже есть по факту -- есть же 3 линейки навигации... Думаете, нужно убрать 3 линейки навигации и оставить одну? (от 3-го издания как наиболее полного, плюс "вставленные" в какое-то подходящее место между ними статьи из 1-го и 2-го издания, которых нет в 3-м, если такие есть... т.е. такого рода некая "общая" навигация) В принципе, здесь есть здравое зерно, сейчас с тремя линейками навигации шапка статей все же перегружена, ни к чему это по большому счету... Но чтобы все это понять, я все-таки хочу определиться, есть ли 1) статьи в одном из изданий, которые в другом идут в ином порядке (о чем выше писал), и 2) есть ли статьи в 1-м или 2-м издании, которых нет в 3-м. Возможно вам в уже сделанных вами статьях такие встречались... Hinote (обсуждение) 21:48, 4 октября 2015 (UTC)
Да, 1) есть статьи в одном из изданий, которые в другом идут в ином порядке 2) есть статьи в 1-м или 2-м издании, которых нет в 3-м. То и другое встречается, но редко, и я это всегда оговариваю в сносках. Dmitrismirnov (обсуждение) 22:41, 4 октября 2015 (UTC)
Нужен словник обоих изданий. Они полностью различаются пагинацией, весьма отличаются порядком слов, иногда и буквами в словах. 3-е издание не содержит всех статей 2-го, из тех не многих что я смотрел некоторых статей 2-го не нашёл в 3-м. (Навскидку, ТСД/Баллада. — Есть в ТСД-2, в ТСД-3 там «Балл-», причём статья ТСД/Балл- не расположена в словнике возле ТСД/Бал 1 и ТСД/Балл, которая неявно «Бал 2».) Напомню, что 3-е издание было изменено другим автором, подверглось жёсткой критике (оправданной или нет несуть) и не издавалось в СССР, т. е. словарь Даля и словарь Даля-Бодуэна — это достаточно разные книги.
Вот 1-е издание почти идентично 2-му (по сути, это исправление ошибок в словаре дочерью Даля, после его смерти). Ввиду того, что 1-е издание мало кому интересно (разница только в наличии в нём ошибок), работа над ним неведётся, и словники 1-2 изданий вполне можно объединить, может они даже идентичны как и большинство текста. Но даже тут таже проблема: если выводить на одной странице данные разных изданий (названия и пагинацию) — это будет загромождение страниц.
Также мне зачастую не нравится порядок слов в 3-м издании. Выше приводил пример, когда к слову «Ведение», от слова «Водить» 2-го издания, зачем-то в 3-м издании на первом месте Бодуэн приписал непонятое незначимое «ТСД/Веделица», из-за чего статья теперь так называется. Порядок по сомнительным словам… некрасиво. Другой пример привёл выше с Балладой, переименовывать «ТСД/Баллада» в «Балл-», озадачивая читателя словника почему в словнике нет слов «баллада» и «ведение», хотя есть в основной редакции словаря… — сомнительно и путано. --Vladis13 (обсуждение) 22:25, 4 октября 2015 (UTC)
Да в третьем издании, как я понял, Бодуэн выстраивает гнёзда в алфавитном порядке, поэтому заголовком статьи может оказаться менее характерное слово. В этом есть своя логика. Как из этого выходить нам, объединившим на одной странице статьи трёх изданий? Я предлагаю в заголовке указывать оба слова: по 1-2 изданиям и по 3-му. При этом делать перенаправления таким образом, чтобы и то и другое слово отражалось в наших словниках. Я сейчас приведу пример:
ТСД/Аневризм (по словнику 3-го изд.) и ТСД/Аневрисма (по словнику 2-го изд.) ведут к одной и той же статье.

Dmitrismirnov (обсуждение) 22:41, 4 октября 2015 (UTC)



Автоопределение тома в шаблонах[править]

Добавил в шаблоны автоопределение тома. Теперь в шапке ненужны параметры -ИЗД.ТОМ и -ИЗД.ЧАСТЬ ТОМА, и в {{tom}} надо указывать только номер издания (пример {{tom|2}}). Том высчитывается по первой букве названия статьи (тома разделены по буквам оглавления). А части 1-2 томов в ТСД-3 высчитывается по номерам страниц книги (их надо указывать). --Vladis13 (обсуждение) 07:39, 4 октября 2015 (UTC)

Спасибо, я проверил, вроде бы работает. Но исчезли внизу категории ТСД:Статьи из 1-го издания, ТСД:Статьи из 2-го издания‎, ТСД:Статьи из 3-го издания, а в шапке стали указываться все 3 издания, даже в тех случаях, когда статья в эти издания не входит. Например, ТСД/Банёва -- есть только в 3-м издании, а в шапке указаны все три. Dmitrismirnov (обсуждение) 08:46, 4 октября 2015 (UTC)
Проблема с буквами в ДО. Словарные статьи на Ѣ например теперь показыказываются в словнике на букву Е, и ТСД/Ежа 1 ТСД/Ежа 1/ДО [Ѣжа] ссылается в шапке на несуществующую страницу 1-го тома вместо 4-го. Dmitrismirnov (обсуждение) 10:51, 4 октября 2015 (UTC)
Это потому, что номер тома надо вычислять не по букве статьи, а из номера (или имени, если они как сейчас не по номерам) словника. Ведь слова на Е и на Ѣ будут в разных словниках, которые строятся не по лексикографическому порядку в СО, а по порядку в оригинальном издании... Vladis13 немного поторопился... Hinote (обсуждение) 17:37, 4 октября 2015 (UTC)
  1. Добавил в шапку опциональный параметр «ДОРЕФОРМЕННАЯ_ОРФОГРАФИЯ=» (он уже был но не активен), значение этого параметра выводится после названия статьи в «[ ]» (пример ТСД/Ежа 1). Его необходимо заполнять для слов начинающихся с букв-ДО (выше их упоминал), таких слов немного, затем перенесём их в новый словник. Если не указать, то сбивается автооопределение тома. Можно переименовать в «НАЗВАНИЕ В ДО» или иначе.
    В шаблоне {{tom}} первый параметр (издание) прежний, а дальше теперь 3 варианта заполнения. См. документацию к шаблону. --Vladis13 (обсуждение) 02:14, 5 октября 2015 (UTC)
  2. Возникла проблема с пространством «/ДО». Там названия страниц в СО, а в параметре «НАЗВАНИЕ» в ДО, причём зачастую после него в «[ ]» приведены названия в СО, поле «ДОРЕФОРМЕННАЯ_ОРФОГРАФИЯ» соответственно отсутствует (пример нажмите «предпросмотр»). Излишне сложная неопределённая логика для скрипта. Необходимо формализовать. Предлагаю ботом также перенести названия из поля «НАЗВАНИЕ» в «ДОРЕФОРМЕННАЯ ОРФОГРАФИЯ», а «НАЗВАНИЕ» заполнить из названия статьи в СО. Или как лучше?
  3. Категории сейчас поправлю. --Vladis13 (обсуждение) 21:08, 4 октября 2015 (UTC)
  • Вернул параметры -ИЗД.ТОМ и -ИЗД.ЧАСТЬ ТОМА в шапку. Причина: «в шапке стали указываться все 3 издания, даже в тех случаях, когда статья в эти издания не входит.» Скрипту надо как-то указать, что статьи нет в издании. Если, например, вместо номера тома писать любую букву, например «нет», может и работало бы, но возможно это лишней работы больше чем, писать сразу номер тома. --Vladis13 (обсуждение) 03:36, 5 октября 2015 (UTC)


Сканы[править]

@Vladis13, Dmitrismirnov: Тут я хотел бы со словниками сделать небольшую паузу и обсудить вот что: для 2-го издания тома разделены на части. Это сделано искуственно, совершенно в произвольных местах и потом создаст неудобства. Просто видимо Вадим, который заливал на коммонс части, не умел в то время заливать книги больше 100 МБ. Соответственно, вопрос: надо бы объединить все части одного тома в один djvu и перезалить. Есть возражения? (Естественно, все уже имеющиеся страницы из пространства Страница не будут при этом потеряны, а будут перемещены так, чтобы отвечать страницам уже нового djvu). Hinote (обсуждение) 23:24, 7 октября 2015 (UTC)

  • Упс, это же для третьего издания тома разделены на части. Ну, можно это оставить на потом, пока мы делаем словники для 2-го издания, а за это возьмемся уже позже... Hinote (обсуждение) 23:35, 7 октября 2015 (UTC)
    • Если надо, диапазоны всех изданий-томов-частей выложил в Модуль:Sandbox в строке 31 массив "local range_pages". А ниже "-- расчёт части тома ТСД-3 по странице function parttom(tom, pagebook)". Эти функции в Модуль:ТСД пока не перенёс, ибо если пагинация будет браться из словника, то вычисление страниц/томов по названию самой статьи наверно не нужно. --Vladis13 (обсуждение) 23:54, 7 октября 2015 (UTC)
      • Это хорошо, что есть эти функции. Смотрите, какие тут есть сложности и почему части лучше объединить (кратко: потому что они побиты в произвольных местах). Вот смотрите: мы словник будем делать не единым списком, а они будут разделены на части (примерно как сейчас существующие). И для того, чтобы работал модуль Header, крайне желательно, чтобы граница словника проходила 1) по границе книги, 2) по границе буквы или по "короткому префиксу" имен статей. Например, по двухбуквенным границам. Например, один словник А-Ам, а второй -- Ан-Ая, а третий -- Б-и т.д. Просто так будет гораздо проще. У нас тома начинаются с буквы -- очень хорошо. А вот книги побиты в произвольном порядке. И там такую границу между словниками придется провести не по короткому префиксу. Более того, есть еще одна сложность -- когда содержимое статей собирается тегами pages, в пограничной статье, которая "разъехалась" на две части одного тома, придется собирать ее двумя тегами pages. Некрасиво... А ссылка в шапке будет вести на первую часть, где только половина такой статьи, а на вторую, получается, оттуда не попасть... Hinote (обсуждение) 00:03, 8 октября 2015 (UTC)
        • Хорошая идея! Если исправится столько потенциальных ошибок, всё будет работать, и к тому же это было искусственное не соответствующие оригиналу решение. +От лишнего параметра в шапке можно избавиться. Уже сделанные страницы точно не пострадают? --Vladis13 (обсуждение) 00:23, 8 октября 2015 (UTC)
          • Страницы не пострадают, т.к. просто переместятся на свои места, соответствующие новому индексу, полному для тома. А какой параметр в шапке при этом уйдет? Hinote (обсуждение) 01:03, 8 октября 2015 (UTC)

Тэги pages и lst[править]

Скажите, а почему используете то один тэг, то другой? Например, тут lst. Как я понимаю, в lst нельзя указать диапозон страниц, и он не показывает пагинацию. Если так, он вроде похуже pages, или нет? --Vladis13 (обсуждение) 10:56, 9 октября 2015 (UTC)

Нет, я отказался, в принципе, от тэга lst (который я использовал раньше), но здесь я попробовал воспользоваться тэгом pages, и пагинация налезла на текст - некрасиво получилиось, и я переделал на lst. --Dmitrismirnov (обсуждение) 11:54, 9 октября 2015 (UTC)
Если хотите, могу ботом заменить везде lst на pages. --Vladis13 (обсуждение) 08:13, 10 октября 2015 (UTC)
Раз нет возражений, сегодня ботом заменю везде эти тэги. Кроме использующих упоминавшиеся нестандартные страницы индекса "Dal 3-I", с ними тэг pages не работает. --Vladis13 (обсуждение) 19:59, 20 октября 2015 (UTC)
Yes check.svg Сделано --Vladis13 (обсуждение) 00:59, 22 октября 2015 (UTC)


Задачи по изготовлению словников (для залитого корпуса 2-го издания)[править]

(Давайте оставим эту тему внизу, пока занимаемся словниками, чтобы не искать по всей станице среди прочих тем)

Перенесено на страницу Обсуждение участника:Vladis13 Про листинг категории и сравнение ботов.
  • Затем, давайте добавим туда названия в ДО и пагинацию (где она есть). Для начала названия в ДО -- автогенерируемые (вы выше написали, как вы собираетесь из названий страниц делать названия в ДО -- давайте например так), раз у нас нет других. Потом мы по ним пройдемся вручную и поправим по тексту издания. Пагинация -- из параметров шапок страниц или же из тегов -- неважно. Главное извлечь эти значения там, где они есть и поиспользовать в словнике... Поскольку это временная рабочая страница, формат не особо важен, главное, чтобы он был регулярным. Предлагаю следующий (потом будет понятно почему именно так, пояснять долго):

# Ссылка на статью || Название_в_ДО # диапазон_страниц

Дайте отмашку, когда сделаете... Hinote (обсуждение) 23:19, 3 октября 2015 (UTC)

Диапазон страниц книги или скана? Иногда бывает есть одно, но нет другого. Может тогда пагинацию в формате # диапазон скана|диапазон книги? И если чего-то из этого нет то там будет пусто. --Vladis13 (обсуждение) 00:21, 4 октября 2015 (UTC)
Да, давайте так (и то, и то), только в другом порядке: # диапазон книги|диапазон скана (или просто номер первой страницы скана). Hinote (обсуждение) 00:31, 4 октября 2015 (UTC)
  • TODO: Затем мы будем бить общий большой список на словники-части. Тут я опишу правила, как это нужно сделать, чтобы потом удобнее было использовать...

Конвертер в дореформенную орфографию[править]

Предложенный мной выше способ простой подстановки "ъ" в конце слов после согласной не подходит, ибо ять мог вставляться и внутри слов, а также сами слова писались иначе ("-аго" вместо "-ого" и др.).

http://slavenica.com - конвертит в "петровское написание", как там написано. Но вообще орфография введёная Петром изменилась к рубежу 19-20 века, например он заменил "з" на "s", "и" на "i", что не прижилось. Вроде этих букв в конвертере не наблюдается, выглядит похоже. Можно этот конвертер использовать для автоматизированного создания словника. @Dmitrismirnov: делать словник с автоконвертацией названий в ДО? --Vladis13 (обсуждение) 20:10, 7 октября 2015 (UTC)

  • Все равно его надо будет просматривать по изданию и корректировать названия. Это проще делать, когда уже как-то заполнены заготовки для названий в ДО. Мне кажется надо сделать как вы сейчас сделали, а все яти, фиты и ижицы вставим вручную. Hinote (обсуждение) 20:14, 7 октября 2015 (UTC)

Форматированный словник с пагинацией[править]

@Hinote: Сделал ТСД-2 словник с пагинацией на букву "Я". Давайте им займёмся. Остальные потом подключим по тому же алгоритму. --Vladis13 (обсуждение) 12:39, 7 октября 2015 (UTC)

  • Да, я видел -- посмотрите обсуждение той страницы. (На использование этого шаблона я этот словник переделаю сам. Да, можно делать по буквам, а не общим списком. У вас ъ в конце вставляется для всех символов, отличных от гласных, а надо только для согласных. Чтобы ъ не вставлялся после знаков препинания, например...) Hinote (обсуждение) 20:17, 7 октября 2015 (UTC)
  • Я переделал эту часть словника на использование шаблона. Собственно, я это сделал регэкспами, но если вы будете сразу генерировать в таком формате -- будет еще лучше. Относительно параметров 4 и 5 (пагинация). Вы можете заметить, что я заменил значения параметра 5 значениями параметра 4. На самом деле я его не просто так "выбросил". Я сначала проверил, что у всех тех строк, где есть хотя бы один параметр 4 или 5 -- есть другой. Т.е. если в какой-то строке был бы только параметр 5 -- я бы сделал параметр 4 (пагинация в книге) с соотв. сдвигом. Потом, я проверил, что сдвиг в пагинации между параметрами 4 и 5 везде одинаков -- т.е. что нет в сканах пропущенных или задвоенных страниц, или страниц-иллюстраций или вставок вне общей пагинации. Если бы сдвиг отличался -- это надо было бы где-нибудь записать, чтобы использовать потом при вычислении страницы в скане из страницы в книге. И уже после этих проверок -- все, нам страница в скане больше не нужна, можно оставить только значения пагинации в книге. Так что если вы остальные части словников будете сразу делать с такими проверками -- то можно сразу формировать это в таком же виде, как я сейчас там сделал, с одним значением пагинации (диапазон страниц в книге) значениями сразу двух параметров, чтобы не переделывать. Hinote (обсуждение) 21:10, 7 октября 2015 (UTC)
    С этим заковырка. Таки есть Категория:ТСД:3-е издание, не указана страница книги, со страницами где в шапке указана только страница скана (ТСД/Боа, ТСД/Блябла, ...). Безусловно она в дальнейшем будет пополняться просто ввиду "человеческого фактора" (не введённых в шапку номеров страниц). Чтобы расчитать страницу книги по стр.скана нужен скрипт, не на локальном компьютере запускаемый кем-то когда-то вручную на всём протяжении тех будущих лет-десятилетий пока будет писаться ТСД, с перезаливкой словника с пагинацией... :) Нет, он должен просто запускаться через шаблоны. Если есть только одна из пагинаций (скан или книга) по ней расчитывать другой (+смещение, или -смещение. Вобщем надо калькулятор смещения. --Vladis13 (обсуждение) 23:20, 7 октября 2015 (UTC)

Формат словника. Проект и обсуждение[править]

Давайте обсудим формат, который наиболее удобен и практичен. Dmitrismirnov (обсуждение) 07:05, 5 октября 2015 (UTC)

Вариант 1[править]

Предлагаю такой формат для словника:

Толковый словарь Даля (2-е издание)
Словник: A

в соврем. орфографии:


0001.

  1. А 1
  2. А 2
  3. Аба
  4. Абажур
  5. Абаз
  6. Абаим
  7. Абака
  8. Абанат
  9. Аббат
  10. Абдал
  11. Абдикация
  12. Абдраган
  13. Абевега
  14. Аберрация
  15. Аблава
  16. Абня
  17. Або

в оригинале:


0001.

  1. А
  2. А, co
  3. Аба
  4. Абажуръ
  5. Абазъ
  6. Абаимъ
  7. Абака
  8. Абанатъ
  9. Абатъ
  10. Абдалъ
  11. Абдикація
  12. Абдраганъ
  13. Абевега
  14. Аберація
  15. Аблава
  16. Абня
  17. Або

-- Dmitrismirnov (обсуждение) 00:42, 5 октября 2015 (UTC)

  • Таблицей? Тогда можно было бы делать связанные ячейки, и с сортировкой по колонкам. - Чтобы можно было сортировать по ДО, СО, или страницам. Но выше же обсуждали использование шаблона {{Статья в словнике}}, чтобы сделать как в других энциклопедиях, с пагинацией у каждого слова? --Vladis13 (обсуждение) 01:51, 5 октября 2015 (UTC)
Я же не знаю как это более удобно для Вашей работы. Вы предложите свой вариант и покажите на примере хотя бы этой первой страницы словника. Dmitrismirnov (обсуждение) 06:46, 5 октября 2015 (UTC)
Не годится... Громоздко, код излишне сложен и для скриптов и для ручной работы. Хотя таблицы можно было бы сортировать (по номерам таблиц, колонкам с СО или ДО).--Vladis13 (обсуждение) 23:02, 5 октября 2015 (UTC)--Vladis13 (обсуждение) 23:02, 5 октября 2015 (UTC)

Вариант 1.2 таблица[править]

Вариант с обычной таблицей. Работает сортировка по колонкам, понятные названия колонок, код удобней.

ДО СО Страницы
Аблаваѣѣ Аблава 343
Абняѣѣѣ Абня 345
Абоѣѣ Або 643

Но скрипт настроен брать данные из упомянутого шаблона. В этом варианте надо его будет переделать под таблицу. --Vladis13 (обсуждение) 23:02, 5 октября 2015 (UTC)

Вариант 2[править]

Вот вариант словника этой же страницы, сооветствующий тому, что я делаю для 3-го издания. Мне самому такой вариант больше нравится, чем первый. Стрелкой (после слов Абда́лъ и Абла́ва показано перенаправление, но это можно убрать (если мешает), чтобы не возникало дополнительных сложностей):


1. А
  1. А / А
  2. А, со / А, со[1]
  3. Аба́ / Аба́
  4. Абажу́ръ / Абажу́р
  5. Аба́зъ / Аба́з
  6. Аба́имъ / Аба́им
  7. Аба́ка / Аба́ка
  8. Абана́тъ / Абана́т
  9. Аба́тъ / Абба́т
  10. Абда́лъАбаимъ / Абда́лАбаим
  11. Абдика́ція / Абдика́ция
  12. Абдрага́нъ / Абдрага́н
  13. Абеве́га / Абеве́га
  14. Абера́ція / Аберра́ция
  15. Абла́ваОбла́ва / Абла́ваОбла́ва
  16. Абня?* / Абня?* [2] [3]
  17. Аˊбо* / Аˊбо*
  1. co = союз (сокр.) — Ред. викитеки.
  2.  ?, знак вопросительный, сам Даль ставил после слов, представлявшихся ему почему-либо неясными или сомнительными. — Ред. 3 издания словаря Даля.
  3. Звёздочкой после сло́ва здесь отмечены слова́ без указания ударения. — Ред. викитеки.

--Dmitrismirnov (обсуждение) 07:05, 5 октября 2015 (UTC)

  • Мне тоже нравится. Пагинация для каждой статьи если будет справа отображаться будет нормально? Hinote, как я понимаю, для шаблона упомянутого выше с пагинацией, можно сделать шаблон-обёртку для ТСД, чтобы словник отображался в выбранном нами формате? --Vladis13 (обсуждение) 22:45, 5 октября 2015 (UTC)
    • Да, можно. Тут единственный вопрос: а зачем тут ссылки на страницы? Они точно вам нужны? (По личному опыту могу сказать, что они сбивают с толку читателя. Я долго думал, что такое значат эти "1. А"...) Если они будут в списке, их надо будет завернуть в отдельный шаблон -- "лишних" ссылок вне порядка статей на странице словника быть не должно, т.к. все они попадут в порядок предыдущий/следующий. Hinote (обсуждение) 11:16, 6 октября 2015 (UTC)

Вариант 3[править]

  1. А / А    1—2
  2. [1]А, со / А, со    1—2
  3. Аба́ / Аба́    1—2
  4. Абажу́ръ / Абажу́р    1—2
  5. Аба́зъ / Аба́з    1—2
  6. Аба́имъ / Аба́им    1—2
  7. Аба́ка / Аба́ка    1—2
  8. Абана́тъ / Абана́т    1—2
  9. Аба́тъ / Абба́т    1—2
  10. Абда́лъ / Абда́л    1—2       →
  11. Абдика́ція / Абдика́ция    1—2
  12. Абдрага́нъ / Абдрага́н    1—2
  13. Абеве́га / Абеве́га    1—2
  14. Абера́ція / Аберра́ция    1—2
  15. Абла́ва / Абла́ва    1—2       →
  16. Абня?* / Абня?*    1—2 [2] [3]
  17. Аˊбо* / Аˊбо*    1—2
  1. co = союз (сокр.) — Ред. викитеки.
  2.  ?, знак вопросительный, сам Даль ставил после слов, представлявшихся ему почему-либо неясными или сомнительными. — Ред. 3 издания словаря Даля.
  3. Звёздочкой после сло́ва здесь отмечены слова́ без указания ударения. — Ред. викитеки.
  • Италиком выделяются не страницы, на которые ссылаются статьи-перенаправления, а сами статьи-перенаправления. Имхо так правильнее, т.к. выделяются именно статьи-перенаправления, а статьи, на которые они ссылаются -- они обычные, зачем их выделять?
  • Нет отдельных ссылок на страницы в тегах h5. Ссылки на страницы -- у каждой статьи, в пагинации (можно сделать и без ссылки, просто 1—2, как в словниках других проектах, но если вам важны ссылки -- я их и оставил в этом примере. Отдельные ссылки в тегах h5 ведь не нужны, если пагинация стоит у каждой статьи, не так ли? (И они в любом случае будут мешать навигации, если ее реализовывать через Модуль:Header, т.е. если предыдущий/следующий подбирать из словников, а также из словников подбирать пагинацию для отображения в шапке статьи)
    Мне кажется редактору удобней один раз указать пагинацию для всех статей страницы, чем указывать для каждой. Хотя, не надо будет вводить пагинацию в статьях... --Vladis13 (обсуждение) 12:59, 7 октября 2015 (UTC)
  • Знак перенаправления "→" пока установил в этом месте, можно его расположить как и звездочку после названия статьи. Если он после пагинации -- то после него можно добавить и ссылку на ссылаемую статью...
  • Т.е. общий формат такой: имена статей в СО и ДО (возможно выделение болдом или италиком каких-то страниц, например италиком перенаправлений, болдом еще каких-то страниц); после имен возможно добавление каких-то звездочек или решеток (единичных значков) у каких-то страниц; затем пагинация (как ссылка или как текст, как уговоримся); затем уже все что угодно (примечания, значки перенаправления с ссылкой на ссылаемую статью или без, авторы статей (чего, правда нет в ТСД)) -- но все эти произвольные добавления только после пагинации (или до названия статей, т.е. примечания можно перенести в самое начало -- я это сделал для первого примечания, чтобы можно было визуально сравнить, как примечание выглядит до названия статьи и после пагинации).
  • Знак перенаправления можно заменить на более заметный (напр. , или , )

Hinote (обсуждение) 11:25, 7 октября 2015 (UTC)

  • Пагинацию лучше так и сделать ссылкой на индекс, читателю удобно.
  • От знаков ударения в словнике в глазах мельтешит. Обычно в указателях/оглавлениях/названиях их не указывают, фонетический/морфологический разбор даётся всегда только в самих словарных статьях. --Vladis13 (обсуждение) 12:59, 7 октября 2015 (UTC)
  • Мне нравится этот вариант, но не понял, почему указаны страницы 1-2, (во 1-м и 2-м изданиях это страница 1, а 2 следующая. Только в 3-ем нумерация идёт не по-страницам, а по колонкам). Я думаю, что можно упростить формат: 1) сделать пагинацию один раз в начале страницы) 2) не указывать редиректы, приравняв их к рангу статей, 3) не указывать ударения в словнике. Думаю, что хорошо бы воспользоваться опытом редакторов других словарей, например ЭСБЕ, где применена несколько иная система. В этом смысле хорошо бы спросить у @Lozman: а.
Проблема ещё в том, что у каждой статьи есть как минимум три названия:
1) То, которое указано в издании в ДО Абажу́ръ,
2) то, которое мы переделали на современный лад: ТСД/Абажур/ДО
3) то, которое дано статье в СО: ТСД/Абажур
Это не отражено в словнике, то - есть 2 и 3 полные названия остаются скрытыми в виде; Абажу́ръ / Абажу́р --Dmitrismirnov (обсуждение) 14:23, 7 октября 2015 (UTC)
  • Про ударения и рябит в глазах: если названия будут записаны с ударениями, значит будет с ударениями. Если напишите без ударений -- будет без ударений. Что напишите, то и будет.
  • Про 3 разных названия: Дмитрий, вот, смотрите, сейчас в словниках используется спец. шаблон {{Статья в словнике}}, в котором указывается 2 варианта -- СО (который совпадает с названием страницы) и ДО. Надо будет просто сделать по аналогии спец. шаблон {{Статья в словнике ТСД}} и указывать названия так:
    • {{Статья в словнике ТСД|Бес 1|Бес|Бесъ|207—208}} -- это если все 3 названия (названия страницы, название СО и название ДО) разные;
    • или проще, без совпадающего с названием страницы названия статьи СО: {{Статья в словнике ТСД|Абажур||Абажуръ|1—2}} -- если название страницы и название статьи в СО совпадают.
  • Если нужно указывать (точнее отображать на странице словника) пагинацию только для одной (первой на странице) статьи, это тоже можно сделать еще одним параметром в этом шаблоне {{Статья в словнике ТСД}}, вот так:
    • {{Статья в словнике ТСД|Бес 1|Бес|Бесъ|207—208|207—208}} -- это если нужно для этой статьи в словнике отобразить пагинацию;
    • {{Статья в словнике ТСД|Бес 1|Бес|Бесъ|207—208|}} -- а это, если не нужно отображать (последний параметр не установлен)

Hinote (обсуждение) 15:55, 7 октября 2015 (UTC)

Вариант 3: пример[править]

Сделал, собственно, пример того, как может выглядеть словник (буква Ять). Посмотрите, насколько понятнее и проще для восприятия его содержимое. Если где еще нужны или, наоборот, не нужны ударения, оформления италиком, квадратные скобки, стрелки или ссылки для перенаправлений -- это все меняется/добавляется... Hinote (обсуждение) 17:30, 7 октября 2015 (UTC)

Очень хорошо. Мне нравится. Это наглядно и нет ничего лишнего. Статьи в скобках - дают понять, что они добавлены в 3-ем издании Бодуэном. Ударения тоже полезны. Спасибо! Dmitrismirnov (обсуждение) 20:42, 7 октября 2015 (UTC)
Ну, это для 3-го издания. Во втором издании такого безобразия в названиях статей нет ;-) (Посмотрите, как будет выглядеть словник для 2-го издания: Участник:Vladis13/ТСД-2 словник с пагинацией) Hinote (обсуждение) 20:54, 7 октября 2015 (UTC)
Да, тоже хорошо. Но у меня вопрос, можно ли вносить сюда изменения? Например, при слиянии статей-омонимов типа 1. Як и 2. Як на одну страницу, как мы это уже с Вами сделали с десятком статей... Dmitrismirnov (обсуждение) 21:03, 7 октября 2015 (UTC)
Там все тоже так же, как и в моем примере для словника 3-го издания, используется тот же шаблон. Можно добавлять и ударения, и квадратные скобки и все что угодно. Посмотрите на содержимое (кнопка править) этого словника и на содержимое этого словника. Внутри они одинаковы -- для каждой статьи используется один и тот же шаблон. Посмотрите на страницу документации этого шаблона, какие параметры у него есть и для чего... Просто сейчас мы наполняем словник для 2-го издания "автоматически", используя информацию о названиях статей его корпуса, который залит полностью. Естественно, все это надо просматривать вручную и сравнивать с изданием, корректировать -- здесь мы вас подключим активно... Hinote (обсуждение) 21:16, 7 октября 2015 (UTC)


Категория для списка всех словарных статей[править]

Вы удалили категорию ТСД из всех статей словаря, и для меня это уже создало ряд неудобств. Во-первых, теперь неясно какое общее количество страниц имеется в во всём этом проекте, а во-вторых, чтобы добраться до некоторых категорий, мне приходится это делать в 2-3 этапа. Таким образом, наличие этой категории здорово экономило время. Можно ли её вернуть? Dmitrismirnov (обсуждение) 20:38, 7 октября 2015 (UTC)

Категория:ТСД по алфавиту для этой цели представляется более подходящей, - соответствует названию и аналогично сделано в других энциклопедиях ВТ. Перенёс туда. Из Категория:ТСД видны все счётчики подкатегорий, нет свалки. Нормально?
И раз теперь свалки нет, надо бы "Категория:ТСД" объединить с Категория:Толковый словарь В. Даля. Я предлагал на форуме, возражений не было и вы одобрили переименования категорий. Делаем? --Vladis13 (обсуждение) 22:45, 7 октября 2015 (UTC)
Хорошо! Dmitrismirnov (обсуждение) 23:50, 7 октября 2015 (UTC)

Категория[править]

Категория:ТСД:Статьи сделанные вручную больше не нужна. Удалить, или она нужна вам? --Vladis13 (обсуждение) 12:46, 10 октября 2015 (UTC)

Можно удалить Dmitrismirnov (обсуждение) 12:50, 10 октября 2015 (UTC)
Убрал из неё страницы. Удалите, если не сложно. --Vladis13 (обсуждение) 16:01, 14 октября 2015 (UTC)

Задачи по изготовлению словников (для залитого корпуса 2-го издания)[править]

Залит словник с шаблоном[править]

  1. Викитека:Проект:ТСД/ТСД2 словник с пагинацией А-З
  2. Викитека:Проект:ТСД/ТСД2 словник с пагинацией И-Н
  3. Викитека:Проект:ТСД/ТСД2 словник с пагинацией О
  4. Викитека:Проект:ТСД/ТСД2 словник с пагинацией П-Пон
  5. Викитека:Проект:ТСД/ТСД2 словник с пагинацией Поо-Пя
  6. Викитека:Проект:ТСД/ТСД2 словник с пагинацией Р-Я

@Hinote: Также надо переименовать шаблон {{Статья в словнике ТСД}}. Ибо это слишком длинное название. Каждая страница списков выше — по мегабайту, но там нет почти ничего кроме повторов длинного названия шаблона. Поэтому, даже если страница создаётся проходя по вики-лимиту на длину страниц, шаблоны в конце списков могут не срабатывать (вставил укороченные списки, но при их заполнении наверняка опять такое случится). Кроме того, грузить в редактор мегабайтную страницу долго и глючно, браузер начинает тормозить, неработает даже подсветка синтаксиса из-за длинны. (И ни о какой «быстрой проверке списков вручную» речи быть не может.) +Название шаблона долго писать. Надо бы что-то короткое, желательно из нескольких букв. --Vladis13 (обсуждение) 18:46, 9 октября 2015 (UTC)

Например «тсд-словник» — уже укоротит размер раза в 2, не 1Мб, а 0.5Мб. Наверно «tsd-slovnik» будет ещё короче, — на русские буквы в кодировке utf-8 тратится 2-3 байта, сокращение ещё в 2 раза. Или «тсд-с»? Есть же {{свр}}, {{Отексте}} — все только «за» что они короткие. --Vladis13 (обсуждение) 18:59, 9 октября 2015 (UTC)
Посмотрите, как устроены словники в других словарях. Список не единый, отдельных страниц, обычно, десятки -- его надо побить. В свое время Lozman говорил, что он бил словники так, чтобы было ~350 элементов в одном. Для ТСД, я думаю, нужно побить так, чтобы в одной странице словника было 400--450--500--м. б. до 600 статей. Это следующее, что я собирался (собираюсь) сделать со сгенерированными вами словниками. Ничего не надо переименовывать, вы не теми средствами пытаетесь решить не те проблемы... При разбиении общего списка на несколько отпадает вообще необходимость в таком переименовании шаблонов и экономии на спичках... Hinote (обсуждение) 20:10, 11 октября 2015 (UTC) P.S. Посмотрите, я выше уже давно написал: "TODO: Затем мы будем бить общий большой список на словники-части. Тут я опишу правила, как это нужно сделать, чтобы потом удобнее было использовать...". Хотя, теперь я думаю, я просто возьму и побью... Хотел Дмитрия к этому привлечь, как главного инспиратора проекта, есть ведь тут творческая составляющая -- определить, где будет проходить граница между частями словника... И, именно поэтому (имея в виду разбиение большого списка словника на небольшие части) я и оставил решетку в первой позиции перед шаблоном статьи в словнике -- хотя в остальных словниках перечисление идет через звездочку. Просто, при разбиении на части будет удобно смотреть на номера строк в списке -- поэтому и решетка тут будет к месту. Видите, у меня на много шагов вперед все продумано, а вы говорите, что это невозможно и недостижимо... Hinote (обсуждение) 20:21, 11 октября 2015 (UTC)
Обратите пожалуйста внимание: в тех словниках, которые я уже сделал, на каждой странице ровно 500 граф или строк, то есть 500 слов в ДО + 500 слов а СО и того 1000 статей: посмотрите, например здесь: ТСД/Словник/А, ТСД/Словник/А1, ТСД/Словник/Б, ТСД/Словник/Б1... и т. д. В этом есть удобство для подсчёта... Можно было бы и в новых словниках делать то же самое. Dmitrismirnov (обсуждение) 21:51, 11 октября 2015 (UTC)
Дмитрий, не совсем так: для того, чтобы проще потом было внести нужные изменения в модуль Header нужно, чтобы граница между словниками проходила не точно по 500 или сколько-нибудь еще статей, а по короткому префиксу. Например, словник 01 -- это А--Ам, а словник 02 -- это Ан--Ая, ну а потом словник 03 -- это Б--... и так далее. Иначе будет сложно прописать границы между словниками в модуль Header. Hinote (обсуждение) 22:15, 11 октября 2015 (UTC)
Да, по названиям словников, тоже есть момент: если вы посмотрите на остальные словари и энциклопедии, то во всех них словники имеют названия в виде номеров: 01, 02 и и далее. Я не уверен пока, что в модуле Header можно указывать названия словников в вашем стиле: А 1, А 2 и далее. В любом случае, такие названия словников отличаются от принятой и реализованной конвенции по именованию словников в других проектах: там они имеют сквозную нумерацию. (Да, названия вида А 1 были удобнее, когда вы делали словники для 3-го издания спорадически побуквенно, но для 2-го издания у нас есть полный список статей, поэтому со сквозной нумерацией словников не должно быть проблем) Hinote (обсуждение) 22:20, 11 октября 2015 (UTC)
Конечно, лучше делать так как принято в других словарях. А я не знаю как делать сквозную нумерацию. Можно ли начинать список на какой-нибудь следующей странице не с единицы, а, скажем, с 501. Научите как это сделать. Dmitrismirnov (обсуждение) 22:54, 11 октября 2015 (UTC)
Вы пишете: "у нас есть полный список статей, поэтому со сквозной нумерацией словников не должно быть проблем"... У меня на этот счёт большие сомнения.
  1. Во-первых, список, который у Вас имеется, сделан по современному переизданию и он не сверен с оригиналом.
  2. Во-вторых, порядок статей в нём не соответствует порядку в печатном издании.
  3. В-третьих, полнота этого списка под вопросом. Dmitrismirnov (обсуждение) 22:59, 11 октября 2015 (UTC)
1 и 3) Это список статей из категорий на день его заливки, т. е. актуальный, что есть - не больше не меньше. Пока расхождений переиздания с оригиналом не обнаруживалось, если найдётся — легко поправить одну строку в словнике.
2) Порядок по современному алфавиту, так и надо для современного издания. Или нужен по старому? Как принято в других словарях где ДО и СО? Могу залить в порядке ДО, при котором ДО сделано конвертацией через упомянутый сайт. (На сайте написано, что его авторы занимаются конвертацией 20 лет, поэтому достаточно точно. Порой предлагается несколько вариантов написания, вроде "символъ" и "сѵмволъ", выбрал первые для скорости, когда словник будет утверждён можно будет пройтись точно, используя сайт и прежний фрагментарный проверенный словник.) Надо только поправить слова начинающиеся со старых букв, их не много. В словнике ДО также проще править пагинацию, ибо она там по порядку. --Vladis13 (обсуждение) 12:27, 12 октября 2015 (UTC)
Для меня это совершенно новая идея... Я всегда считал, что за оригинал следует признать текст бумажного издания в ДО. Порядок по современному алфавиту мы уже имеем без проблем в общих категориях словаря. Чтобы порядок соответствовал пагинации, он должен быть организован согласно оригинальному бумажному изданию, иначе получится путаница с навигацией, которую невозможно будет распутать. Dmitrismirnov (обсуждение) 12:37, 12 октября 2015 (UTC)
@Hinote: стоп машина. :) Вижу вы уже делите словник. Давайте согласуем, в каком порядке он должен быть? Залит в порядке СО, перезалить в порядке ДО? Как сделано в других словарях-энциклопедиях? --Vladis13 (обсуждение) 13:40, 12 октября 2015 (UTC)
Да, да, полностью согласен -- я как раз за то, чтобы договориться о порядке следования статей, см. ниже. Как раз хотел начать перемещать статьи на Бѣ и на Без в подходящее для них место, но, действительно, нужно все это порешать. Так что я во время сделал тут паузу ;-)) ... Hinote (обсуждение) 13:49, 12 октября 2015 (UTC)
Если договоримся делать в оригинальном порядке: можно будет и перезалить, чтобы хотя бы большие блоки (Бѣ, потом Без который Бес в СО) были ближе к своему финальному месту. Чтобы это руками не делать, да. Hinote (обсуждение) 13:58, 12 октября 2015 (UTC)
Посмотрите на словники ВЭ и РБС: там прямо вверху словника (СО) написано, что хотя это и словник СО, но порядок следования статей соответствует оригинальному изданию, т.е. ДО. Чтобы читатели не удивлялись и знали, где искать стать. Там же указывается, например, для словника со статьями на Ре, что статьи, которые в оригинальном написании начинаются на Рѣ, нужно искать в другом словнике (если список слов на Р настолько большой, что Ре и Рѣ "разъезжаются" в разные словники...) Hinote (обсуждение) 14:01, 12 октября 2015 (UTC)
Дмитрий, я тут собственно с вами полностью согласен: я тоже считаю, что порядок должен отвечать оригинальному изданию. То, что сейчас в автоматически сгенерированных списках он СО, это может быть временно -- для этого и есть "ручной" проход человеком, когда поправляются названия в ДО, если есть ошибки в распознавании или в конвертировании из СО в ДО, переставляются статьи местами так, чтобы отвечать оригинальному их порядку, в оригинальном издании. Так сделано в остальных словарях и энциклопедиях, кроме, пожалуй, ЭСБЕ -- просто в ЭСБЕ только начинали это все делать и там изначально решили, что порядок статей будет в СО. В принципе, и в ЭСБЕ нужно будет переделать со временем словники так, чтобы отражать оригинальный порядок следования словарных статей. И здесь еще есть следующее rationale: порядок следования статей в СО и так уже есть, в категориях, где статьи автоматически сортируются именно по названиям статей в СО. А в словниках, поэтому -- оригинальный порядок в ДО. Т.к. все-таки оригинальные издания в ДО, а тексты в СО -- уже произвольные. Мы же размещаем в ВТ оригинальные издания, а не современные переиздания, тексты статей в СО все-таки производны, в не зависимости от того, откуда они взяты: сгенерированы деятификацией из статей в ДО или же взяты готовыми из какого-то электронного переиздания. Посему, нам нужно просто договориться и решить, прежде чем двигаться дальше: в каком порядке мы составляем словники: в оригинальном порядке (даже если какие-то статьи где-то в издании идут с нарушением алфавитного порядка, все это тоже должно быть отражено в словниках) или же в СО. И то и то не трудоемко. Hinote (обсуждение) 13:49, 12 октября 2015 (UTC)
Еще вариант: теоретически, можно сделать 2 словника, ДО и СО, со своим порядком слов, так что в вариантах статей ДО и СО в шапках будут разные ссылки на предыдущий/следующий. Но а) нужно ли это? и б) это можно сделать и потом. Сначала сделать хотя бы один рабочий словник, например с оригинальным порядком следования статей в ДО, а потом, если кто-то захочет -- всегда может попробовать сделать и еще один словник для порядка в СО... Hinote (обсуждение) 13:53, 12 октября 2015 (UTC)
Ок. Раз в других словарях порядок ДО и консенсус за ДО, при этом есть категории где порядок СО, перезаливаю в порядке ДО. --Vladis13 (обсуждение) 14:06, 12 октября 2015 (UTC)
Супер. Спасибо. Hinote (обсуждение) 14:26, 12 октября 2015 (UTC)
Yes check.svg Сделано --Vladis13 (обсуждение) 14:31, 12 октября 2015 (UTC)
А проверьте еще раз порядок сортировки букв в ДО. А то мне резануло глаз Безлямочный, а потом уже Безлѣсье -- вроде бы ѣ идет после Ь, т.е. перед Э, т.е. перед Я... Hinote (обсуждение) 14:39, 12 октября 2015 (UTC)
Это проблема MS Excel, он так сортирует. Выложил таблицу в Гугл.таблицы с совместным доступом: https://docs.google.com/spreadsheets/d/1GQ5qpYSn3mMap_bibp7xyC9Bke5K0a4957VueX6Me9Y/edit#gid=519971422 Там вроде Ѣ и Я в правильном порядке. Перезалью оттуда. --Vladis13 (обсуждение) 14:56, 12 октября 2015 (UTC)
Yes check.svg Сделано --Vladis13 (обсуждение) 15:21, 12 октября 2015 (UTC)

Насчёт навигации я предлагаю вот что: поскольку навигация первых двух изданий приблизительно одинакова, поместить её всю в виде суб-навигации, а поскольку она сильно отличается от навигации в 3-м издании из-за того, что в нём статей в 3 раза больше и в него включены практически все статьи из первых двух изданий, оставить место обычной навигации для 3-го издания. Dmitrismirnov (обсуждение) 14:27, 12 октября 2015 (UTC)

Я тоже про такое думал и именно исходя из подобных соображений. Давайте получим "рабочий" словник для 2-го издания (может он же будет и для 2-го), а потом уже подумаем, что и как размещать в шапке, чтобы это не было перенасыщено для читателя... Hinote (обсуждение) 14:30, 12 октября 2015 (UTC)


Пагинация в словнике - отображение диапазона[править]

Что-то мне не очень нравится как выглядит пагинация в словнике (где-то сбоку, сливаясь с названиями статей). Указание на переход на другую страницу типа 1—2 мне кажется излишним и усложняющим работу со словником. Посмотрите, может быть так более практично и наглядно: Викитека:Песочница/ДС-2? Dmitrismirnov (обсуждение) 14:26, 13 октября 2015 (UTC)

  • Дмитрий, мне это тоже не нравится, но, как мне кажется, это из-за того, что пагинация не показывается для каждой из статей, а только для первых на каждой странице (так реализовано сейчас, т.к. вы вроде так и хотели, если посмотреть предыдущие обсуждения). Посмотрите, как это может выглядеть иначе: напр. здесь. Когда пагинация отображается у каждой статьи, она не выглядит так оторванно, где-то сбоку. И это -- стандартный для словников других проектов, именно такой способ реализован в словниках других проектов. И это будет проще: для того, чтобы отображать вот так "по особому" в готовящихся словниках ТСД пагинацию только для каких-то (напр., первых на странице) статей, я добавил дополнительный параметр в шаблон "Статья в словнике ТСД". И его для этих статей (напр., первых на странице) нужно указывать руками. (Что я и сделал для первых нескольких страниц, чтобы как раз посмотреть, как это будет выглядеть) Если же сделаем как в остальных словниках, то все упростится: 1) не нужен будет этот параметр 2) не нужно прописывать "руками" это значение для тех статей, где нужно отображать пагинацию, т.к. пагинация будет отображаться для всех статей. Так что давайте рассмотрим и, возможно, вернемся к стандартному способу отображения пагинации для статей в словнике: как и в других, справа от каждой статьи. Второе, ваше предложение о дополнительных ссылках на странице как отдельных ссылках (пример в песочнице): во-первых, это тоже придется добавлять руками, во-вторых, для этого надо будет реализовать еще один отдельный шаблон, т.к. иначе (как я уже говорил) эти ссылки попадут в общий порядок предыдущий/следующий, что вообще не правильно (модуль Header берет все ссылки на странице словника и из них формирует ссылки на предыдущий/следующий, чем бы эти ссылки не являлись, ссылками на статьи или же чем то иным, напр. как у вас, ссылками на страницы). Т.е. это реализуемо, но проблематично. Третье, это указание диапазона страниц для статей, которые захватывают две страницы (или больше, но наверное в ТСД таких длинных статей нет) -- это же будет (есть) то значение, которое отображается в шапке как ссылка на том и страницы. Все же принято и в научных изданиях и вообще везде, если какая-то статья располагается на нескольких страницах, отображать диапазон (1-2, а не 1). Это то значение, которое читатель может просто скопировать, чтобы указать ссылку на том и на соотв. статье страницы. Так что я здесь все-таки за указание именно диапазона для таких статей, захватывающих несколько страниц, а не одной только одной страницы, где статья начинается. Если вам при просмотре списка статей по скану это проблематично -- не трогайте эти значения, я потом сам просмотрю страницы скана и добавлю для таких статей, захватывающих 2 страницы, диапазон вместо одной первой страницы. Итого, я предлагаю пока: вернуться к отображению пагинации как в остальных словниках, т.е. справа от каждой статьи. (Потом это можно будет переделать, когда будет проставлена пагинация в словниках для всех статей) Если нужна ссылка на страницы (да, это наверное удобно для работы над статьями, чтобы можно было сразу перейти на соотв. страницу скана), то вместо отображения просто текста справа от названия статьи можно это сделать ссылкой на страницу. Hinote (обсуждение) 04:44, 14 октября 2015 (UTC)
Я не возражаю. Делайте так, как считаете нужным, но чтобы было наглядно и удобно пользоваться. Dmitrismirnov (обсуждение) 06:17, 14 октября 2015 (UTC)

@Vladis13:: А вы в сгенерированных словниках в параметре 4 (пагинация в книге) все диапазоны, которые указаны в параметрах шапки преобразовали просто в номер первой страницы? А могли бы вытащить именно диапазоны (и перезалить словники начиная с буквы В, которую пока не трогали руками)? Просто, эти диапазоны придется добавлять вручную, а если уже есть эта информация в статьях, где это указано -- странно было бы это не использовать... Hinote (обсуждение) 04:50, 14 октября 2015 (UTC)

  • Параметр шапки "СТРАНИЦЫ КНИГИ" парсился как есть, он является просто текстом, что было в шапке - то есть в словнике.
Первое число диапазона только в параметре "СТРАНИЦА СКАНА", который вытаскивался из тэга pages из текста страницы. Тэг этот писался вручную, сделанных вручную статей ТСД2 всего шт. 500, от этого числа страниц с диапазоном скана буквально единицы. (Можете посмотреть на количество всего созданных в индексе страниц скана ТСД2 - их очень мало.) Поэтому вытаскивать диапазон скана нерентабельно по времени. (Я сейчас попробовал создать списки... сомнительный результат, категорию "страницы сделанные вручную" уже удалили, +надо придумывать регулярку, которая проверяла бы на идентичность два числа в строке pages, например "from=148 to=148".)... это всё слишком сложно и долго. --Vladis13 (обсуждение) 10:51, 14 октября 2015 (UTC)
    • Из тегов, да, сложно, не надо... Я про параметр из шапки -- вроде видел статьи, где в шапке статьи на странице статьи -- диапазон, а в словнике в соотв. параметре (4-м) -- только один номер страницы... (Посмотрю на словник еще раз, попробую конкретно найти пример такой статьи) Hinote (обсуждение) 11:23, 14 октября 2015 (UTC)
      • А, ну вот: Авангардъ. В шапке -- диапазон, а в словнике, вами сгенерированном -- один номер. Но в Авангард -- тоже только один номер. Вы парсили варианты СО? Тогда ок, тогда все понятно. Я просто подумал, что вы взяли только первую часть из диапазонов (где они проставлены в статьях) по каким-то соображениям. Hinote (обсуждение) 11:39, 14 октября 2015 (UTC)
        Проверил по дампу (последний от 2 окт). Кроме "Авангард/ДО" диапазонов страниц книги больше не найдено. Искался не только "-", а также тире: 2-ИЗД.СТРАНИЦЫ КНИГИ *= *\d+ *[-—−]. --Vladis13 (обсуждение) 12:46, 14 октября 2015 (UTC)


Планы по обработке словника[править]

Каковы планы по разработке словника? Он будет делится на отдельные страницы? Давайте тогда подключим скрипты. И тогда посмотрю на оптимизацию имеющихся шаблонов, - вероятно часть параметров надо будет убрать, раз они из словника будут подставляться. А то "полировать" залитый словник можно бесконечно, слов там много... а разделение на страницы и подключение это лишь разовая операция, - сделать, и можно продолжить его выверку. --Vladis13 (обсуждение) 13:37, 14 октября 2015 (UTC)

Закономерный вопрос. Я уже пробовал сделать список шагов в одной из тем здесь, чтобы эта тема была где-то всегда снизу или сверху (чтобы была видна), но она уже погрузилась в глубину других тем, так что давайте здесь. @Vladis13, Dmitrismirnov: Итого, я думаю двигаться дальше так:
  • Надо доразбить сгенерированные словники на части (для начала заголовками, прямо в них). Я разбил словник А-З, посмотрите как. Ниже я отдельно напишу, из каких соображений я исходил, когда это делал, так что например Дмитрий сможет доразбить остальное. Хотя, может и я продолжу, не вопрос -- как договоримся. (Что-то мне не понравилось, как я разбил. М.б. надо делать части побольше, ближе к 500 -- а то частей получилось что-то много, в словнике А-З 31 часть, а у нас их всего 6. Хотелось бы, чтобы всего частей было бы меньше 100...) Может попробуйте и переразобьете?
  • Каждую из этих небольших частей словника нужно поместить на отдельную страницу (вида "страница-корень/номер_словника"). Vladis, предложите, откуда будут "расти" словники.
  • Далее в этом месте можно как раз делать то, что вы, Vladis, назвали "скрипты" -- т.е. необходимые дополнения в модуль и подбор значений в шапке из словника. Раньше это делать нельзя, т.к. будут ошибки на страницах статей в шапках при работе модуля Header из-за отсутствия в нужном месте этих частей словника.
  • Тут я позанимаюсь оформлением словника -- как он выглядит, как отображается пагинация, ссылки на страницы и проч.
  • Проходим вручную словники по сканам, корректируем названия, взаиморасположение статей, пагинацию.
Hinote (обсуждение) 21:23, 14 октября 2015 (UTC)
  • 44362 строки, чтобы было <100 частей как раз надо по 500 строк. Фактически будет где-то больше или меньше, - из-за выравнивания по ближайшим буквам.
    Корень для словников - это вопрос лучше к Дмитрию, мне кажется разместить там же где текущие, например в "ТСД/Словник/номер_словника". Хотя для разных изданий надо разные корни, "ТСД/Словник ТСД-2/номер" выглядит громоздко.
    Если ручной разбивки делать не будете, тогда завтра сделаю скриптом, просто на каждые 500 строк вставлю подраздел с номером. Потом надо будет вручную передвинуть их к ближайшей буквенной границе и внести её в заголовок. Потом могу нарезать на страницы и залить ботом. --Vladis13 (обсуждение) 22:39, 14 октября 2015 (UTC)
  • Надо бы по буквам все-таки границу провести. Удобнее будет. Может, сделать похоже на то, как Дмитрий словники разбивал -- с границы буквы каждые 500 статей и плюс остаток этой буквы. А потом -- опять 500 с новой буквы... По-крайней мере не надо будет голову ломать, где границу проводить... Это можно и вручную сделать -- есть же номера статей в списке, ведь там решетка в начале... Правда, в результате удаления статей или их разделения эти границы по 500 статей несколько "поплывут", но это не особо страшно -- потом можно будет скорректировать, перенести туда-сюда, чтобы финально сделать опять по 500... Hinote (обсуждение) 23:15, 14 октября 2015 (UTC)
  • В названии страницы-корня для словников нужно издание, да. Hinote (обсуждение) 23:15, 14 октября 2015 (UTC)
  • «ТСД/2-е изд./Словник/номер» — Может такой корень? По ГОСТу в библеографических данных номер издания пишется в таком формате. Также можно «ТСД» расшифровать в полное название, по аналогии как у всех др. словарей-энциклопедий, см. Модуль:Header. "Толковый словарь В. Даля/2-е изд./Словник"? --Vladis13 (обсуждение) 15:08, 15 октября 2015 (UTC)
  • Лучше полное название. Вот что мы с Lozman'ом в свое время обсуждали. У нас в ТСД, как и в других проектах словарей и энциклопедий, есть 3 "точки входа", т.е. корневых страниц (если не считать категории и шаблоны): Викитека:Проект:ТСД, Толковый словарь В. Даля, ТСД. Первая в качестве подстраниц по идее должна содержать только временные вещи, обсуждения участников проекта, какие-то временные списки, используемые в работе. Эта страница проекта и ее подстраницы вообще могут быть удалены или куда-то заархивированы после окончания активных работ надо проектом. Поэтому в ней не должно быть никаких страниц, нужных для функционирования сделанного в проекте. Страница с коротким названием: это "дом" для страниц статей. И чтобы проще было энумерировать статьи (напр., просто по этому короткому префиксу), проходиться по ним с какими то правками или для нахождения вхождений чего-то, то гораздо удобнее, чтобы из этого корня росли бы только страницы статей. Поэтому, страница Толковый словарь В. Даля -- наиболее правильный корень для таких вещей, как словники, и прочие сопутствующие материалы, которые не есть статьи из корпуса (или корпусов) статей. По идее, из ТСД сюда надо бы перенести все лишнее, оставив там только статьи... Hinote (обсуждение) 17:24, 15 октября 2015 (UTC)
        • А нельзя ли просто разделить по буквам? Хотя бы на этом этапе... В словнике 36 букв. Причём три буквы Ъ, Ы, Ь, имеющие по одной статье, можно объединить вместе. Итого 34 словника. (Конечно, буква П это особая статья - она разделена изначально - слишком длинная). А после того как они проверены хоть как-то, решать делить их или можно оставить так как есть... А если если всё-таки делить то как. Чем меньше таких делений, тем удобней для пользователя. Наверное так? Dmitrismirnov (обсуждение) 06:11, 15 октября 2015 (UTC)
          • Можно и просто по буквам, да. Вполне. Это будет еще проще. И букву П надо будет также из двух частей соединить в один список, для простоты. Единственный момент тут -- а будет ли удобно нам и читателям обращаться с такими, достаточно уже большими списками. Кстати, я попробовал и побил словник А-З на части по 500 плюс граница от буквы (предыдущее разбиение осталось в истории правок) -- посмотрите, можно и так сделать, это тоже не так уж и сложно. Но по буквам еще проще, если это само по себе не будет создавать неудобств из-за длинных, в несколько тысяч, списков для некоторых "больших" букв с большим кол-вом статей... Может, действительно, пока остановиться на разбиении просто по буквам, а потом видно будет... Hinote (обсуждение) 07:47, 15 октября 2015 (UTC)
            • Число строк в словниках сейчас: "О" - 3860, И-Н - 9365 (из них "Н" - 4022, остальных поровну по ≈1600), "Поо-Пя" - 5208, "П-Пон" - 5861, "Р-Я" - 9208 (из них "Р" - 1792, "С" - 2897, "Т" и "У" по 1000). Если словник А-З сейчас поделён по 500 строк, то там крупные буквы по 2000-3000 строк.
            "П" в один список объединить никак не получится. Я писал ранее - перестают работать шаблоны в нижней части страницы (из-за её длинны, из-за длины названия шаблона, или из-за количества этих шаблонов на страницу). Визульно - сбой начинается с 10287 строки, хотя если он зависит от длины страницы, может быть и раньше если заполнять шаблоны данными, т.е. к длине в 10тыс. строк лучше не приближаться, а то скрипт перестанет работать и не узнаешь об этом. Кроме того она начинает тормозить и глючит браузер. Можно было бы поделить по буквам, при этом самая длинная "Н" будет в 4000 строк, а "П" поделить на 3 части по 4тыс. строк, или больше частей.
            Не будет ли это вызывать тормозов, особенно если страницы смотрят одновременно большое число читателей, и для каждого скрипт лазит за инфой в длинный словник? Хотя словарь Даля малопопулярный, как и вообще словари, нагрузка мизерная. Но если всякие сайты берущие инфу с википедии своих ботов перенастроят, их десяток-другой постоянно лазить будет, а тыщи страниц все ссылаются на одну страницу словника. Вроде нагрузка мизерная, и текст физически в базе данных сервера, - всё мгновенно. Но всё же 11 тыс. строк "П" - это почти мегабайт. "Н" в 4000 строк - это 310Кб, приемлемей. (В вебмастеринге, при создании сайтов считается, что если страница сайта открывается дольше 2-3 секунд - это очень плохо, сайт может выпасть из поисковика в безвестность, из-за конкуренции. Таким гигантам как вики это может не грозит, но пользователи с узкими интернет-каналами - Wifi на смартфонах и т.п. я думаю проблему почувствуют.) Оставить "Н" так, и делить "П" на 3 части по 4000 или 4 части по 3000? Или делить "Н" на 2 части, и тогда "П" на 4-6 частей?
              • Да, можно попробовать сделать по буквам, а Н и П разделить на 2 и 3-4 части и посмотреть, как это будет летать. Hinote (обсуждение) 12:24, 15 октября 2015 (UTC)
            • Я правильно понимаю, что по буквам надо словник делить в любом случае? Но всеровно для каждой буквы надо вначале писать порядковый номер. Т.е. если будет, например, потом поделена "А" на 01 и 02, то и все последующие страницы с буквами, например "Н", надо будет переименовывать? Или для каждой буквы нумерация независимая? --Vladis13 (обсуждение) 11:24, 15 октября 2015 (UTC)
              • Я вас понял. Чтобы не переделывать, не переименовывать все словники, нам удобнее использовать не сквозную нумерацию, да. Смотрите. На практике, в других проектах используется только сквозное нумерованное именование (словники от 01, 02 и т.д.) Теоретически же, если посмотреть на то, как это реализовано в ф-ции word_list в модуле Header (посмотрите) -- для каждого проекта делается длинный список названий (номеров, но необязательно) словников и префиксов имен статей-границ между ними. Именно поэтому я говорил сначала про короткие префиксы имен-границы между словниками -- чтобы было проще записать. Поэтому и граница по букве удобна, есть еще соображения в пользу границе по букве, но не буду здесь усложнять. Но использование номеров для словников других проектов: это просто так повелось по историческим причинам. Теоретически же, записать там можно все. Из ограничений на имена словников, если посмотреть по коду: в них не должно быть пробелов, двоеточий, других знаков пунктуации. Поэтому нам, действительно, можно сделать сейчас словники просто по буквам (и назвать их не номерами, а соотв. буквами), а потом, при желании, если достаточно большие списки целиком по буквам будут неудобны, как-то доразбить -- и назвать словники, например, А01, А02, Б01 и т.д. (или же А_01, А_02 и т.д., или же в именах можно будет оставить пробел, а в коде модуля записать названия с подчерком, ведь вики-движок считает такие названия эквивалентными; не уверен пока как это будет работать в модуле). Можно так поступить и я склоняюсь сейчас к такой последовательности действий... Hinote (обсуждение) 12:20, 15 октября 2015 (UTC)
                • В Модуль:Header могут быть записаны страницы словника без номеров, но номера всеровно подставляются, см. там ниже (v[2] = номер): if not v[2] then v[2] = string.format ("%0" .. digits .. "d", i). Проверка: там без номеров 2 словаря - ЭСБЕ и МЭСБЕ, - но фактически, словник ЭСБЕ тоже с номерами: Викитека:Проект:ЭСБЕ/003. --Vladis13 (обсуждение) 13:57, 15 октября 2015 (UTC)
                  • Посмотрите, номера, формируемые этой строкой, подставляются, если они не указаны после двоеточия. Т.е. если просто указаны границы разбиения словников. После двоеточия же можно указать любое название словника (буквенное, буквенное с цифрами) с этим ограничениями, которые я упомянул (чтобы парсилось там все правильно). Если после двоеточия указано названия словника, то эта строка, формирующая номер словника, отрабатывать не будет (if not v[2] then). Hinote (обсуждение) 14:08, 15 октября 2015 (UTC)
  • Тогда делим по буквам и переносим в "Толковый словарь В. Даля/2-е изд./Словник/" или "Толковый словарь В. Даля/Словник 2-го изд./"? При этом буквы "О" и "Н" (по 4 тыс.) делим по 2 части по 2тыс строк, а "П" (12тыс.) на 4 по 3тыс. или 6 частей по 2 тыс. строк? (Хотя можно до 2 тыс. ограничить → тогда "П" на 6 частей, и "С" на 2 части.) Части называть по 3 первым буквам границ слов? В названии указывать диапазон, например не два листа "П" и "Поо", а "П-Пон‎" и "Поо-Пя‎"? --Vladis13 (обсуждение) 21:16, 15 октября 2015 (UTC)
  • Да, давайте так ("Толковый словарь В. Даля/2-е изд./Словник/"). "П", как мне кажется, достаточно разделить на 4 части. Назвать можно и "П1", "П2", ... или как то похоже, а можно и диапазоном -- "П-Пон‎" и "Поо-Пя‎", тоже хорошая идея. Букву А можно (лучше) создать не копированием из словника А-З соотв. части, а переименованием этой страницы с удалением лишнего -- чтобы история правок сохранилась (Дмитрий там активно правил)... Hinote (обсуждение) 21:44, 15 октября 2015 (UTC)
  • Yes check.svg Сделано первую половину по букву "Н", подшито в Категория:ТСД:Словники временно в конце категории. Теперь вопрос: объединять ли малые буквы на одном листе? Тогда нужны подзаголовки, например "И" и "I", не будут мешать скрипту? Что считать малыми списками, например в Ъ-Ы-Ь по одной статье, Ѣ вместе с ними в один список? "Ѳ" и "Ѵ" тоже короткие, но по звучанию от "Я" и друг друга далеки, не стоит? "К" - 2200 строк грузится заметно медленно, "Н" - 4000 ещё заметней. --Vladis13 (обсуждение) 22:29, 15 октября 2015 (UTC)
  • Мешать не будут. Наоборот, т.к. в СО слова на И и на І попадают в один диапазон -- будет только лучше, если они будут объединены в одном словнике. Еще я бы объединил Ъ-Ы-Ь. Остальное на отдельных. Hinote (обсуждение) 08:37, 16 октября 2015 (UTC)
  • Доделал шапки для остальных частей. Теперь удобно листать словники... (надо сделать страницу уровнем выше со списком всех этих словников, чтоли...) Не мелковато ли покрошили букву П? Hinote (обсуждение) 23:25, 16 октября 2015 (UTC)


(Архивация)[править]

Давайте, что ли, заархивируем почти все темы, кроме, пожалуй, тех, где вы, Дмитрий и Vladis, обсуждаете разные омонимы и объединение/разъединение страниц и ведете списки... А то что-то распухло, ничего найти нельзя. Лучше новые темы создавать... Hinote (обсуждение) 15:17, 17 октября 2015 (UTC)

Да, можно заархивировать. Dmitrismirnov (обсуждение) 15:27, 17 октября 2015 (UTC)


Страница:Dal-3 I 1743-1744.jpg/1[править]

Существует такая страница в 3 части 1 тома 3-го изд. Я не знаю что нужно сделать, чтобы информация об этой странице правильно отражалась в шапке на страницах типа ТСД/Зябра 2/ДО в графе ИСТОЧНИК= Dmitrismirnov (обсуждение) 08:05, 14 октября 2015 (UTC)

Некоторые другие страницы с подобными проблемами:

Золоѣ́дъ — Зоогра́фія. — 1727-1728
Зорени́ца — зрѣть. — 1729-1730
Зрѣть — зубръ. — 1731-1732
. . .
Зѣла́сто — зя́бнуть 1741-1742
Зя́борный — зя́ть. — 1743-1744

Причём шаблон page на подобных страницах не работает, но только шаблон #lst Dmitrismirnov (обсуждение) 10:09, 14 октября 2015 (UTC)

  • Долго думал, что там не так, потом понял, что дело в отдельных сканах страниц в jpg. Исправление лучше объединить с соединением всех djvu частей томов этого издания в один -- тогда и эти отдельно отсканированные страницы туда перейдут и будет один обычный djvu без этих специальных извращений. Я себе записал в TODO, сделаю. Hinote (обсуждение) 10:27, 14 октября 2015 (UTC)

Названия статей для букв ѢѴІѲ[править]

Сейчас статьи по таким буквам называются ТСД/Е 3, ТСД/И 3 ТСД/И 4, ТСД/Ф 1. Мне кажется правильней переименовать в названия-ДО, раз порядок статей по ДО. Как думаете? --Vladis13 (обсуждение) 17:38, 16 октября 2015 (UTC)

Нет, я не думаю. У нас все названия статей по современному написанию. Пусть остаются в СО и тогда в категориях они появятся в правильных местах по современной орфографии. Dmitrismirnov (обсуждение) 18:54, 16 октября 2015 (UTC)
Теоретически можно было бы. Но, в таком случае (и это было бы логично), и названия страниц всех вообще статей для издания в ДО нужно было бы записывать в ДО. Я в свое время тоже к этому склонялся, у меня была такая идея: страницы статей РБС или ВЭ назвать по их названию в ДО. Обсуждали это с Lozman'ом: 1) Это разрушит автосортировку статей в категориях по СО (хотя можно указать параметр -- название в СО -- как ключ для сортировки), б) все-таки для читателей основной "язык" -- это вариант СО. Кроме того, у читателей могут быть проблемы с поиском. Вместе с тем, если внимательно посмотреть, мы частично уже и применили ДО в названиях страниц: это словники. И там без ДО никак, т.к. иначе не понятно, как назвать часть "Со-Сѵ"... (а все потому, что от сквозной нумерации словников отказались ;-) Hinote (обсуждение) 23:22, 16 октября 2015 (UTC)

ГОСТ на составление словников ;-)[править]

FYI, ГОСТ на (указатели) словники ;-) : [2], [3]. (Вроде, в разделе ГОСТов 7.* есть еще ГОСТ именно для указателей энциклопедий/словарей, не помню сейчас какой именно...) Hinote (обсуждение) 00:40, 17 октября 2015 (UTC)

  • В википедии пару месяцев назад было обсуждение правила по оформлению библиографии. Вики — не подчиняются рос.законодательству, хотя рувики предназначено исключительно для русскоговорящих, которые привычны к ГОСТам. Поэтому было решено брать из них многое, но некоторые спорные и непрактичные моменты отвергать. (Например, ГОСТы ориентированы на бумажные издания, и напрочь не учитывают гипертекстовое устройство интернета — возможность скрыть ссылку (url) под текст (анкор)).
«Указатели» описанные в ГОСТе приводят перечень всех номеров страниц издания со всеми упоминанием слова. А в наших словниках указывается только страница где слово — первый термин статьи. Вроде такие словники — разновидность указателей, но это скорее ближе к «содержанию», не уверен. --Vladis13 (обсуждение) 01:19, 17 октября 2015 (UTC)


Вычитка словника ТСД-2[править]

Вычитал с "Щ" до конца. --Vladis13 (обсуждение) 17:16, 17 октября 2015 (UTC)
Страницу скана вписывать не обязательно. Выше обсуждалось что её будет высчитывать сам шаблон по стр.книги. Также, я когда правил последние буквы словника решил убирать последние "|", после номера страницы, где не используются. Например, есть начало страницы и оно помечено дублированием номера страницы в 4-м и 5-м параметре, но ниже 5-й параметр уже не нужен до конца страницы, поэтому все "|" до "}}" можно удалить, чтобы не отвлекали и место не занимали. Пример. --Vladis13 (обсуждение) 12:09, 17 октября 2015 (UTC)
Спасибо, за всем не уследишь. Правила очень быстро меняюься. --Dmitrismirnov (обсуждение) 14:19, 17 октября 2015 (UTC)

Названия словников[править]

А нельзя сделать покороче названия словников?
...вместо Толковый словарь В. Даля/2-е изд./Словник/А что-нибудь вроде: ТСД-2/Словник/А??? --Dmitrismirnov (обсуждение) 14:19, 17 октября 2015 (UTC)
Посмотрите тему выше. Вот комментарий, — Андрей сослался на прежнее обсуждение с Лоцманом, что корень словников надо называть полным названием. --Vladis13 (обсуждение) 15:16, 17 октября 2015 (UTC)
Vladis, спасибо за ссылку на мои слова. Ну, можно еще одну "точку входа" создать, т.е. корневую страницу. Т.е. от ТСД "растут" страницы статей (и там контент и из 1-го, и из 2-го, и из 3-го изданий), а всякие дополнительные страницы для 2-го издания -- из корневой страницы "ТСД-2". Главное не запутаться и главное, чтобы статьи "росли" из отдельного корня со страницами других типов (словниками, вступительными статьями, списками авторов и проч.) По-умолчанию это другое место -- это вот это длинное название издания. Т.к. у нас несколько изданий -- то пришлось еще удлинить. Но в принципе можно и под еще одну корневую короткую страницу все это переместить... Hinote (обсуждение) 15:38, 17 октября 2015 (UTC)

«Ять» и «Фита»[править]

«Ять». Тем временем, я разобрался в букве "Ять" и убедился в наличии огромной путаницы в навигации, где Е и ѣ все смешались друг с другом, а также в полном отсутствии в ботозаливке (а также в переиздании98 нескольких статей), которые восстановил по оригиналу. Теперь все статьи 2-го и 3-го издания на "Ять" (их немного, но многие из них большие) имеются в словаре, расположены по порядку и снабжены правильной навигацией. Было бы удобно объединить словники разных изданий на одной странице, но пока я не нашёл лучше способа, чем такой: ТСД/Словник/Ѣ. Dmitrismirnov (обсуждение) 07:49, 19 октября 2015 (UTC)

Если у Вас есть идеи как лучше объединить все три издания в одном списке, дайте знать. Dmitrismirnov (обсуждение) 10:25, 19 октября 2015 (UTC)
Дмитрий, вы пока делайте эти "общие" словники для всех трех изданий (для небольших по объему букв, например), но только если это вы сами хотите. Выверенные списки в любом случае не пропадут... Я пока сознательно здесь ничего по этому поводу не отвечаю -- т.к. хочу до конца доделать словники именно для 2-го издания, а потом уже будет видно, что делать со всем этим... Hinote (обсуждение) 12:52, 20 октября 2015 (UTC)

«Фита». Проверил тексты на "Фиту" во всех трёх изданиях. Добавил недостающие тексты. Поправил навигацию. Все три словника на эту букву поместил здесь: ТСД/Словник/Ѳ. Dmitrismirnov (обсуждение) 12:45, 20 октября 2015 (UTC)

  • В заливке (и переиздании98) отсутствовали статьи для последних букв (Фита, Ижица, пси и т.д.), вчера сделал. Видел вы сегодня и для других изданий доделали. Новые словники выверил от "Ш" до конца. --Vladis13 (обсуждение) 17:42, 20 октября 2015 (UTC)


Пагинация[править]

Отображение пагинации для каждой статьи[править]

  • Гораздо удобнее будет, если отображать пагинацию вообще для всех статей, как в словниках остальных проектов, напр. как в ЭСБЕ. (В отличие от ЭСБЕ, можно (нужно) оставить пагинацию текстом, а не как ссылка, как в ЭСБЕ, а ссылка на страницу -- на значке страницы, как я уже сделал; т.е. будет еще красивее, чем в ЭСБЕ). Это будет гораздо проще и для внутреннего вида текста статьи словника: не нужен будет не только 6-ой параметр с пагинацией, но и 5-ый. Т.е. у каждой статьи в словнике таким образом будет после параметров с названиями только один параметр пагинации -- пагинация в книге (просто один номер страницы или же диапазон, если статья на двух или более страницах). Я предлагаю именно так сделать. Hinote (обсуждение) 18:58, 18 октября 2015 (UTC)
  • Я лично не хотел бы лишнего загромождения номерами, дублирующимися 3-40 раз для каждой статьи страницы (страниц на которых по 20-40 статей довольно много). По сути, не припомню ни одного издания, где в указателях/оглавлениях, было бы такое дублирование. Всё же это словник СДЛ ("сделан для людей"), а не база данных, которые переполнены данными, и которые прячут чтобы их излишек человека от сути не отвлекал. --Vladis13 (обсуждение) 20:46, 18 октября 2015 (UTC)
Может на форуме спросить?--Vladis13 (обсуждение) 21:36, 18 октября 2015 (UTC)
Не вижу смысла. Это внутреннее дело проекта. Как решим -- так и будет. Я сделаю 2 примера одного и того же словника, с одним оформлением и с другим -- чтобы было видно наглядно. Нас в проекте трое, посмотрим и решим. (Также, не понял, про какие "3-40 раз для каждой статьи" вы говорите. Если пагинацию показывать для каждой статьи -- то это 1 раз (1 пагинация) для каждой статьи.) Hinote (обсуждение) 21:43, 18 октября 2015 (UTC)
"Как решим так и будет". - Как решим? наши мнения расходятся, нужна 3-я сторона, Дмитрий воздержался, тематика распространяется на все словники ВТ. Открыл тему на форуме.
"не понял, про какие "3-40 раз для каждой статьи" вы говорите." - в словаре часто до 40 статей на страницу. Поэтому в словниках для каждой из них (до 40 строк подряд) будет стоять дублирующаяся пагинация. --Vladis13 (обсуждение) 22:44, 18 октября 2015 (UTC)
Да, но я лично не вижу в этом криминала. Но это как решим. Я сделал примеры оформления словников, посмотрите выше... Hinote (обсуждение) 23:03, 18 октября 2015 (UTC)

6-й параметр, страница скана[править]

  • 6-ой параметр (пагинация по скану) не нужна. Я просил ее оставить, чтобы просмотреть все словники и для тех статей, где у шаблона "Статья в словнике ТСД" заполнен 6-ой параметр (есть пагинация по скану), но нет 4-го (нет пагинации по книге) из имеющегося 6-го параметра заполнить 4-ый. Я думал, что таких статей (у которых указана пагинация по скану, но не заполнена пагинация по книге) будет довольно много. Я как раз вчера просмотрел словники -- таких статей уже нет, а если и были -- значит уже подкорректировали. Т.е. как раз нужно вообще у всех статей в словниках удалить 6-ой параметр, он больше не нужен. А будет ли 5-ый -- зависит от того, что описано выше, в пред. пункте: будем ли мы отдельно отображать/не отображать в словниках пагинацию лишь для некоторых статей или же будем ее отображать у всех. В последнем случае, как написано выше, и 5-ый параметр будет не нужен. Hinote (обсуждение) 19:01, 18 октября 2015 (UTC)
  • Вобще-т, настаивал на сохранении 6-го параметра именно я, вы были против, но не суть… :) В ТСД-2 сейчас вроде вычитываем словник. Но неизвестно когда эта работа будет закончена… очень трудоёмко. Да, вы рассказывали сказку, что Lozman вычитал словник в несколько тысяч слов за пару дней… Реально вот сейчас мы с Дмитрием работаем — по 200—300 строк в день вычитываем. И это весьма утомительно, не знаю насколько регулярно эта работа будет делаться. Но даже в таком ритме: 44400 статей / 200 = 222 дня надо, учитывая «человеческий фактор» округляем — около года непрерывной работы 2-х участников. Поэтому крайне сомнительно, что работа будет сделана и на треть. А ещё нужен словник ТСД-3 где 270 тысяч статей. Поэтому, со временем всё будет пущено на самотёк, и получится таже ситуация, что где-то в статьях будет заполнена только пагинация скана. Почему же пагинацию скана не использовать, если она зачастую уже есть (и будет) в тэгах pages, просто парся тэги и пересчитывая скриптом? В ТСД-3, который залит сейчас всего на 2.8% от всего словаря, сейчас 200 статей, где указана пагинация скана, но нет пагинации книги. --Vladis13 (обсуждение) 20:16, 18 октября 2015 (UTC)
Вопрос: как извлечь? Если отказываемся от ввода пагинации/источника в шапку, перенеся всё это в словники, тогда ботом, который бы копировал значения из тэгов в шапку уже не обойтись. Надо скачивать страницы (дампом), затем локально проходить скриптом, который бы составлял в отдельном файле таблицу — словник с пагинацией, затем переформатировав заливать данные в словник. (Вообще, мы из скриптов/шаблонов/«костылей» изобретаем элементарную базу данных из одной таблицы, жаль что подобного функционала не разрешает вики.) Также надо на всех страницах ТСД-2 ботом в шапке заменить параметры источника на сообщение, мол: «Вводите параметры источника и номера страниц на отдельную страницу словника.» Вобщем-то да, если переходим на схему со словником, то 6-й параметр не нужен. --Vladis13 (обсуждение) 20:16, 18 октября 2015 (UTC)
Мы по-моему опять о разных вещах говорим. Давайте опять по частям. Про 6-ой параметр, для начала. Вот сейчас уже по факту нет в словниках ни одного шаблона "Статья в словнике ТСД", у которого был бы 6-ой параметр, и не было бы 4-го. Я просил его оставить в сгенерированных вами словниках только на первое время (которое прошло) -- только для того, чтобы найти такие статьи, у которых этот (6-ой) параметр будет, а 4-го -- нет. Таких статей в словниках нет. 6-ой параметр больше в словниках не нужен. Удаляем? Hinote (обсуждение) 21:38, 18 октября 2015 (UTC)
Да, и вы Дмитрия не пугайте -- и в шапках можно тоже будет все вводить при желании (как он хотел и как я говорил, что это можно будет делать). Только не особо нужно это будет делать... Но если захочется, то можно. Hinote (обсуждение) 21:50, 18 октября 2015 (UTC)
Не надо по частям, говорим об одном. Если тема другая - давайте её обсудим под другим заголовком. Зачем пагинация в шапке статей, если она будет браться из словника? Как раз такое редактора пугает - совсем не хочется вводить источник опять в 3-х местах, да теперь ещё и на разных страницах (статьи и словника). --Vladis13 (обсуждение) 22:19, 18 октября 2015 (UTC)
Не по частям не получается -- мы в разные детали залезаем и в целом не можем понять друг друга. Поэтому гораздо проще такие моменты разбить на отдельные части или детали и обсуждать уже их и сходиться по частям. Про пагинацию в шапке: все очень просто. Это то, о чем беспокоится Дмитрий и что он хочет, чтобы было оставлено. А именно: чтобы редактор, который не знает, как устроен словник или "боится" туда лезть, но который при этом видит, что есть несоответствие в ссылке на страницу, отображаемой в шапке какой-то статьи, чтобы он мог просто указать правильное значение, непосредственно в статье, т.е. в ее шапке, параметром (как сейчас они указаны). Т.е. после того, как будут сделаны словники до определенного состояния, все параметры пагинации для 2-го издания будут удалены из шапок статей (или заменены на пустые значения, чтобы пустой параметр оставался в шапке). Все значения пагинации будут браться из словника. Но вот если потом для какой-то из статей такой редактор увидит несоответствие -- он может всегда "подправить" пагинацию непосредственно в статье, в параметре. Такие статьи с "подправленной" пагинацией можно собирать в спец. категории вида "Статьи ТСД2 с установленной пагинацией на странице статьи" (название придумать можно любое). И когда после этого приходит редактор, который знает, как устроены словники и/или не боится в них лезть -- он берет это "подправленное" значение и переносит в словник, удаляя опять после этого из статьи, т.к. там уже это подправленное значение не нужно, т.к. словник был сам подправлен. Так устроены шапки всех проектов: те значения, которые берутся из словника, можно "перебивать" значениями параметров в шапке. Но это не значит, что эти параметры реально используются и/или установлены в статьях -- их можно использовать, но реально они не используются. Зачем нужно оставить возможность, чтобы их можно было использовать -- я описал выше сценарий. Что вас здесь все еще смущает? Вы согласны с таким использованием параметров в шапках (в частности, для пагинации по книге, пагинация по скану вообще не нужна, т.к. высчитывается всякий раз по пагинации по книге)? Второй вариант: не давать возможность указывать такие параметры, "перебивающие" то, что берется из словников, в шапках (в частности, для пагинации) и брать параметры (имена, пагинацию, ссылки на предыдущий/следующий) только из словников. Вы за такой вариант? Я не совсем пойму вашу позицию тут... Hinote (обсуждение) 22:38, 18 октября 2015 (UTC)
Какая тут может быть позиция, тут всё очевидно. И необязательно столько писать, достаточно сказать что параметры в шапке приоритетней и при указании замещают указанные в словнике.
Вопрос то в другом, выше вы так многообещающие сказали про 6-й параметр, о чём данная тема. И что эту тему надо обсуждать по частям, и «мы залезаем в разные детали» и т. д. Только в данном комментарии я не увидел ничего про 6-й параметр. Я вам расписал, что теперь ботом собрать из тэгов пагинацию в словник не получится, вы как-то пропустили это. Только поэтому он становится бесполезен. Также вы не заметили, что введённые в 6-й параметр данные никак не мешают, и более того — скрипты шапки и пересчёта пагинации ещё не подключены. Я ведь несколько дней назад спрашивал — возможно ли их подключить сейчас хотя бы на небольшом тестовом участке словника? Когда заработают — тогда и можно будет удалять. Пока же пусть останутся. --Vladis13 (обсуждение) 22:57, 18 октября 2015 (UTC)
1) Ну, для меня ваша позиция не очевидна. Не всегда очевидна. Видите же, я переспрашиваю, когда не понимаю или не до конца понимаю, что именно вы имеете в виду. 2) Написать можно и коротко, но я всякий раз имею в виду, что Дмитрий, который такой же участник проекта, совсем не программист. Но относительно всего этого тоже может иметь мнение. Поэтому короткий сленг может быть для него не понятен. И я каждый раз то, что я пишу, пытаюсь написать более "разжеванно" именно с учетом этого. 3) Вы написали много про трудоемкость. У меня здесь свое мнение, мне кажется, вы что-то не так делаете, раз получается так трудоемко. Возьмусь и пройду словники, ибо мне не получается до вас донести, что здесь нет такой ужасной трудоемкости, как вы говорите... 4) Про пагинацию сканов из словников: так вы же сами ранее сказали, что это очень трудоемко (как извлечь из тегов эту информацию) и мы решили, что надо обойтись информацией из параметров. Что и было сделано. 5) "теперь не извлечь информацию из тегов". Ее всегда можно извлечь, если этим задаться -- что до этого, что сейчас, что потом. Просто решили этого не делать, ибо трудоемко. 6) Параметр 6 стал ненужным не потому, что не извлекли информацию из тегов. Параметр 6 не нужен, т.к. ранее он был нужен только для переноса с коррекцией его значения в значение параметра 4 там, где параметр 6 указан, а параметр 4 -- нет. И еще потому, что он не используется в словниках сейчас и не будет использоваться в шапках чуть позже, когда словники будут подключены к шапкам. Вся пагинация по скану высчитывается из пагинации по книге. 7) Про то, что вы ничего не увидели про параметр 6: "Только в данном комментарии я не увидел ничего про 6-й параметр.". Но вы же выше сами в коротком комментарии задали еще один вопрос: "Зачем пагинация в шапке статей, если она будет браться из словника?" И я вам ниже уже стал отвечать на уже этот вопрос, зачем все-таки пагинация в шапке, поэтому про параметр 6 вы там и не увидели, странно, что ниже вы этому удивляетесь... Я же говорю: мы вроде бы говорим и об одном и том же, а вроде как о разном вообще... 8) "Я ведь несколько дней назад спрашивал — возможно ли их подключить сейчас хотя бы на небольшом тестовом участке словника?" -- это вы про подбор значений из словников в шапках, это подключить? Ну, шапка у статей у нас одна, значит и подключить можно только сразу во все статьи. Но для этого не нужно доделывать все словники до конца, есть еще несколько небольших правок, а потом я собирался как раз править шаблон шапки, чтобы подключить подбор значений из словников. Это работа, требующая достаточной внимательности и времени, и поэтому я собирался начать ее отдельно, на свежую голову, в пн или вт. Вроде пока нормально двигаемся, а вам что-то не нравится... Вам не до конца понятно, куда же я вас виду: ну, я тоже вижу здесь проблему в донесении, видите, пытаюсь (и раньше пытался пространными комментариями) донести до вас детали, но не всегда получается... Hinote (обсуждение) 23:23, 18 октября 2015 (UTC)
По 2, как я понимаю, Дмитрий не читает наши беседы, всё где попадаются слова "шаблон" и "параметр", или читает "по диагонали". По другому я написал ответ, но сейчас всё это не суть. Повторюсь, давайте подключим скрипты и убедимся что работает. А там будем зачищать место работы, посмотрим что ненужно. Пока ещё пагинация не высчитывается и в шапках из словника не отображается. Не будем бежать впереди поезда, удаляя что-то сейчас. --Vladis13 (обсуждение) 00:16, 19 октября 2015 (UTC)
Извините, что не участвую в вашей дискуссии. Я пытаюсь читать, но многое из того, что вы пишете выше моего понимания. Технические термины меня сбивают с толку. Dmitrismirnov (обсуждение) 07:39, 19 октября 2015 (UTC)

Строка автозамены[править]

@Dmitrismirnov: Можно упростить заполнение пагинации в словнике, - не вводить для каждого слова вручную, а только для первых на странице, а остальные заполнить автоматом. 1) Нужно указать пагинацию первого термина на странице в шаблоне, например: {{Статья в словнике ТСД|Слово| ||637}}. 2) Для следующих на этой же странице пагинацию можно не заполнять. Только для начальных терминов на новых страницах, и там где диапазоны. 3) В редакторе нажать кнопку гаджета «Поиск и замена» и ввести в строку поиска регулярку: (ТСД\|.*?\|.*?\|.*?\|\s*)(\d+)(.*?\}\}[\w\s\n#{]+Статья в словнике ТСД\|.*?\|.*?\|.*?\|)\s*(\}), замены: $1$2$3$2$4, включить «Считать строку поиска регулярным выражением». Она будет брать верхнее заданное значение пагинации и копировать в нижние строки. Если на странице указано несколько — будет прыгать туда обратно, это нормально. Перед записью страниц проверяйте первое время «внесённые изменения», настроил, но случаи всякие бывают. --Vladis13 (обсуждение) 21:13, 18 октября 2015 (UTC)

Хорошо, если это ускоряет работу, но выглядит для меня устрашающе - не упрощением а ещё большим усложнением (из-за неискушённости в технических вопросах). Dmitrismirnov (обсуждение) 07:49, 19 октября 2015 (UTC)
Также могу ботом сделать, - это будет для всех проще. Т.е. только заполняйте номера страниц для первых статей на этих страницах, и диапазоны, напишите где, я эти номера страниц скопирую во все нижние строки. Если хотите. --Vladis13 (обсуждение) 12:51, 19 октября 2015 (UTC)


Внешний вид словников[править]

Почти финальный вид. Я добавил значок страницы, который есть ссылка на соотв. скан страницы. Читателям они не особо нужны, а нам, редакторам статей, пока идет работа над проектом, должно быть очень удобно иметь ссылку на страницу скана, правильно? Хорошо так, пойдет? (Проще было сам диапазон страниц, отображаемый в словнике, сделать ссылкой, но вроде уже обсуждали, что тогда будет слишком много ссылок и они зрительно будут сливаться со ссылками на сами статьи, так ведь?) Hinote (обсуждение) 15:21, 17 октября 2015 (UTC)

Внешний и внутренний вид словников[править]

Представляю варианты оформления, надо определиться, куда двигаться дальше:

  • Пример-1: Текущий вариант. В словнике пагинация отображается для статей, которые начинаются на новой странице и у тех, которые размещены на двух страницах (начало на одной, а окончание -- на следующей). У остальных -- пагинация не отображается. Для этого используются 2 разных параметра пагинации: параметр 4 установлен для всех статей, а в параметр 5 дублируется его значение для тех статей в словнике, для которых в словнике нужно отображать пагинацию (для тех статей, для которых не нужно отображать в словнике пагинацию, устанавливается только параметр 4).
  • Пример-2: Вариант словников, "как в остальных проектах". Т.е. пагинация отображается у всех статей. Благодаря тому, что в этом проекте удалось сделать ссылку на страницу в виде иконки, страница словника не так перегружена ссылками, как в том же ЭСБЕ -- т.к. здесь пагинация для каждой статьи отображается просто текстом. Такой вид оформления упрощает внутренний вид словника: не нужен отдельный параметр 5, у всех статей устанавливается только параметр 4 -- один параметр пагинации и все. Т.к. не нужно отличать статьи, для которых пагинация отображается в словнике и для которых не отображается (отображается для всех). Я за этот вариант. Он проще и "стандартнее".
  • Пример-3: Вариант как вариант 1, но пагинация в словнике отображается только для новых статей на странице. Для статей, которые размещаются на двух страницах, пагинация в словнике не указывается. Отличия от варианта 1: для таких статей просто не установлен (стерт) параметр 5. (но при этом для таких статей диапазон страниц все равно нужно указывать в параметре 4, т.к. он будет отображаться в шапке, а там для статьи, которая размещается на двух страницах, нужно отображать все равно правильный диапазон страниц, а не одну страницу, чтобы не вводить в заблуждение читателя). Vladis, вы именно это хотели, говоря о том, что много ссылок на статьи в словнике?
  • Пример-4: Иконка и пагинация текстом только у первой статьи на странице; у статей, которые размещаются на двух страницах -- только пагинация текстом.

Hinote (обсуждение) 23:00, 18 октября 2015 (UTC)

  • Пример 2 заметно тормозит при загрузке и перемотке, а это всего ~700 строк. Тоже наблюдал в примере со страницей словника ЭСБЕ в соседней теме, с таким же числом строк. Хорошо нет ударений, была бы вообще "вырви глаз". Столько ссылок на индекс со значками явно не нужно. Это отпугнёт читателя.
    Пример 3 показывает, что диапазон пагинации, для статей с ним, надо отображать, - ведь словник (указатель, оглавление) и нужен чтобы указывать нумерацию страниц статей. Лучше было бы сделать чтобы ссылка давалась только на новые страницы, а на диапазон не давалась, но при этом он отображался. Для этого можно в скрипт вставить, чтобы определял что если на вход подана строка содержащая кроме цифр символы [-—−], ссылку не делать. --Vladis13 (обсуждение) 23:27, 18 октября 2015 (UTC)
  • Не хотите пример 2, в котором пагинация отображается у всех статей -- значит не будет. Я не понял, вы за вариант 1 или за вариант 3? Или еще за какой-то? Не про реализацию, а про внешний вид. В варианте 3 я попробовал понять, что именно так вы хотите, чтобы выглядел словник... Hinote (обсуждение) 23:48, 18 октября 2015 (UTC)
  • Лично мне кажется лучше 1-й вариант, но чтобы диапазоны страниц небыли ссылками. Вроде этого:
  • Алексѣя-теплаго / Алексея-тёплого      Fictional page.svg 11
  • Аллилуія / Аллилуйя
  • Алмазъ / Алмаз      11—12
  • Ало / Ало      Fictional page.svg 12
Но сначала надо мнение 3-й стороны. Может надо пагинацию для каждой статьи, тогда кроме 2-го варианта обсуждать нечего. --Vladis13 (обсуждение) 00:34, 19 октября 2015 (UTC)
Теперь понял. Среднее между вариантами 1 и 3. Сделал Пример-4, см. выше в списке примеров. Hinote (обсуждение) 12:21, 19 октября 2015 (UTC)
Мне больше нравится 3-й вариант, и против 1-го я тоже не возражаю. 2-й вариант мне кажется тяжеловесен и перегружен картинками. Ещё хотелось бы, чтобы цифры после картинок тоже были функциональными - то есть, чтобы нажатие на них приводило бы к странице скана, как я сделал это в словнике Ѣ -- см. ТСД/Словник/Ѣ. -- Dmitrismirnov (обсуждение) 11:07, 19 октября 2015 (UTC)
Ладно, конкретный вид всегда можно допеределать, здесь было главное определиться -- будем мы переходить на нечто вроде 2-го варианта (пагинация у каждой статьи, с иконкой или без -- не важно). Т.е. как у остальных словников. Если бы решили, что переходим -- это позволило бы удалить во всех словниках параметр 5 у шаблона "Статья в словнике ТСД". Раз это не нравится -- тогда параметр 5 остается, как и сейчас... А дальше уже можно внешний вид допеределать как захотите... Hinote (обсуждение) 12:21, 19 октября 2015 (UTC)
2-й вариант правильный для энциклопедий, но не для словаря где номера будут так массово дублироваться. Как мне кажется. --Vladis13 (обсуждение) 13:17, 19 октября 2015 (UTC)
Может быть, хорошо бы сейчас на этом этапе продумать как объединить все три издания в одном списке. Предлагаю это сделать на примере короткого словника, хотя бы этого: ТСД/Словник/Ѣ --Dmitrismirnov (обсуждение) 11:10, 19 октября 2015 (UTC)
В таком виде не будет работать. Список в словнике должен быть единым. Ибо он определяет последовательность предыдущий/следующий для шапок статей. Т.е. либо только список по изданию 2, либо только список по изданию 3, либо микс из статей в изданиях 2 и 3, но единым списком. Hinote (обсуждение) 12:21, 19 октября 2015 (UTC)
Когда раздельно, можно выбрать какое издание смотреть - Даля или переработанное Бодуэна. В миксе же будет винегрет. К тому же, надо будет опять делить словник, в ТСД-3 статей в 6 раз больше, т.е. при их добавлении каждая страница словника будет раздуваться, и со временем их надо будет постоянно делить, переписывая под новые названия шаблоны и скрипт. --Vladis13 (обсуждение) 13:11, 19 октября 2015 (UTC)
"Когда раздельно, можно выбрать какое издание смотреть - Даля или переработанное Бодуэна..." -- это имеет мало смысла, потому что в идеале статьи всех трёх изданий помещаются на одной странице. Из них Далю принадлежит полностью только 1-е прижизненное издание... Dmitrismirnov (обсуждение) 13:38, 19 октября 2015 (UTC)
Буква Ѣ помещается на одной странице, но как быть с буквой "П" длина которой в ТСД-2 12 тыс. строк, а в ТСД-3 для неё отдельный том. Собственно кротких букв лишь несколько, остальные все длинные.
ТСД-2, по сути, - тоже издание Даля, там его дочь только ошибки исправила и дополнила его же записями, которые сам не успел опубликовать. "Издание семьи Даль" - так точнее. :) --Vladis13 (обсуждение) 14:09, 19 октября 2015 (UTC)
1) как быть с буквой "П"? -- помещать на разных страницах.
2) я знаю, но тем не менее, это редакция дочери плюс труды десятков других исследователей (посмотрите развёрнутые приложения в конце к 4-го тома 1-го издания) и потому авторизованным изданием может считаться только условно. Но не в этом дело, а дело в том, что мы даём на одной странице все три издания, тем самым давая читателю возможность их сравнить + ссылки на сканы оригинальных изданий. Идея замечательная и уникальная - так как никто до нас этого не делал. Поэтому было бы хорошо найти возможность объединения трёх этих словников воедино. Dmitrismirnov (обсуждение) 14:41, 19 октября 2015 (UTC)
Вариант всех устраивающий комментарием ниже. --Vladis13 (обсуждение) 14:58, 19 октября 2015 (UTC)
Насколько помню, викидвижок позволяет включать в страницы текст других страниц, посредством скобок "{{ }}". Т.е. можно иметь оба варианта: отдельные словники, +совместный словник, включающий страницы отдельных. --Vladis13 (обсуждение) 13:30, 19 октября 2015 (UTC)

Словники: Пример-5[править]

Сделал еще один пример того, как могут выглядеть словники: Участник:Hinote/Пример словника-5. Как видно, создан специальный шаблон {{Ссылка на страницу скана ТСД}}. В первом параметре указывается и издание ("2/4/636" -- издание/том/страница), поэтому это поможет и сделать правильные ссылки в "сборном" общем словнике, когда словники издания 2, издания 3 включаются на общую страницу, в общий словник. Чем еще хорошо: как видно, нам становится совсем не нужным параметр 5 у шаблона "Статья в словнике ТСД", указывается только 1 параметр пагинации. Да, в принципе вместо "2/4/636", издание/том/страница можно сделать так, чтобы просто указывать "2/636", без тома, т.к. том может браться (вычисляться) из названия (колонтитула) страницы скана "Шаблонщик — Шакать", который там указывается. Как вам такой способ оформления? (Пример сделан, собственно, как один из вариантов решения проблемы того, что когда Дмитрий включает словник из издания 2 в "общий" словник, перестают правильно работать ссылки на страницы сканов. Ну, и заодно, получился еще один вариант оформления словников). Так можно оформлять и словники издания 2 и словники издания 3 (у одного будет прописываться "2/том/страница" или "2/страница", а у другого, соответственно, "3/том/страница" или "3/страница"). Hinote (обсуждение) 00:18, 24 октября 2015 (UTC)

По реализации: Удаляя 5-й параметр, который водится всего один раз на страницу, этот вариант вносит гораздо больше усложнений и требований.
Как минимум надо укоротить. "{{Ссылка на страницу скана ТСД|2/4/638|Шаканье — Шаливать}}" 1) название шаблона не должно быть похоже на поэму, достаточно трёх букв, например назвать {{dp}} (от "даль пагинация"), ибо чем вводить столько слов проще оставить 5-й параметр, или ввести один новый (номер издания одна цифра) 2) параметры делать не через "/", а через "|" - проще, привычней, и редактор не должен быть пианистом, 3) содержание не нужно. длинно, вплоть до того что его просто никто не будет вводить, и ненужно - в словнике и так всё видно. --Vladis13 (обсуждение) 00:58, 24 октября 2015 (UTC)
  • Кстати, реализовать это же можно используя 5-й параметр. Логика: если в {{статья в словнике ТСД}} есть 5-й параметр, то над строкой отображать заголовок с номером страницы; иначе отображать строку как обычно. --Vladis13 (обсуждение) 01:07, 24 октября 2015 (UTC)
  • Да, можно, но тогда не будут отображаться колонтитулы страниц. Идея оформления то взята из словников, которые делал Дмитрий. А там в ссылках указываются колонтитулы. Если нам это не нужно, то, да, можно обойтись пятым параметром. Опять-таки возникает тогда вопрос, как указывать издание? Через слеш (что вам не нравится) или же опять еще один параметр? Идея разделения через слеш взята из других словников, там это использовалось для указания разных значений пагинации. Как раз, чтобы не вводить еще один параметр... Если будет еще один или даже 2 параметра у шаблона Статья в словнике ТСД, я это не пропарсю в модуле Header (парсинг параметров этого шаблона -- это, пожалуй, единственное, что мне осталось сделать в этом модуле для подключения наших словников ТСД второго издания к шапкам; именно поэтому я это сейчас обсуждаю, чтобы понять, что и как там в результате реализовывать)... Насчет длинного имени шаблона -- мне лично так виднее и приятнее. Фломастеры, как известно, на цвет и на вкус все разные. Всегда можно сделать перенаправление или даже переименовать шаблон -- его имя к способу организации словников вообще не подходит... Но как минимум ТСД в названии должно быть, как мне кажется. Я в ВТ вообще категорически против, когда участники "забирают" такие короткие названия под цели, которые нужны одному конкретному проекту или даже при оформлении одного произведения. Итак, поэтому, здесь надо решить: хотим ли мы вот так вынести ссылки на сканы "наверх" над первой статьей страницы? Если да, то нужна ли возможность указывать колонтитул в названии ссылки? Если да -- то нужен такой отдельный шаблон для ссылок на страницы. Если нет, то надо решить, как записывать номер издания в пагинации у шаблона Статья в словнике ТСД -- так же через слеш в пятом параметре или же отдельным еще одним параметром (и где -- перед параметром со страницами?). Hinote (обсуждение) 01:21, 24 октября 2015 (UTC)
  • Если реализовывать через 5-й параметр, выводя через шаблон строку выше - это вроде разорвёт список, нумерации строк не будет. Название, и описание или словарное определение - это всё таки разные сущности. Вариант названия например "тсдп" (от "тсд пагинация").--Vladis13 (обсуждение) 02:08, 24 октября 2015 (UTC)
  • Точно также, как разорвет нумерованый список этот отдельный шаблон Ссылка на страницу скана ТСД на отдельной строке. Но дело в том, что нумерации там вообще не должно быть. В финальной версии словников. Ненумерованный список. Видите, я примеры так и делаю -- как ненумерованные списки. Во-первых, опять-таки, это обычное оформление списков для других проектов. Потом, сейчас нумерация (и я ее не стал пока переделывать на ненумерованный список) нам удобна, но только пока мы активно "трогаем" словники -- переставляем статьи, возможно даже из словника в словник. Поэтому нумерация сейчас для нас полезна, чтобы видеть общее кол-во статей в словнике. В финальной же версии словника, т.е. для читателя, она не нужна и должна быть изменена на ненумерованный список. А то, что название статьи (и ее атрибуты -- пагинация) и ссылка на страницу -- это разные сущности, я тут с вами согласен, естественно. И в частности поэтому в этом примере ссылка на страницу оформлена отдельным шаблоном. Но вы же сами предложили выше вариант не с этим отдельным шаблоном для ссылки на страницу, а через параметр 5. А теперь говорите, что это плохо, т.к. это все-таки разные сущности. Я опять перестал вас понимать... Так вы за такую ссылку, как в этом примере (с названием-колонтитулом и на отдельной строке, как Дмитрий делал в своих словниках) или же за то, как это сделано сейчас? Hinote (обсуждение) 08:56, 24 октября 2015 (UTC)
  • "Разными сущностями" я назвал только названия и описание/словарное определение. Это к тому, что рабочее название не должно быть длинным и описательным. Данная реплика параметров не касается, она только про название. --Vladis13 (обсуждение) 20:53, 24 октября 2015 (UTC)
  • Лично мне кажется, громоздко выводить пагинацию заголовком. Не припомню изданий где такое бы применялось. Также считаю, что колонтитулы - это лишнее, можно украсить так сотню страниц, но не 3тыс. ТСД2 и ещё больше ТСД3, практичнее потратить время на вычитку словника. --Vladis13 (обсуждение) 02:08, 24 октября 2015 (UTC)
    • Смотрите, решайте как удобнее и как нам в результате сделать. Я просто представил один из вариантов, как это можно сделать. Нам надо решить, как указывать издание в ссылке на страницу, раз словники предполагается включать в иные страницы. Если не указывать, то ссылки портятся, указывают не туда, как видно. Издание указывать хоть так отдельно, как отдельная ссылка с колонтитулом страницы, хоть в параметре 5 на строке соотв. статьи, хоть там же, но отдельным параметром (но это становится неудобным для модуля), может быть еще как то... Hinote (обсуждение) 09:07, 24 октября 2015 (UTC)
  • Дмитрий не высказался, пока не понятна его позиция. --Vladis13 (обсуждение) 20:58, 24 октября 2015 (UTC)
Я в некотором недоумении зачем менять дизайн, который и так хорош. В новом предложенном дизайне мне не нравится
1) отсутствие нумерации страниц - а это очень удобная и наглядная вещь; а также
2) громоздкие колонтитулы, разбивающие столбец статей. Кроме того, как я уже говорил,
3) мне хотелось бы, чтобы не только рисунок фальшивой страницы, но также цифры указывающие на номер страницы были функциональными. И почему этого нельзя сделать, я так и не понял.
4) от указания перехода статьи на следующие страницы предлагаю отказаться. Это утяжеляет словник и усложняет его составление. Вот как мне хотельсь бы, чтобы выглядели эти словники:

Dmitrismirnov (обсуждение) 00:21, 25 октября 2015 (UTC)

  • По 4 пункту не понял. Отказаться от отображения диапазонов или от чего? В примере, в 3-м издании диапазоны выглядят будто это одна статья занимает диапазон (например "Едет 1519-1520"), а где тогда другие? Диапазон в этом примере для многих стаей, его указание без пояснений у какой-то одной статьи вводит в непонимание. Как быть, например, со статьёй "Пола" занимающей более 5 страниц, притом первую и последнюю не целиком?
Я считаю, что если указывать пагинцию возле названий статей - то именно для статей. Конечную страницу статьи (если заканчивается на другой странице) вводить по желанию, это не принципиально (в других изданиях встречается и так и так). --Vladis13 (обсуждение) 01:55, 25 октября 2015 (UTC)
    • Я имею в виду, что в словнике следует указывать только начало статьи, а не конечную её страницу. В 3-м издании, как мы знаем, нет указаний страниц, указываются не страницы, а колонки. Поэтому у каждой страницы двойной номер, например: 1519-1520, в которую входят все статьи на этой странице со сдвоенным номером, начиная от Ѣˊдетъ / Еˊдет и кончая 1. Ѣˊжа / 1. Еˊжа. Dmitrismirnov (обсуждение) 07:32, 25 октября 2015 (UTC)
  • Давайте, как всегда, по порядку, по пунктам, чтобы было понятнее и яснее (постараюсь, как всегда, попонятнее -- Дмитрий, вы нам нужны в этом обсуждении ;-). Hinote (обсуждение) 21:51, 26 октября 2015 (UTC)

1) Отсутствие нумерации страниц. Полностью согласен с тем, что нумерация страниц в словнике это нужно и важно. Но присмотритесь к ссылкам на страницы ("колонтитулы") в Участник:Hinote/Пример словника-5 -- там нумерация страниц есть ("с. 636", "с. 637"). Для издания 3 можно было бы (нужно?) писать там не "с. 636", а "стлб. 1517—1518". Hinote (обсуждение) 21:51, 26 октября 2015 (UTC)

2) Громоздкие колонтитулы. Так это же я у вас "подсмотрел" такой вариант оформления, вы же так оформляли ранее словники для издания 3 -- и колонтитул страницы ("Шаканье — Шаливать") и ссылка на страницу на отдельной строке, разбивающей общий список статей. Я только оформил это (реализовал) специальным шаблоном (а не просто ссылкой на страницу в тексте словника), чтобы это не мешало модулю Header формировать общий список статей для показа страниц предыдущий/следующий (т.к. все обычные ссылки, хоть на страницы, хоть еще куда то, добавляются к общему порядку статей, вставляются в последовательность статей для отображения предыдущий/следующий). Т.е. такой вид словника, как вы раньше делали и как в этом Примере 5 -- реализуется, но немного особым оформлением ссылок на страницы в отдельных строках -- не просто ссылкой, а вот таким отдельным шаблоном... Так что "заметьте, не я это предложил" (с) к/ф Покровские ворота ;-)) Hinote (обсуждение) 21:51, 26 октября 2015 (UTC)

3) Чтобы не только рисунок страницы, но и текст с номером страницы или диапазоном столбцов был бы ссылкой. Это реализуемо, прямо сейчас, дело пяти минут. Но, когда я делал текущий вид словников (ссылка -- только рисунок страницы, а номер страницы -- текстом), я учитывал наше обсуждение, которое было где-то выше на этой странице обсуждения (наверное сейчас уже в архиве): когда я дал в качестве примера "на посмотреть" словники ЭСБЕ, была претензия к ним в том, что там слишком много ссылок (и название статьи -- ссылка на страницу статьи, и плюс номер страницы -- ссылка на страницу скана) и это некрасиво. Поэтому я текущий вид словников ТСД и реализовал как сейчас: ссылка на страницу скана это рисунок страницы, а номер страницы -- простой текст, чтобы было меньше видимых ссылок. Если хотите, я переделаю шаблон так, чтобы и номер страницы был ссылкой -- это легко и будет даже лучше, т.к. сейчас есть некоторая проблема со ссылкой на страницу скана, когда ее еще не существует, она еще не создана -- при этом ссылка, реализованная как рисунок страницы всегда ведет на страницу в режиме чтения (а не создания, как это делает красная ссылка). Если ссылки на страницу скана переместить с рисунка страницы на номер статьи -- для несуществующих страниц скана будут обычные красные ссылки. Ну что, переделать? (Это не для Примера 5, а для имеющихся словников в их текущем виде) Hinote (обсуждение) 21:51, 26 октября 2015 (UTC)

4) От указания перехода статьи на следующие страницы тоже можно отказаться прямо сейчас, вне зависимости от обсуждения этого Примера 5 и остального -- просто не указывайте для таких статей параметр 5 в шаблоне "Статья в словнике ТСД". Если этот параметр пустой, то ничего отображаться и не будет (в словнике). Параметр 5 отвечает за отображение пагинации как раз в словнике. При этом, параметр 4 -- это пагинация для шапки страницы (т. такой-то, с. такая-то). Там, по сути, формируется библиографическая ссылка на соотв. том и страницу (или страницы, если статья расположена на нескольких страницах). Поэтому для таких статей, которые располагаются на нескольких страницах, в параметре 4 все равно придется писать "правильный" диапазон страниц, а не только страницу, где статья начинается -- чтобы в шапке эта библиографическая ссылка на статью была правильной, чтобы она содерержала правильные данные -- диапазон страниц, а не только одну страницу, где статья начинается... То же для столбцов для издания 3. А в параметре 5, да -- можете ничего не писать для таких статей, если не хотите, чтобы в словнике отображалась какая-либо пагинация для таких статей. (Это не для Примера 5, а для имеющихся словников в их текущем виде) Hinote (обсуждение) 21:51, 26 октября 2015 (UTC)

5) TODO: Далее я здесь поясню, зачем вообще возник этот Пример 5 и зачем что-то переделывать. Hinote (обсуждение) 21:51, 26 октября 2015 (UTC)

5.1) Так вот. Зачем возник пример 5 и зачем что-то менять. Все очень просто: если включать словники отдельных изданий в некий "общий" словник, где на одной странице собраны словники разных изданий, то для формирования ссылки на страницу скана надо указывать не только страницу, но и издание. Страница у нас берется из 4-го параметра шаблона "Статья в словнике ТСД", том -- вычисляется по первой букве названия (а это параметры 1-3 того же шаблона), а вот издание каким-то образом надо указывать. Когда словник никуда не включается, то издание вычисляется по корневому компоненту названия страницы словника. Когда на одну страницу "общего" словника включаются словники разных изданий -- это не работает. Дмитрий, вы это уже заметили, что ссылки в "общих" словниках, которые вы сделали, стали смотреть не туда, не на те тома не тех изданий.

5.2) (Очень кратко, изначально хотел написать здесь подробно разные варианты... Но т.к. возможно это все и не нужно (см. след. п. 6), то описано кратко) Как можно указать издание? Во-первых, непосредственно в параметрах шаблона "Статья в словнике ТСД". Напр. еще одним параметром или в имеющейся пагинации напр. через слеш. Либо вне этого шаблона, отдельным шаблоном (как в этом примере 5).

6) @Vladis13, Dmitrismirnov: Пока у меня была пауза с предыдущих моих здесь размещенных постов (временно по разным причинам не так много времени для ВТ, как хотелось бы), я подумал и понял, что на самом деле не так уж и плохо размещать номер издания безо всяких слешей и безо всяких отдельных шаблонов, а просто еще одним параметром. (Ранее я боялся, что добавление еще одного отдельного параметра сделает словник сложным для редактора и также сложным для парсинга параметров в модуле Header) Вот так:

  • Для 2-го издания: {{Статья в словнике ТСД|Ез 3|Ѣзъ ||682|682|2}}
  • Для 3-го издания: {{Статья в словнике ТСД|Езгаться|Ѣзга{{Акут}}ться|Езга{{Акут}}ться|1521—1522|1521—1522|3}}

или даже так (здесь параметр 5 -- не отображаемый в словнике текст для пагинации, а номер издания):

  • Для 2-го издания: {{Статья в словнике ТСД|Ез 3|Ѣзъ ||682|2}}
  • Для 3-го издания: {{Статья в словнике ТСД|Езгаться|Ѣзга{{Акут}}ться|Езга{{Акут}}ться|1521—1522|3}}

Для тех статей в словнике, где не нужно указывать ссылку на страницу, по-прежнему достаточно указывать только один параметр пагинации, параметр 4 (не нужно указывать ни параметр 5 с пагинацией, ни параметр с номером издания, т.к. ссылки на страницу у этой статьи в словнике не показывается):

  • Для 2-го издания: {{Статья в словнике ТСД|Есть 2|Ѣсть ||682}}
  • Для 3-го издания: {{Статья в словнике ТСД|Есть 2|Ѣсть|(2.) Есть|1521-1522}}

Либо вообще отказаться от включения словников отдельных изданий в "общие" словники. Тогда ничего менять вообще не придется.

На самом деле, мне сейчас нравится этот дополнительный параметр -- номер издания и этот вариант. Hinote (обсуждение) 21:52, 28 октября 2015 (UTC)

  • По дополнительному параметру: вы говорили что 6-й параметр будет сложно парсить в скрипте, что лучше через слэш, смотрите как удобней. По тому нужен ли вообще совмещённый словник, и требуемый для него этот параметр, сейчас отвечу в #Совмещённый словник. (Тамже предлагалось ещё реализовать это через дополнительные шаблоны для каждого издания.) --Vladis13 (обсуждение) 23:14, 28 октября 2015 (UTC)
  • Я понял, что с парсингом нормально все будет в таком вот случае. Hinote (обсуждение) 00:41, 29 октября 2015 (UTC)
Не всё здесь понимаю, отвечаю по пункту 2) Громоздкие колонтитулы: я уже от них отказался, ибо то что предложили Вы (рисунок странички и номер сбоку) мне больше понравилось, так что предлагаю на этом дизайне остановиться. Я ответил также в разделе совмещённый словник. Dmitrismirnov (обсуждение) 23:52, 28 октября 2015 (UTC)
Ок. Значит забываем про вариант оформления с колонтитулами. Hinote (обсуждение) 00:39, 29 октября 2015 (UTC)

Вид ссылок на предыдущий/следующий в шапках[править]

Как часть работы по подключению словников в шапки для навигации по 2-му изданию. Возник вопрос, от которого зависит, как реализовывать. А именно, как должны выглядеть ссылки на предыдущую и следующую страницы. У нас есть статьи с совпадающими названиями в ДО и СО и есть статьи с отличными названиями в ДО и СО. Соотв., напр. для статьи ТСД/Абыс, она следующая страница для ТСД/Авава. Как должна выглядеть ссылка на нее на странице ТСД/Авава? Так: "←Абысъ / Абыс"? Или так: "←Абыс" (т.е. без названия ДО). Я тут за первый вариант (показывать и то и то, как в словнике, через слеш, но одной ссылкой). Соотв., для варианта статьи ДО, на странице ТСД/Авава/ДО, эта ссылка как должна выглядеть? Так: "←Абысъ / Абысъ / Абыс" (т.е. как и для варианта статьи в СО -- оба названия, в ДО и в СО)? Или так: "←Абысъ" (т.е. только название в ДО)? Тут я лично за второй вариант -- не надо на странице ДО показывать современный текст, т.к. это все-таки страница оригинального текста в ДО. Это для страниц, где названия статьи в ДО и СО отличается. Далее, как быть для статьи, где название в ДО и СО совпадает? Отображать через слеш оба названия (одинаковых), т.е. "←Авава / Авава" или же только один раз: "←Авава". Реализовать можно и то, и то, и то, надо определиться, как именно.

Итого, что было понятнее:

  • 1) Название ДО и СО отличные, на странице СО ссылка вида: 1.1) "←Абысъ / Абыс" или 1.2) "←Абыс"?
  • 2) Название ДО и СО отличные, на странице ДО ссылка вида: 2.1) "←Абысъ / Абыс" или 2.2) "←Абысъ"?
  • 3) Название ДО и СО совпадают, на странице СО ссылка вида: 3.1) "←Авава / Авава" или 3.2) "←Авава"?
  • 4) Название ДО и СО совпадают, на странице ДО ссылка вида: 4.1) "←Авава / Авава" или 4.2) "←Авава"?

Я тут за 1.1, 2.2, 3.2, 4.2. Т.е. названия через слеш отображаются только, если они разные и если это на странице СО. Vladis, Дмитрий: ваше мнение? Hinote (обсуждение) 23:30, 20 октября 2015 (UTC)

Дело в том, что обычная навигация не даёт возможности отражать написание в орфографии отличающейся от названия статьи. То есть, если статья называется Абыс, это выгладит как "←Абыс", если она называется Абыс/ДО, она выглядит как "←Абыс/ДО" и ничего нельзя изменить. Поэтому в субнавигации я следовал поначалу этому принципу. Если Вы предлагаете более изощрённый вид написания, то я предпочёл бы в СО писать как "←Абыс (Абысъ)", а в ДО писать как "←Абысъ". Если в круглых скобках трудно или неудобно, то тогда в СО можно через слэш "←Абысъ / Абыс". То есть, если говорить о предложенных Вами вариантах, я скорее за Ваш выбор: 1.1, 2.2, 3.2, 4.2. Но при этом хотелось бы держаться одного стиля в навигации и субнавигации. Это важно! --Dmitrismirnov (обсуждение) 00:03, 21 октября 2015 (UTC)
По голосованию согласен. Круглые скобки используются в оригинальных названиях, например Укро(а)плять. --Vladis13 (обсуждение) 00:03, 23 октября 2015 (UTC)

(ПОЧТИ) НОВАЯ ИДЕЯ: Я думаю, что лучше исходить из практического опыта. Так, исходя из него и столкнувшись с особенными непростыми случаями, пришёл к выводу, что наиболее практично и удобно следующее:

  • 1) Название ДО и СО отличные, на странице СО ссылка вида: 1.1) "←Абысъ / Абыс"
  • 2) Название ДО и СО отличные, на странице ДО ссылка вида: 2.1) "←Абысъ / Абыс"
  • 3) Название ДО и СО совпадают, на странице СО ссылка вида: 3.2) "←Авава"
  • 4) Название ДО и СО совпадают, на странице ДО ссылка вида: 4.2) "←Авава"
В качестве примера таких сложных и запутанных случаев хочу продемонстрировать страницу: ТСД/Ионический орден/ДО / ТСД/Ионический орден, а также соседние с ними Dmitrismirnov (обсуждение) 09:53, 26 октября 2015 (UTC)
  • Т.е. разница только по пункту 2? По моему оба аргумента нормальные и прилично выглядят: что в ДО версиях СО названия лишние, и что пусть будут для единообразия. --Vladis13 (обсуждение) 11:05, 26 октября 2015 (UTC)
  • Можно и так, можно любые комбинации этих вариантов (4 пары вариантов), мне лично кажется, что для статьи в исполнении ДО не стоит вообще нигде на странице указывать какие-либо тексты в СО. В том числе и названия этой же статьи в СО, названия предыдущей и следующей статей в СО. Только текст статьи в ДО и все названия статей -- тоже в ДО. Это же вариант статьи "как в оригинале", т.е. в ДО... На самом деле это сейчас уже не держит, я придумал, как это реализовать показ этих ссылок таким образом, чтобы нужный вариант отображения этих ссылок можно было поменять в шаблоне-шапке и не лезть менять модуль... Ну что, когда буду реализовывать это -- делаю этот вариант Дмитрия? Hinote (обсуждение) 19:39, 26 октября 2015 (UTC)
  • Андрей, если Вы не полностью согласны с моей последней идеей, всё можно переиграть, и вернуться к предыдущему варианту, по поводу которого мы все трое согласились. В ваших словах есть резон: показывать на странице в ДО -- всё в ДО. И я готов с Вами согласиться. Но другой резон - отображать двойное название в ДО и в СО и там и здесь (если эти написание отличается) тоже имеет право на существование, 1) единообразие, 2) показывает оба варианта написания сразу, в том числе реальное название страницы и 3) облегчает простому читателю разобраться в том как читать буквы І і Ѣ ѣ Ѳ ѳ Ѵ ѵ и т. п. Так что давайте решим совместно ещё раз, чтобы потом ещё раз не переделывать. Dmitrismirnov (обсуждение) 20:49, 26 октября 2015 (UTC)
  • По пункту 2 я воздерживаюсь, причину написал выше. --Vladis13 (обсуждение) 23:00, 26 октября 2015 (UTC)

Итого, как я написал -- этот момент уже не держит, т.к. то, как будут выглядеть эти ссылки -- будет определяться не в модуле, а в шаблоне шапки и это можно будет при желании быстро поменять на нужный вариант. Спасибо за мнения, тему можно в архив, чтобы не мешалась обсуждать остальное... Hinote (обсуждение) 12:45, 30 октября 2015 (UTC)


Переиздание98 - подкатегории по буквам[править]

Переименовал Категория:ТСД-2, переиздание '98, совр.орф. в Категория:ТСД:2-е издание, статьи списком, так точнее и приличней. Убрал статьи этой категории из Категория:Толковый словарь В. Даля — ибо это слишком общее название. Сделал подкатегорию для «/ДО», которая в таком же формате. Для ботозаливки переиздание98 больше не используется, поэтому если хотите, вставляйте из индекса тэги «pages/lst». --Vladis13 (обсуждение) 16:33, 7 октября 2015 (UTC)

В категории «ТСД:2-е издание, статьи списком» есть подкатегории по буквам, вроде Категория:Толковый словарь В. Даля:К. Мне кажется, они были полезны когда не было навигационного шаблона для категории {{Индекс категории АБВ}}. Их названия слишком общие, при том что их контент достаточно узкой темы. Может их удалить? --Vladis13 (обсуждение) 16:33, 7 октября 2015 (UTC)
Погодите удалять. Это мы всегда успеем. Мне часто приходиться искать статьи в этой части словаря для сравнения и корректировки, и я нахожу эти категории удобными для поиска. Dmitrismirnov (обсуждение) 20:38, 7 октября 2015 (UTC)
Может тогда переименуемем, в "ТСД:2-е издание, статьи списком:<буква>"? --Vladis13 (обсуждение) 22:45, 7 октября 2015 (UTC)

Переиздание98 - сокращения[править]

  • @Dmitrismirnov: в залитом переиздании в СО даны сокращения в совр. написании: «вологод.» а не далевское «влгд», «перм.» а не «прм.», «и пр.» а не «ипр.», «умалит.» а не «умал.» … и т. д. Может пройтись ботом и везде сменить на оригиниальное написание? --Vladis13 (обсуждение) 01:30, 24 октября 2015 (UTC)
    • Можно, хотя, как мне кажется, Даль в этом не везде последователен - у него встречаются вариации. Dmitrismirnov (обсуждение) 08:08, 24 октября 2015 (UTC) @Vladis13:!! В переводе в СО сокращение ипр. (ипрочее) я везде переделываю в и пр. (и прочее) - так правильнее. Кстати, его часто путают с нпр. (например) -- здесь надо быть внимательным. -- Dmitrismirnov (обсуждение) 09:45, 24 октября 2015 (UTC)
  • Варианты с вариациями можно преобразовать в наиболее используемый вариант, например «например» у Даля может быть «нпр.» и «нпрм.», какой чаще — тот и взять. «И пр.» не трогать. Обработка будет статей не залитых в индекс (хотя можно взять пройтись и по индексу, — для ТСД-2 там почти всё невычитанное), поэтому переоформление редакций не нарушит, наоборот приблизит к оригиналу и снимет кучу рутины с редакторов. (Также я подумываю потом всё же залить всё в индекс. При этом имеющиеся статьи можно будет конвертить в ДО через ранее упоминавшийся сайт-конвертер, и будет полезно, если не надо будет вручную для ДО переписывать эти сокращения.) Списки сокращений как они переделаны в переиздании98 у меня есть, +ТСД/Объяснение сокращений — список всех использовавшихся Далем. --Vladis13 (обсуждение) 20:47, 24 октября 2015 (UTC)
  • Сделал ряд уверенных замен, которые видел сделаны и в ваших редакциях СО ТСД-3, вроде "новг." → "нвг.", «вологод.» → «влгд.», «перм.» → «прм.» и ряд подобных с городами. Другие делать не возьмусь, там вариации доходят до 30%, где так пишется, а где иначе. --Vladis13 (обсуждение) 11:00, 28 октября 2015 (UTC)
  • Неясно, что делать с сокращениями, которые в укороченном далевском варианте не понятны. В частности:"нареч." у Даля "нар.", "обор." - "об.", "союз" - "со.", "сущ." - "сщ.". Менять как в оригинале? --Vladis13 (обсуждение) 11:00, 28 октября 2015 (UTC)



Совмещённый словник[править]

@Dmitrismirnov: Совмещённый словник можно сделать командой: {{:страница со словником}}. При этом в словнике нужный текст надо оградить тэгами <onlyinclude>словник</onlyinclude>, иначе будут включены всякие сторонние шаблоны, посмотрите как.

Например, код:

<div style='columns:3;-moz-columns:3;-webkit-columns:3;'>
{{:Толковый словарь В. Даля/2-е изд./Словник/Ѳ}}
</div>

даст:

Так вы можете вставить словники всех 3-х изданий на одну страницу. --Vladis13 (обсуждение) 17:44, 20 октября 2015 (UTC)

Понял. Сейчас попробую Dmitrismirnov (обсуждение) 19:16, 20 октября 2015 (UTC)
  • По вопросу нужен ли вообще совмещённый словник.
  1. При отдельных словниках надо будет на страницах оглавлений словников указывать 3 словника (для всех 3-х изданий). Каждая ссылка по несколько слов - это лишнее нагромождение на страницах... Хотя можно объединить словники 1-2 изданий, тогда ссылки будет всего две. Отдельные словники чуть менее восприимчивы взглядом, ибо они на разных страницах, но с другой стороны - ничего особо значимого в их разнице нет.
  2. Совмещённый словник будет раздуваться и в итоге сильно тормозить, потребует регулярного прописывания названий новых разделённых словников в шаблоны и скрипт. Ведь ТСД-3 больше ТСД-2 в 6 раз. Т.е. на каждую страницу длинной в 1-2 тыс. строк будет +столько же ТСД-1 +6-12 тыс. строк ТСД-3. Размеры словников неоднозначны, где-то будет больше в 2 раза, а где-то возможно и в 20-30 раз (предположение). --Vladis13 (обсуждение) 23:30, 28 октября 2015 (UTC)
Согласен, что длинные словники лучше не совмещать, а помещать на разных страницах, но что касается коротких, то тут можно сделать исключение из этого правила и поместить их на одной странице. Это удобно и наглядно, легко сравнить, и занимает мало места. Я сделал ТСД/Словник/І в качестве эталона, поместив туда ВСЕ словарные статьи ВСЕХ 3-х изданий (я их реально поместил здесь в викитеке). Мне кажется, что словник красиво выглядит и им удобно пользоваться. Я сделал таким образом, что все ссылки ведут на правильные страницы. Посмотрите пожалуйста, и покритикуйте, если что-то не нравится. Dmitrismirnov (обсуждение) 23:44, 28 октября 2015 (UTC)
Вы хотели совместить только отдельные небольшие страницы? - Это меняет взгляд на ситуацию, ведь страниц таких найдётся мало. В остальном всё симпатично. --Vladis13 (обсуждение) 01:00, 29 октября 2015 (UTC)


Шаблон Статья в словнике ТСД[править]

Начал подключать словники к шапкам. Понял, что шаблон "Статья в словнике ТСД" может быть использован и в других проектах (он отличается от шаблона "Статья в словнике" наличием третьего параметра для имени СО, которое может отличаться от названия ссылки на страницу статьи -- параметра 1). Вообще, потом, надо будет, наверное, и словники других проектов так же переделать, с возможностью указания этого доп. параметра... Поэтому, я хочу убрать ТСД из его названия -- т.е. переименовать шаблон в, скажем, "Статья в словнике3" ("Статья в словнике2" как раз есть, он принимает 2 параметра с именем и отличается по поведению от "Статья в словнике", делался для БСЭ -- поэтому название "Статья в словнике3" как раз хорошо подходит). Именно это название и будет использоваться в словниках ТСД вместо имеющегося сейчас ""Статья в словнике ТСД"". Будут возражения? Hinote (обсуждение) 12:25, 20 октября 2015 (UTC)

"Статья в словнике3" - мне кажется слишком длинно и непонятно о чём. Dmitrismirnov (обсуждение) 13:21, 20 октября 2015 (UTC)
Согласен, я ранее предлагал переименовать покороче, можно просто "словник" почему нет. По теме, например, в ВП есть популярные шаблоны нп1, нп2 ... нп5 (из серии "не переведенная" статья), - отличаются по оформлению, а не по числу параметров. Хотя больше шаблонов с номерами не припомню. Если этим шаблоном в других проектах будут заменяться прежние устаревшие шаблоны, то цифра "номера версии" будет только мешать, проще дать новое название.
Итого, ладно, пока оставлю особое название этого шаблона с ТСД в названии, а потом, когда (и если) дойду до того, что все остальные словники других проектов буду переводить на более общее основание -- тогда все это и сделаю. Когда-нибудь будет один такой шаблон с тем же названием, что и текущий "Статья в словнике" без всяких цифр, но с более общим функционалом, чем текущий, и который будет подходить и к БСЭ, и к ТСД и ко всем другим проектам. Отбой. Hinote (обсуждение) 19:54, 20 октября 2015 (UTC)

Словники 1 и 3 изд.[править]

А можно ли использовать этот шаблон для словников 1-го и 3-го изданий? И каким образом? Dmitrismirnov (обсуждение) 13:20, 20 октября 2015 (UTC)

Можно. Точно таким же образом, как и в словниках 2-го издания. Делаете словник, статьи в нем оформляете этим шаблоном, точно так же, как и в словниках 2-го издания. Hinote (обсуждение) 19:54, 20 октября 2015 (UTC)
Если хотите, дайте ссылку на имеющийся словник, - переконверчу в этот формат. --Vladis13 (обсуждение) 20:07, 20 октября 2015 (UTC)
Но мне непонятно, как эти словники будут указывать на страницы 1-го или 3-го издания... Ну, например, полностью сделаны словники 3-го издания: А, Е и Я. Можете ли их переконвертить в этот формат? Dmitrismirnov (обсуждение) 22:00, 20 октября 2015 (UTC)
Можно. Вопросы: 1) Куда сохранить результат, перезаписать эти страницы словников, или на новых? 2) Сохранять ли ударения?
3) Как отображать перенаправления? Пример:

# [Абы́съ]Абы́зъ / [Абы́с]Абы́з

конвертить так:

# [Абы́съ] / Абыс Абы́зъ / Абыз

Получается двойной шаблон, не громоздко? --Vladis13 (обсуждение) 22:33, 20 октября 2015 (UTC)
Можно убрать перенаправления и квадратные скобки. Ударения хотелось бы сохранить (если нетрудно), но если трудно можно все эти наслоения убрать, если мешают. И тогда:

# [Абы́съ]Абы́зъ / [Абы́с]Абы́з

конвертить так:

# Абысъ / Абыс

Но не уничтожайте пока оригинал. Его мы потом архивируем на всякий случай. Dmitrismirnov (обсуждение) 22:49, 20 октября 2015 (UTC)
Ок. Это всё нетрудно, вопрос оформления. Сделаю. --Vladis13 (обсуждение) 23:02, 20 октября 2015 (UTC)
Когда сделаете, поместите, пожалуйста, старый вариант в архив проекта. Спасибо. Скажите, как к Вам лучше обращаться? Вас Владислав зовут? Dmitrismirnov (обсуждение) 23:11, 20 октября 2015 (UTC)

Влад! Забыл Вам сказать. Возьмите за пример ТСД/Словник/Ѣ. Полустраницы в 3-ем издании следует игнорировать, не уточнять, разделяя на левую и правую колонки. То есть, первая страница 1-2, вторая 3-4, третья 5-6 и т. д. Dmitrismirnov (обсуждение) 00:23, 21 октября 2015 (UTC)

  • Пока отложил конвертацию. 1) Там надо делать ссылки на индекс ТСД-3, для этого сначала высчитать в томах смещение страниц книги относительно скана. 1-2 том залиты частями. Чтобы не городить в скриптах лишнего кода со смещением для каждой части, пока задачу по конвертации отложим. Если Андрей их перезальёт, то проблема решится, а труд по кодированию будет лишним.
2) Надо разобраться с перенаправлениями в словнике. Как я понимаю, они будут мешать скрипту, который использует следующие ссылки для навигации, а здесь это перенаправления. Есть и такие сложные конструкции:

# [Анады́съ]Надысь, Намедни,Аландась / [Анады́с]Надысь, Намедни, Аландась
# [Анаме́дни]НамедниАландысь / [Анаме́дни]НамедниАландысь

--Vladis13 (обсуждение) 15:02, 21 октября 2015 (UTC)
Да, я говорил уже, все перенаправления надо убрать. Dmitrismirnov (обсуждение) 15:28, 21 октября 2015 (UTC) Андрей (@Hinote:) обещал перезалить. Что ж, будем ждать!... Dmitrismirnov (обсуждение) 15:31, 21 октября 2015 (UTC)

Загрузка целых томов ТСД-3[править]

Я сделал djvu для 1-го и 2-го томов, но что-то на commons они у меня не заливаются через визард, причем upload нормально проходит (т.е. дело не в размере), а на финальных стадиях -- ошибка... Hinote (обсуждение) 17:45, 21 октября 2015 (UTC)
Если визард - это главная страница загрузки, она у них глючная. Попробуйте через старую форму. --Vladis13 (обсуждение) 17:55, 21 октября 2015 (UTC)
Через форму загрузки лимит 100Мб, хотя написано 1000. Насчёт ошибки визарда (который вроде позволяет загружать больше частьями) отписался на форум и разработчику гаджета. Моё сообщение там не единственное, эта ошибка как минимум ещё в июле была. --Vladis13 (обсуждение) 20:20, 22 октября 2015 (UTC)
Все хуже и глубже. [4] Hinote (обсуждение) 20:57, 22 октября 2015 (UTC)
Теперь получилось зааплоадить полный файл для тома 1, может и для 2-го тома так же сделать? (Не новый файл, а тот же (часть 1, нужно будет переименовать), но с полным набором страниц) Hinote (обсуждение) 22:15, 22 октября 2015 (UTC)
Перезакачал 2 том. Кстати, в конце 1-го тома нехватает страниц, это объясняет ту проблему #Страница:Dal-3 I 1743-1744.jpg/1. Непонятно откуда взяты недостающие страницы. Можно ли их в залитый скан всунуть? --Vladis13 (обсуждение) 23:26, 22 октября 2015 (UTC)
Недостающих страниц нигде не было на интернете. Большую часть из них я сам сканировал с бумажного издания. Они находятся здесь. Викитека:Проект:ТСД#Сканы 3 издания Dmitrismirnov (обсуждение) 23:50, 22 октября 2015 (UTC)
Да, конечно, надо и отсутствующие страницы туда добавить. (jpg->djvu: утилита convert из ImageMagick, сборка djvu из частей: утилита djvm) Hinote (обсуждение) 23:35, 22 октября 2015 (UTC)
В полях примечания и содержания - откуда взяты и ссылки. У меня этих утилит нету, незнаю есть ли они для Windows, и не уверен что у меня закачка 1-го тома заработала. Может сделаете? --Vladis13 (обсуждение) 23:51, 22 октября 2015 (UTC)
Да, спасибо, что напомнили. Hinote (обсуждение) 00:10, 23 октября 2015 (UTC)

Итого, по сборке единого первого тома. Дмитрий (а может и Влад) -- есть вот такие отдельные сканы. В каком порядке их надо собрать в единый djvu? Все 3 части из djvu с частями 1-го тома -- понятно. Далее, отдельные сканы со столбцами 1725—1744 -- понятно. Далее 6 страниц из pdf "Сокращения" -- так? А "приложение", "предварительные объяснения", которые есть в этой категории -- куда их? P.S. Еще есть отдельный скан столбцов 739—740, надо его не забыть вставить в нужное место, так? Но это понятно, куда... А отдельные сканы для XIII-XIV страниц пояснений -- они же и так есть в djvu. Дмитрий -- вы их просто пересканировали для лучшего качества, так? Титул -- пока не понял, есть он в djvu или нет. Надо тоже добавить в начало? Hinote (обсуждение) 22:54, 23 октября 2015 (UTC)

739-740 отсутствует в индексе, 738 потом 741. --Vladis13 (обсуждение) 00:19, 24 октября 2015 (UTC)

Порядок такой:

1) Титул и оборот титула
2) I-XIV страницы, включая:
От издателей (I-III)
Предисловие к 1 выпуску (IV-XI)
пустая страница (XII)
Предварительные объяснения (XIII-XIV)
3) Словарь с. 1-1744
4) Объяснение сокращений (I-IV)

Файл:ТСД-3 Оборот титула.jpg
ТСД-3 Оборот титула
Приложение О РУССКОМ СЛОВАРЕ (доклад Даля 1860 года) в современной орфографии (I-X) помещено в более современной перепечатке Словаря.

Можно его приплюсовать с самом конце, если хотите. Но это не обязательно. Dmitrismirnov (обсуждение) 00:09, 24 октября 2015 (UTC)

1) Титул -- это вот этот? Скана оборота титула не вижу. 2) По составу и