Обсуждение Викитеки:Проект:ТСД

Материал из Викитеки — свободной библиотеки
Перейти к навигации Перейти к поиску
Проект:ТСДОбсуждение проектаНовости проектаШаблоны:ТСДКатегория:Толковый словарь В. ДаляСловникТолковый словарь В. Даля
Архив
Архив обсуждений:
Последнее изменение страницы:
13.09.2018.

Пожалуйста, добавляйте новые темы снизу.

План разделения страниц на статьи по изданиями[править]

Викитека:Форум#Разделение изданий словаря Даля

  • ✔ Переименование страниц, на которых выложено только одно издание в подстраницу данного издания. Например: ТСД/СловоТСД2/Слово. На прежнем месте остается перенаправление. Таких страниц основная масса, несколько десятков тысяч. (Текущие счётчики, показывающие что в категории ТСД3 — 30тыс. статей сбиты, из-за текущего формата «3 в 1», см. форум.
    На прежнем месте можно будет оставить перенаправление на ТСД2, как более комплексные статьи, включающие подстраницы из ТСД3 (статьи которого в основном является разделением статей ТСД2). +В Википедии основная масса ссылок оформлена на ТСД2.
  • ✔ Смена шаблона-шапки (на основе Модуль:ТСД, Модуль:Header, {{Отексте}}) на Модуль:Отексте. Статьи в подпространствах изданий («ТСД1/», «ТСД2/», «ТСД3/») сразу будут работать на этом шаблоне-модуле.
  • ✔ Пока просто добавить в шапки параметры {{tom}}, об аналогах статьи в других изданиях, с перечислениями больше чем 1 статья для одного издания (таких сравнительно немного).
    • Оформить и обработать.

Дополнительно:

  • ✔ Перенаправление шаблонов ТСД2 в ВП и Викисловаре на новые подстраницы.
  • ✔ Чистка от шаблона {{tsdbr}}. Это ссылка снизу страниц на словники. Создавался из-за большой длины совмещённых страниц, на при их разделении не нужен.
  • ✔ Чистка всех статей от тэга <pages>, с перемещением его автоподстановки в шапку. Все данные для его заполнения уже есть в словнике. Очень заморочно и является пустой тратой времени вводить его в каждой статье. Т.ч. для создания новых статей достаточно будет добавить только шапку, все остальное подхватится из словника. (Надо добавить в шапку параметр для названия секции, ибо иногда оно отличаются от названия статьи.) --Vladis13 (обсуждение) 08:36, 11 августа 2017 (UTC)
    • (сделано, требуется повторная проверка) Некоторые страницы содержат два и более тэгов «pages», но в словнике/шаблоне может указываться только одна секция. Поэтому статьи надо обернуть в одну секцию.
    • ✔ В словниках ряд статейных ссылок — это перенаправления, статьи надо переименовать. Иначе данные и текст статей могут не подгружаться.
    • Категория:Страница в оглавлении не найдена — статьи-потеряшки. В основном: а) просто пометки «статьи, отсутствующие в издании», для которых при разделении создались отдельные страницы; б) рассогласования названий страниц с указанными в словниках (поэтому не находятся), для ТСД2 может быть много редиректов, ибо страницы называли по ТСД3; 3) под названием ТСД2 там много мусора, это ошибочные дубли статей из ТСД3 (созданные скриптом при разделении), их потом надо будет удалить.
    • Перепроверить всё на незагруженные секции (страницы без текста). Такое возможно из-за каких-то глюков, что названия секции или пагинация некорректны. В основном встречается у статей-омонимов, которые были объединены на одной странице, но старый (отдельные нумерованные страницы) и новый вариант (без номера) страниц остались в словниках и категориях (см. выше статьи-потеряшки), поэтому бот редактировал страницы два раза, отсюда сбой.
  • Почистить от пустых разделов «Примечания» и «примечания ВТ». --Vladis13 (обсуждение) 15:27, 21 октября 2017 (UTC)

Заливка OCR ТСД1[править]

@Dmitrismirnov: распознаётся так: скриншот (слева скан, справа OCR). По-моему, качество распознавания мусор. Стоить ли заливать? Может лучше скопировать статьи из ТСД2? Тем более, что они, в основном, теперь оформлены и с ударениями. Особенно, если обновить ДО. Как считаете? --Vladis13 (обсуждение) 00:30, 24 апреля 2018 (UTC)

Трудно сказать, хотя может быть Вы и правы. Качество так себе... но это всё-же лучше, чем то, что у нас есть - хотя бы порядок соответствующий - там ведь все слова из правой и левой колонок были вперемежку... В общем, это на Ваше усмотрение. --Dmitrismirnov (обсуждение) 07:05, 24 апреля 2018 (UTC)
Мне кажется, лучше из ТСД2, они почти идентичны. Но тогда нужен готовый словник ТСД1, для разметки на какие страницы какие статейные секции заливать. --Vladis13 (обсуждение) 07:53, 24 апреля 2018 (UTC)
С буквой "А" закончено - статьи всех трёх изданий выложены и проверены. Словник ТСД1 для буквы "Б" практически готов. Можно заливать. --Dmitrismirnov (обсуждение) 22:49, 24 апреля 2018 (UTC)
Хорошо. Возможно было бы достаточно вычитать только первые слова для каждой страницы, чтобы залить постранично. Так делали со словниками и заливкой ТСД2. Полная вичитка это слишком долго, за год для ТСД2 так и не сделана. --Vladis13 (обсуждение) 23:12, 24 апреля 2018 (UTC)
Словник ТСД1 для буквы "В" готов. --Dmitrismirnov (обсуждение) 09:44, 1 мая 2018 (UTC)
Словники для первого тома (А-З) ТСД1 готовы. К сожалению сейчас у меня очень мало свободного времени, и не могу этому серьёзно уделять внимание. Нужна помощь для завершению словника остальных томов. --Dmitrismirnov (обсуждение) 15:58, 7 июня 2018 (UTC)
У меня тоже завал, к сожалению, два месяца занят уже. Позже попробую найти время открыть на http://forumok.com задание по вычитке словника. Я предупрежу вас, потому что надо будет контролировать результаты, чтобы исполнители не халтурили. --Vladis13 (обсуждение) 17:42, 9 июня 2018 (UTC)
Точней, сначала надо открыть задание только на разметку по страницам, чтобы залить OCR. А по вычитке может отдельно потом. Ибо работникам надо будет пояснять как установить ДО-раскладку на их ПК, что резко снизит число желающих. Ну и будут тормозить и путаться с ДО-буквами, сложно будет массово проверять. --Vladis13 (обсуждение) 17:49, 9 июня 2018 (UTC)

ТСД2/Долина/ДО[править]

И остальные страницы ТСД в Категория:Страницы с ошибками скриптов. Плюс пустые страницы — ТСД2/Долина, ТСД2/ЛёнRatte (обсуждение) 16:21, 25 августа 2018 (UTC)

Ошибка Lua в словнике[править]

Здесь какая-то ошибка. Не пойму в чём дело:

Страница:Толковый словарь Даля (1-е издание). Часть 2 (1865).pdf/32

1.    И(з)строга / Исстрога      Ошибка Lua: Unmatched open-paren at pattern character 1.|658

2.    И(з)строгать / Исстрогать --Dmitrismirnov (обсуждение) 22:35, 9 июня 2018 (UTC)

  • В слове скобка '()', и там в {{tsdl}} 3-й параметр посылающий слово в функцию расчёта номера страницы по слову. Надо убрать скобку, или добавить их поддержку. --Vladis13 (обсуждение) 02:33, 10 июня 2018 (UTC)
    • Пришлось убрать скобку, хотя это неправильно... Что такое "добавить их поддержку" - я не понимаю... --Dmitrismirnov (обсуждение) 06:19, 10 июня 2018 (UTC)
      • Я пока тоже... Там надо полностью переписать Lua-функции старого модуля, ввиду того что теперь есть Модуль:Отексте/ТСД1. Надо найти время на это. --Vladis13 (обсуждение) 07:30, 10 июня 2018 (UTC)