Обсуждение Викитеки:Проект:ТСД/Архив/5

Содержимое страницы недоступно на других языках.
Материал из Викитеки — свободной библиотеки

Архив 2018

Эта страница содержит завершившееся обсуждение. Не изменяйте её. Новое обсуждение можно создать на другой странице.


Пустая страница. Ratte (обсуждение) 12:14, 12 марта 2018 (UTC)[ответить]

  Просто название статьи не соответствовало секции индекса. --Vladis13 (обсуждение) 13:03, 12 марта 2018 (UTC)[ответить]

ТСД2/Убаюкать — то же самое. Ratte (обсуждение) 13:17, 12 марта 2018 (UTC)[ответить]

ТСД2/У. Ratte (обсуждение) 13:20, 12 марта 2018 (UTC)[ответить]

Список. Примерно 200 статей. --Vladis13 (обсуждение) 09:14, 18 марта 2018 (UTC)[ответить]
Это произошло из-за разделения статей на три издания. Я исправил в словнике удалил ненужные перенаправления. --Dmitrismirnov (обсуждение) 13:29, 18 марта 2018 (UTC)[ответить]
ТСД3/Залудить, залуживать, ТСД3/Залудить, залуживать/ДО — пустые страницы, нет в списке. Ratte (обсуждение) 15:32, 18 марта 2018 (UTC)[ответить]
Список выше. Сейчас ещё обновлю, просто скан всех ТСД занимает целый день, даже при асинхронных запросах html. --Vladis13 (обсуждение) 16:24, 18 марта 2018 (UTC)[ответить]
Обновил список. Ошибок много. --Vladis13 (обсуждение) 22:05, 18 марта 2018 (UTC)[ответить]
  Перепроверил, таких ошибок больше не нашёл. --Vladis13 (обсуждение) 17:54, 27 марта 2018 (UTC)[ответить]

Что это за ссылка «ТСД» в шапке? Должны быть ведь только ТСД1 и ТСД3? В ТСД3/Вулкан то же самое. Ratte (обсуждение) 22:58, 23 марта 2018 (UTC)[ответить]

Мне тоже кажется эта ссылка ненужной. --Dmitrismirnov (обсуждение) 23:35, 23 марта 2018 (UTC)[ответить]
 почистил [1]. --Vladis13 (обсуждение) 11:48, 24 марта 2018 (UTC)[ответить]
@Lozman Возможно ли настроить модуль так, чтобы в ВД в свойстве "описывается в источниках" можно было указывать просто общее ТСД, без уточнения издания, а из списка квалификаторов уже брался список изданий и делались ссылки в шапке. Пример: ТСД2/Пар в шапке показывается "ТСД", хотя желателен "ТСД2", d:Q255722. Теоретически, таким фокусом можно было бы сократить списки в викиданных и для других произведений, чтобы не указывать для каждого переиздания отдельное свойство. --Vladis13 (обсуждение) 12:13, 24 марта 2018 (UTC)[ответить]
Теоретически да, но за это отвечает Модуль:Другие источники, к созданию которого я непричастен, поэтому как это реализовать практически, у меня идей пока нет. Скорее всего, для префикса ТСД придется сделать какую-то промежуточную функцию, которая будет вычислять реальные префиксы и дальше запускать основную процедуру уже с ними. — Lozman (talk) 15:46, 24 марта 2018 (UTC)[ответить]
@Sergey kudryavtsev посмотрите? --Vladis13 (обсуждение) 16:46, 24 марта 2018 (UTC)[ответить]
Вроде бы сделал. -- Sergey kudryavtsev (обсуждение) 04:25, 26 марта 2018 (UTC)[ответить]
Спасибо! --Vladis13 (обсуждение) 13:36, 26 марта 2018 (UTC)[ответить]
PS: Небольшое замечание - ТСД2/Пар помещается в Категория:Викитека:Ссылка из Викиданных:ТСД (а не в Категория:Викитека:Ссылка из Викиданных:ТСД2) в силу того, что описывается в источниках (P1343) = Толковый словарь В. Даля (Q1970746) в пар (Q255722). -- Sergey kudryavtsev (обсуждение) 04:36, 26 марта 2018 (UTC)[ответить]
Таких категорий сейчас там нет. --Vladis13 (обсуждение) 13:36, 26 марта 2018 (UTC)[ответить]
PS2: Ещё просьба — вместо параметра ТСД= использовать конкретный: ТСД1=, ТСД2= или ТСД3=. Когда указано ТСД=, Модуль:Другие источники не может догадаться, какое из изданий имеется ввиду, и даёт ссылку на перенаправление. -- Sergey kudryavtsev (обсуждение) 08:14, 26 марта 2018 (UTC)[ответить]

Параметр СЕКЦИЯ[править]

также как и |СЕКЦИЯ= --Dmitrismirnov (обсуждение) 09:29, 24 марта 2018 (UTC)[ответить]
Значение параметра указано в ~1100 статьях. В ~330 статьях значение отличается от названия статьи, убирать ботом нельзя (там надо переименовывать статью или секцию). В остальных значение можно очистить, если мешается. --Vladis13 (обсуждение) 12:28, 24 марта 2018 (UTC)[ответить]
Очистил значение параметра где совпадает с именем страницы. --Vladis13 (обсуждение) 16:33, 24 марта 2018 (UTC)[ответить]
Почти все статьи-невидимки 2-го издания на букву "И" (а их было больше сотни) появились из-за введения параметра |СЕКЦИЯ= Я уже убрал и подчистил около половины из них. Понятно, что делать это можно только вручную. --Dmitrismirnov (обсуждение) 13:15, 24 марта 2018 (UTC)[ответить]

Просьба[править]

Влад, нельзя ли в шапке перед началом колонтитула каждой страницы всей работы (там где этого нет) проставить ботом <div class="oldspell"> ??? Это ускорит мою работу --Dmitrismirnov (обсуждение) 06:31, 26 апреля 2018 (UTC)[ответить]

Этот класс думали вообще удалять. Викитека:Форум#class «indent» в индексе. Хотелось бы иметь по нему определённое решение. --Vladis13 (обсуждение) 12:32, 26 апреля 2018 (UTC)[ответить]
Не понимаю, зачем удалять? Все шрифты тогда поменяются. Будет неудобно, некрасиво и несоответственно оригиналу. --Dmitrismirnov (обсуждение) 13:02, 26 апреля 2018 (UTC)[ответить]
А зачем он? У меня в теме оформления Monobook он выглядит мелко, а учитывая что ниже в секциях «Тот же текст в современной орфографии» он ещё больше уменшается, то там без лупы не прочесть. А где-то несколько таких секций на странице, уменьшается так что прочесть невозможно. Кроме того, этот шрифт не показывается в основном пространстве. О соответствии оригиналу тоже говорить не приходится, он не идентичен типографскому. Разве что засечки есть. Не говоря про то, что вообще сканы отличаются от формата ВТ — текст без колонок, сноски цифрами [2], а не звёздочками, в сканах нет секций «Тот же текст в современной орфографии», не говоря про шаблоны которые у нас там везде, нет разделов «примечания»… Ну сами понимаете, идентичность скану невозможна, это же не репринт. Напишите лучше на форуме, на случай если там будет решение. --Vladis13 (обсуждение) 14:34, 26 апреля 2018 (UTC)[ответить]
Не знаю. Я к нему привык и не представляю как можно работать без него. Я бы попросил его оставить. --Dmitrismirnov (обсуждение) 14:43, 26 апреля 2018 (UTC)[ответить]
 Сделано --Vladis13 (обсуждение) 11:54, 7 июня 2018 (UTC)[ответить]

Перезалить ТСД2?[править]

@Dmitrismirnov может перезалить ТСД2?.. На classes.ru выложен словарь с ударениями, с жирным и курсивным шрифтом! Пример: векша, для сравнения ТСД2/Векша. При заливке сюда, к сожалению, этот сайт с самого начала был не найден, а позже не хотелось терять массу труда, уже вложенного в имеющиюся заливку. Как видно по примеру, там отличается ряд служебных слов («вологодск.» вместо «влгд.»), и первые слова — заглавными. Заглавные заменить просто, служебные — опять придётся повозится с составлением их списков для замены.

  • Это замена СО. Менять надо будет секции, где названия статей на сайте == названиям секций у нас. Понятно, что часть названий не будет совпадать, т. е. не будет перезалита. (Можно будет сделать их отдельным списком для дальнейшей проработки.)
  • Если менять, то только на невычитаных страницах. (Например, на странице «векши» не ступала нога человека.)
  • Сложнее ситуация со страницами, где вычитаны отдельные секции. После некоторых вычитанных секций, у нас стоят шаблоны {{tq}}, но не у всех. Где-то секции предваряются строчкой «проверено», но там не формализовано, т.ч. может по этой строке лучше не ориентироваться. Т. е. если после секции стоит {{tq}}, то их не перезаливать.
  • Для замены ДО надо будет либо скриптом СО→ДО конвертировать, либо вручную. Но у ТСД2 и так версии ДО без оформления и ботом сконвертированы. ДО тогда лучше и не трогать, его секции могут быть уже вычитаны.

Такое массовое обновление сделало бы ТСД2 реально пригодным к использованию. Сейчас же основную массу статей, без оформления, сложно назвать приличной. Что думаете? --Vladis13 (обсуждение) 09:15, 7 апреля 2018 (UTC)[ответить]

  • Может быть. Страниц, куда мы с Вами не вступали, достаточно много. Хотя я не знаю насколько аккуратным является текст www.classes.ru. Хорошо бы это проверить прежде, чем производить такую основательную работу. --Dmitrismirnov (обсуждение) 09:44, 7 апреля 2018 (UTC)[ответить]
  • Я сверил статью "Векша" с оригиналом. Аккуратность где-то на уровне 80-90%. Кроме «вологодск.» вместо «влгд.», что Вы уже заметили, там написано «никольского» вместо «никольск.» «Олон.» вместо «Ол.», к тому же, все служебные слова, которые в оригинале написаны петитом (а их около десяти в статье) написаны тем же крупным шрифтом, что и остальное. То есть, работать с этим текстом ещё надо порядочно. Конечно это лучше, чем то, что мы имеем, но всё же это промежуточный вариант. Так что решайте сами, стоит ли игра свеч. --Dmitrismirnov (обсуждение) 10:31, 7 апреля 2018 (UTC)[ответить]
  • Спасибо, что напомнили. Скан ТСД1 распознал быстро, но нужен был список служебных слов, эти сокращения не распознавались, а без них заливать слишком много мусора. Как раз их список и для ТСД2 нужен. --Vladis13 (обсуждение) 18:07, 7 апреля 2018 (UTC)[ответить]
  • @Dmitrismirnov перезалил. Перезалитым статья добавил в тег секции атрибут «reposted», вроде <section begin="Статья+" reposted />. Дальнейшие правки буду делать в таких секциях, т.ч. если будете их вычитывать, то пожалуйста уберайте этот атрибут, чтобы бот не переправлял. (Как поправлю что можно, потом этот атрибут везде уберу.) Поправлять там буду служебные слова — формализовать как принято и обёртывать в теги <small></small>. Ещё там где секции были разделены переносами на несколько страниц, первая секция могла перезаписаться полной неразделённой статьёй, это можно увидеть по Списку наблюдения — где правки бота с заметным увеличением размера страницы (на десятки килобайт). Секции в которых был {{перенос}} я учёл и постараюсь их поправить. Но этот шаблон был не во всех страницах с переносом, т.ч. надо посмотреть по Списку наблюдения. --Vladis13 (обсуждение) 22:58, 17 апреля 2018 (UTC)[ответить]
Все правки бота, которые являются текущими версиями страниц. Правки, которые уменьшили размер страницы — их надо посмотреть, и вероятно отменить. Эти статьи видимо были частично вычитаны. --Vladis13 (обсуждение) 23:12, 17 апреля 2018 (UTC)[ответить]
Спасибо! --Dmitrismirnov (обсуждение) 05:28, 18 апреля 2018 (UTC)[ответить]

Этот шаблон делался для ТСД-2. Привязан к названию страницы, беря из него номера страницы скана и тома, и от них высчитывает номера страниц книги, прибавляя смещение. Вы добавили его на страницу ТСД-1, поэтому не может получить данные и выдаёт ошибку.

Если шаблон понравился, можно будет адаптировать его для ТСД-1 и ТСД-3, но пока есть приоритетные проблемы. --Vladis13 (обсуждение) 11:55, 24 октября 2016 (UTC)[ответить]

Понятно. Подожду. --Dmitrismirnov (обсуждение) 13:19, 24 октября 2016 (UTC)[ответить]
А какой вариант вы хотите?
  • Чтобы он отображал именно 2-е издание (как сейчас), даже если размещён на индексных страницах 1 и 3 изданий?
  • Или чтобы выводил списки из словников 1 и 3 изданий? В этом случае необходима вычитка страниц словников этих изданий, и простановка в словниках тэга <section begin=""/><section end=""/>, ибо шаблон по сути выводит секции словника. --Vladis13 (обсуждение) 11:42, 28 октября 2016 (UTC)[ответить]
 . --Vladis13 (обсуждение) 20:26, 22 августа 2018 (UTC)[ответить]

Чистка частичной перезаливки ТСД2[править]

Почистил в списке правки с размером изменений <100 б и >2.5 кб. Ещё сделал полный список страниц с переносами секций Викитека:Проект:ТСД/Страницы с переносом секций. В нём тоже часть проверил, проверенные из списка убрал. Как допроверю, буду уже править текст. --Vladis13 (обсуждение) 00:10, 20 апреля 2018 (UTC)[ответить]
Вернул проверенные секции на страницах где стояло слово «проверенно:».
Оформил служебные слова. Пожалуй больше ботом поправлять нечего. Можно сконвертировать перезалитые секции в ДО, обновив текущие. @Dmitrismirnov как думаете, есть ли какие-то предложения? --Vladis13 (обсуждение) 18:41, 22 апреля 2018 (UTC)[ответить]
Не знаю, можно ли использовать бот, или можно только вручную выверить все словники. Ошибки в них нахожу и исправляю почти каждый день. Очень много слов записаны с ошибками и помещены в неправильном порядке. Особенно это касается слов, в которых встречаются устаревшие буквы, например "яти" которые часто путаются с буквой "е" и т. п. Это желательно сделать в первую очередь. --Dmitrismirnov (обсуждение) 21:09, 22 апреля 2018 (UTC)[ответить]
Не, в данном случае речь про перезалитые секции ТСД2-СО. Я предлагаю обновить ими секции ДО, размещённые на тех же страницах. (Поэтому проблем с переносами секций не будет.) Переконвертировав тем же скриптом, которым делались текущие секции в ДО. Мне кажется, новый текст гораздо лучше, посмотрю ещё несколько дней, и наверно обновлю таки.
Касательно вычитки словников. Да это проблема. Были бы у меня деньги, давно бы нанял школьников (буквально за копейки) на биржах текстов. Человек 10 нанять бы, за неделю бы вычитали. --Vladis13 (обсуждение) 22:54, 22 апреля 2018 (UTC)[ответить]
  Перезалил секции ДО, для перезалитых секций СО. Также помечены атрибутом reposted в теге section. --Vladis13 (обсуждение) 03:09, 20 мая 2018 (UTC)[ответить]

Ещё ошибка[править]

Здесь какая-то ошибка. Не пойму в чём дело: ТСД2/Напаивать. {{R|Ошибка Lua в Модуль:ТСД на строке 47: attempt to perform arithmetic on global 'ps' (a nil value).}} --Dmitrismirnov (обсуждение) 11:09, 31 июля 2018 (UTC)[ответить]

Была опечатка в названии секции в закрывающем теге (пропущен «+»). Поэтому секция не закрывалась, и тащила в ОП текст до конца страницы. --Vladis13 (обсуждение) 14:10, 31 июля 2018 (UTC)[ответить]
Спасибо! --Dmitrismirnov (обсуждение) 15:44, 31 июля 2018 (UTC)[ответить]

Не могу понять причины...[править]

...почему многие тексты на букву И в ТСД3 (ТСД3/Ибис, ТСД3/Ибис/ДО, ТСД3/Иззвонить, ТСД3/Иззвонить/ДО, ТСД3/Иссера ТСД3/Иссера/ДО, и т. д.) не отражаются в статьях. --Dmitrismirnov (обсуждение) 09:28, 12 ноября 2018 (UTC)[ответить]

Исправил. Это делалось обновление модуля. Спасибо что заметили. --Vladis13 (обсуждение) 12:11, 12 ноября 2018 (UTC)[ответить]

В текущей версии (вкладка вверху справа) статья представляет собой красную ссылку ТСД2/Басенка. Возможно, и другие такие статьи есть. Ratte (обсуждение) 20:27, 15 февраля 2019 (UTC)[ответить]

Опечатка, исправил. --Vladis13 (обсуждение) 21:03, 15 февраля 2019 (UTC)[ответить]

Заливка OCR ТСД1[править]

@Dmitrismirnov распознаётся так: скриншот (слева скан, справа OCR). По-моему, качество распознавания мусор. Стоить ли заливать? Может лучше скопировать статьи из ТСД2? Тем более, что они, в основном, теперь оформлены и с ударениями. Особенно, если обновить ДО. Как считаете? --Vladis13 (обсуждение) 00:30, 24 апреля 2018 (UTC)[ответить]

Трудно сказать, хотя может быть Вы и правы. Качество так себе... но это всё-же лучше, чем то, что у нас есть - хотя бы порядок соответствующий - там ведь все слова из правой и левой колонок были вперемежку... В общем, это на Ваше усмотрение. --Dmitrismirnov (обсуждение) 07:05, 24 апреля 2018 (UTC)[ответить]
Мне кажется, лучше из ТСД2, они почти идентичны. Но тогда нужен готовый словник ТСД1, для разметки на какие страницы какие статейные секции заливать. --Vladis13 (обсуждение) 07:53, 24 апреля 2018 (UTC)[ответить]
С буквой "А" закончено - статьи всех трёх изданий выложены и проверены. Словник ТСД1 для буквы "Б" практически готов. Можно заливать. --Dmitrismirnov (обсуждение) 22:49, 24 апреля 2018 (UTC)[ответить]
Хорошо. Возможно было бы достаточно вычитать только первые слова для каждой страницы, чтобы залить постранично. Так делали со словниками и заливкой ТСД2. Полная вичитка это слишком долго, за год для ТСД2 так и не сделана. --Vladis13 (обсуждение) 23:12, 24 апреля 2018 (UTC)[ответить]
Словник ТСД1 для буквы "В" готов. --Dmitrismirnov (обсуждение) 09:44, 1 мая 2018 (UTC)[ответить]
Словники для первого тома (А-З) ТСД1 готовы. К сожалению сейчас у меня очень мало свободного времени, и не могу этому серьёзно уделять внимание. Нужна помощь для завершению словника остальных томов. --Dmitrismirnov (обсуждение) 15:58, 7 июня 2018 (UTC)[ответить]
У меня тоже завал, к сожалению, два месяца занят уже. Позже попробую найти время открыть на http://forumok.com задание по вычитке словника. Я предупрежу вас, потому что надо будет контролировать результаты, чтобы исполнители не халтурили. --Vladis13 (обсуждение) 17:42, 9 июня 2018 (UTC)[ответить]
Точней, сначала надо открыть задание только на разметку по страницам, чтобы залить OCR. А по вычитке может отдельно потом. Ибо работникам надо будет пояснять как установить ДО-раскладку на их ПК, что резко снизит число желающих. Ну и будут тормозить и путаться с ДО-буквами, сложно будет массово проверять. --Vladis13 (обсуждение) 17:49, 9 июня 2018 (UTC)[ответить]

@Dmitrismirnov я заметил, что Вы закончили вычитку словников ТСД1? Безусловно, огромный труд!…
Тогда мне готовится к заливке в индекс ТСД1 статей из ТСД2?
У вас в ТСД1 уже закинуты списки ссылок на статьи ТСД2. Их оставить или удалить? И также много где есть сырой OCR. (пример, другой) Ещё кое-где есть страницы, уже вычитанные частично или полностью (пример). Полностью вычитанные я буду пропускать. А как с остальными? Лучше будет заливать, выше этого имеющего там текста, или под ним? --Vladis13 (обсуждение) 18:09, 28 октября 2018 (UT

Еще не полностью готовы буквы С и Т. Займусь в ближайшее время. Я думаю, что "списки ссылок на статьи ТСД2" лучше пока не удалять -- они могут быть полезны, и порядок слов в них точно соответствует словнику ТСД1. Сырой OCR вряд ли понадобится. Его можно удалить. Заливать наверное лучше под имеющимся текстом -- так нагляднее, хотя можно и выше него -- это не принципиально. Делайте так как Вам удобнее. --Dmitrismirnov (обсуждение) 20:12, 29 октября 2018 (UTC)[ответить]

И остальные страницы ТСД в Категория:Страницы с ошибками скриптов. Плюс пустые страницы — ТСД2/Долина, ТСД2/ЛёнRatte (обсуждение) 16:21, 25 августа 2018 (UTC)[ответить]

Ошибка Lua в словнике[править]

Здесь какая-то ошибка. Не пойму в чём дело:

Страница:Толковый словарь Даля (1-е издание). Часть 2 (1865).pdf/32

1.    И(з)строга / Исстрога      Ошибка Lua: Unmatched open-paren at pattern character 1.|658

2.    И(з)строгать / Исстрогать --Dmitrismirnov (обсуждение) 22:35, 9 июня 2018 (UTC)[ответить]

В статье не показывается содержимое соотв. "section"[править]

Частично вычитав страничку ТСД-3, запилил статью про одно матерное слово, но текст там не показывается. ЧяДНТ? Ain92 (обсуждение) 22:44, 5 января 2019 (UTC)[ответить]

@Dmitrismirnov Дмитрий, напомните пожалуйста, нужна ли эта категория? Помнится вы говорили, что не видите смысла в пометке многозначных статей, поскольку почти каждый термин многозначный. --Vladis13 (обсуждение) 01:34, 12 мая 2019 (UTC)[ответить]

Это верно, я и забыл об этом. Можно было бы её убрать. --Dmitrismirnov (обсуждение) 15:16, 12 мая 2019 (UTC)[ответить]