Обсуждение:Реальный словарь классических древностей

Материал из Викитеки — свободной библиотеки
Перейти к навигации Перейти к поиску

Словник[править]

Ой, а что это за два словника по разным алфавитам? Разве не должен быть один словник: 1) порядок слов в котором соответствует оригиналу, 2) с номерами страниц издания напротив каждого слова, 3) разделенный на части во избежание медленной загрузки словника? — в общем, как здесь принято. Ratte (обсуждение) 20:24, 23 мая 2017 (UTC)

Думаю, в данном особом случае (поскольку все заглавные слова иноязычные) не только можно, но и необходимо — для поиска статей не только по оригинальным, но и по русским названиям. Это не составит проблемы, если шапку сделать не на основе шаблона Отексте, а на основе одноименного модуля, который уже более-менее готов. Дополнительная навигация (по второму словнику) делается аналогично шаблону Sub-nav. Порядок слов в первом словнике, разумеется, должен соответствовать оригиналу (если второй словник делается из русского индекса в приложении — должен соответствовать этому индексу). Также важно, чтобы источнику соответствовали названия статей, иначе получается невообразимое изнасилование источника, и фактически ОРИСС. Русские названия лучше делать перенаправлениями, а не наоборот; особенно учитывая, что для некоторых названий устоявшихся русских аналогов не имеется, а у некоторых их более одного. — Lozman (talk) 00:27, 24 мая 2017 (UTC)
Было бы замечательно иметь улучшенный механизм сортировки. Чем вычитывать один словник, и одновременно вручную следить за его синхронизацией со вторым словником с другим порядком слов. А как сделать шапку «не на основе шаблона Отексте, а на основе Модуль:Отексте»? --Vladis13 (обсуждение) 12:05, 24 мая 2017 (UTC)
«Если второй словник делается из русского индекса в приложении — должен соответствовать этому индексу». — Русский индекс в приложении: а) короче, чем реальное число статей; б) по дореформенной орфографии, поэтому в другом порядке; в) назван устарелыми терминами, которые ныне считаются ошибочными (в связи с чем по замечанию Ratte были ранее переименования, см. Обсуждение:Сочинения Платона (Платон/Карпов)#Устарелые переводы названий). Текущие современные русские названия взяты с энциклопедических сайтов, где выложена эта эницлопедия (т. е. это не ОРИСС). В частности с http://ancientrome.ru, который ситается достаточно авторитетным по тематике. Проблема с названиями статей была оговорена в РСКД/Предисловие редакции (с середины второго абзаца) — редакцией был сохранён порядок статей по латинскому алфавиту, но словник-указатель был сделан по порядку русских дореволюционных названий. --Vladis13 (обсуждение) 12:05, 24 мая 2017 (UTC)
(Про рус. названия см. тему ниже.) --Vladis13 (обсуждение) 12:05, 24 мая 2017 (UTC)
Словник будет разделён на части чуть позже. Заливка ещё в процессе, словник отмечен шаблоном, что перерабатывается.--Vladis13 (обсуждение) 12:05, 24 мая 2017 (UTC)

Язык названий статей[править]

Сейчас словарь залит с русскими названиями статей, с одновременным созданием лат.-греч. редиректов. Современные русские названия взяты с энциклопедических сайтов, в частности с http://ancientrome.ru. Выбран такой режим был по следующим причинам:

а) Страницы называтся по русски на всех сайтах с этой энциклопедией в интернет. Нет ни единого сайта с лат.греч. названиями.
б) Статьи под русскими названиями перечислены в Указателе оригинала словаря.
в) В самом тексте статей используются только русские названия. Пример: РСКД/Эак, по тексту «Эак», хотя термин «Aeăcus».
г) По статистике запросов в Яндексе — никто вообще не ищет в интернет эти понятия на греческом или латыни. Ищут только на русском. Статистика запросов на Яндекс по первым случайным словам: Danai — все 100 % поисков это поиски одноимённого отеля, запросов «Δανάκη» — ноль. Аналогично 100 % запросов «Achilles» — это поиск одноимённых автомобильных покрышек, в то время как рус. «Ахилл» иногда таки ищут — 300 запросов по теме мифологии в месяц.
Учтите, что поисковики крайне плохо индексируют Викитеку, т. е. для интернета нас и нашего труда не существует. Можете проверить поиск в Яндексе и Гугле по текстам, внесённым в Викитеку например год назад или более. Для поисковиков крайней важно наличие ключевого слова в заголовке и его использование в тексте. Если переименовать, то статьи вообще не будут содержать русские названия, т. е. Словарь абсолютно исчезнет из интернет. Тогда зачем он нужен?
д) Проблема с поиском даже в Викитеке. Например, статья «Геракл» находится исключительно по названию статьи. Если статью переименовать, её будет не найти.

Сейчас единого мнения нет. Поэтому залил на основании этих аргументов, из которых следует, что переименование может быть даже вредным. Если уважаемые коллеги за переименование, переименую. --Vladis13 (обсуждение) 12:08, 24 мая 2017 (UTC)

@Vladis13: @Lozman: А если просто сделать названия двуязычными? РСКД/Abăcus (Абак), РСКД/Άβαι (Абы) и т. д. И словник сделать именно соответствующим оригинальному порядку статей списком иноязычных названий с переводами в скобках. Все проблемы решаются. Ratte (обсуждение) 14:47, 24 мая 2017 (UTC)
Интересный вариант. Кстати, решает проблему омонимии некоторых статей. Напр. "Leges Corneliae" в скане - название 3-х разных статей. Чтобы их технически развести мне пришлось создавать ориссные называния с русскими уточнениями: РСКД/Leges Corneliae (Цинны), РСКД/Leges Corneliae (Суллы), РСКД/Leges Corneliae (трибуна). --Vladis13 (обсуждение) 17:08, 24 мая 2017 (UTC)
Не решает, т.к. смешивает два принципиально разных подхода — разделение омонимов и дублирование двуязычных названий. Или одно, или другое. Дублирование существенно усложнит названия, и все равно не решит всех вопросов (с тем же локальным поиском, например). По другим возражениям:
  • Страницы называтся по русски на всех сайтах с этой энциклопедией в интернет — не аргумент, нам хорошо известно «качество» словарей в интернет (вы сами не так давно им возмущались). К тому же, они не ставят перед собой задачу воспроизводить текст максимально близко к оригиналу (в отличие от нас).
  • Статьи под русскими названиями перечислены в Указателе оригинала словаря — для того и существует указатель, чтобы дублировать словник альтернативным способом. А не подменять его.
  • В самом тексте статей используются только русские названия — в тексте, но не в заглавных словах.
  • находится исключительно по названию статьи — по тексту статьи тоже прекрасно находится (а в тексте русские варианты есть). А для поиска без текста, по одному названию (поисковые подсказки) будут перенаправления. Что касается Гугла и пр.: тут я не эксперт, возможно, наличие ключевых слов только в тексте статьи при отсутствии их в названии действительно сильно вредит поиску. Но если выбирать между соответствием источнику и поисковыми рейтингами — я за источник. — Lozman (talk) 19:54, 24 мая 2017 (UTC)
Соглашусь. Тогда лучше оставить оригинальные названия, как в Ботаническом словаре. Поисковики нас и с русскими названиями не особо любят, так что отступление от оригинала в угоду поисковой оптимизации вряд ли принесет существенную пользу. Ratte (обсуждение) 20:09, 24 мая 2017 (UTC)
Принято, переименую. --Vladis13 (обсуждение) 23:58, 24 мая 2017 (UTC)
Есть ли возражения против переименования названий в словниках и статей, которые используют диактрику, в стандартный алфавит? С этим проблема, движок считает их разными буквами. Для их массы надо делать отдельные редиректы, не находятся по поиску, не набрать с клавиатуры. В ТСД в своё время тоже отказались от указания ударений в словах в словниках. Примеры: РСКД/Veneficĭum → Veneficĭum, РСКД/Sicarius → Sicarĭus, РСКД/Antēius, РСКД/Tabulae → Tabŭlae, РСКД/Έι̉σαγγελία → Εισαγγελία. и т.п. --Vladis13 (обсуждение) 17:37, 24 мая 2017 (UTC)
Последнее слово в скане: Εἰσαγγελία, в вашем примере — символ из Private Use Area, который в принципе не может здесь употребляться. Ваши источники чудовищны. Я все более и более жалею, что не воспрепятствовал этой авантюре в самом начале. Заливка заняла несколько дней, на исправление понадобятся годы (это если вообще найдутся желающие исправлять). P.S. Конкретно по вопросу: диакритики в названиях статей уместны, особенно в греческих (в латыни еще под вопросом), только корректные диакритики. Названия без диакритик можно делать перенаправлениями. — Lozman (talk) 19:28, 24 мая 2017 (UTC)
Всё не так ужасно. Источники были выбраны лучшие из имеющихся. Других, не-чудовищных, не существует. Словарь сложный. Было бы просто — он был бы на сайтах. Но существует лишь единицы сайтов с ним, причём с одним вариантом распознавания, и выложен фрагментами. Скан существует лишь одного перевода из двух, и тот даже на РГБ с утерей многих страниц. OCR в нём нет — я сам две недели машинного времени его качествнно распознавал и загружал на Викисклад. Я вроде говорил, что этот словарь по сложности близок к уровню ТСД.
«на исправление понадобятся годы» — почему годы? Пара часов, обычная чистка OCR. Как я понял, есть согласие за переименование букв в словниках и названиях, ок.
Могли бы вы уточнить диапазоны? Для латыни тогда стандартные: [a-z], для греческого — буквы которые тут под полем редактирования в меню «Быстрая вставка»? --Vladis13 (обсуждение) 23:55, 24 мая 2017 (UTC)
Для греческого: [\u0370-\u03ff] (основной) и [\u1f00-\u1fff] (расширенный). Комбинации с диакритиками нужно заменять на соответствующие расширенные символы (см. следующую тему). — Lozman (talk) 16:07, 26 мая 2017 (UTC)
Возможно, стоит попробовать использовать электронное издание, интернет-версия которого была выложена в Яндекс.Словарях. Ratte (обсуждение) 19:48, 24 мая 2017 (UTC)
Это издание Директмедия я год назад пробовал. 1) Там тот же самый словарь, что выложен на сайтах и залит сюда. 2) В инсталяторе вирус, причём во всех раздачах словарей этой фирмы, 3) Там закодированный пакет, текст не вытащить. Раскодировщика/распаковщика для словарных пакетов этой конторы не существует. --Vladis13 (обсуждение) 23:55, 24 мая 2017 (UTC)
Про это издание со скришотами, можно сравнить, что оно и залито. Кстати, издание рецензированное, современные русские названия взяты из него. --Vladis13 (обсуждение) 11:40, 25 мая 2017 (UTC)

Статус заливки и планы[править]

--Vladis13 (обсуждение) 01:19, 25 мая 2017 (UTC)

  • ✔ Залито (8000+ статей) с сайта onlineslovari.com, там текст почти всех статей и близок оригиналу. Сгенерированы оригинальные названия, которые были спарсены из текста статей. Сделана массовая перелинковка статей, и поправка оформления. Одновременно созданы лат.-греч. редиректы. Сгенерированы 3 варианта словника, они обсуждаются и вычитываются.
    • ✔ Отсутствуют почти все статьи по букве Z, нужна дозаливка с sbiblio.com. На др. сайтах (типа http://enc-dic.com/antiquities) в тексте статей присутствуют внутритекстовые переводы лат.-греч. терминов, которых нет в скане. Или урезанны внутритекствые ссылки на источники (пример: нет «(Hesiod. theog. 453)» как надо).
    • ✔ В планах дозаливка с сайта ancientrome.ru. Там лишь 2.5 тыс. статей, но они вычитанные и с иллюстрациями. Имеются современные русские названия с ударениями, но в верхнем регистре. --Vladis13 (обсуждение) 06:28, 13 июня 2017 (UTC)
    • ✔ Перелинковать дозалитые статьи (в статьях ссылки идут после лексемы « см. »).
  • ✔ Загрузка с ancientrome.ru имеющейся там пагинации статей в словник. --Vladis13 (обсуждение) 06:28, 13 июня 2017 (UTC)
  • ✔ Переименованы рус. страницы в лат.-греч. Убрана лат. диактрика из словника, словник пересортирован, страницы переименованы без лат. диактрики. --Vladis13 (обсуждение) 00:55, 30 мая 2017 (UTC)
  • (чистка OCR) Коррекция псили и дасии у греч. заглавных букв. Замена некорректных unicode-символов.
  • После дозаливки, вычитки словников, и проверки по ним отсутствия статей, перепроверить отсутствие рус. букв в латинских терминах, и диакритику.
  • ✔ Разборка греч. терминов из словника под латинские буквы. Разделение словника. --Vladis13 (обсуждение) 06:28, 13 июня 2017 (UTC)
  • ✔ Викификация шаблона словника. Подключение трансляции данных из словника в шапки статей. Чистка всех статей от параметров «страница, название, названиеориг» в шапках.
  • ✔ Подключен Модуль:Отексте вместо {{Отексте}}.
  • ✔ Вычитаны словники. --Vladis13 (обсуждение) 08:08, 27 июля 2017 (UTC)
  • ✔ Залиты все статьи. --Vladis13 (обсуждение) 20:39, 4 августа 2017 (UTC)

Дальние планы:

  • Категоризовать статьи ботом по тематикам. Ключевые слова: право, юрид.+, закон, бог, мифология, воен.+, растен, топонимы (город, местность, река, мыс, остров, гора, хребет), персоны (историк, трибун, император, военначальник, актер, поэт, герой).
  • Иллюстрации: Отметить категорией/шаблоном статьи с незалитыми иллюстрациями. Залить, или просто подключить изображения страниц скана (метод обговариваляся на форуме в прошлом году).
  • Перелинковка всех ссылок в Википедии на этот Словарь в Викитеке. Это проблема, ибо в ВП массово не указаны названия статей РСКД, а даны только ссылки на номера страниц изд. «Олма», сканов которого в интернет нет. Т.ч. надо заново вручную искать каждую статью словаря.
  • Подключение в гаджет «WEF:Ссылки».

Качество скана[править]

тот даже на РГБ с утерей многих страниц — можно обратиться в Проект:Библиотека в ВП с просьбой к участникам сделать скан отсутствующих страниц. Из наших туда обращался VadimVMog (тоже в скан не все попало), ему помогли. Ratte (обсуждение) 07:36, 25 мая 2017 (UTC)

  • У вас и у VadimVMog хорошая харизма, попробуйте, уверен вам помогут. --Vladis13 (обсуждение) 12:06, 25 мая 2017 (UTC)

Формат словника, диакритика[править]

Я добавил Реальный словарь классических древностей по Любкеру, 1885 (Q30059240) в Модуль:Другие источники. Пример — ЭСБЕ/Алкей со товарищи. Вопрос, номера страниц, где расположена статья, будут? -- Sergey kudryavtsev (обсуждение) 09:52, 26 мая 2017 (UTC)

Да. Порядок статей понятно должен соответствовать скану. Сейчас решаю эту проблему. Названия статей, добавленные в словник, были спарсены из текста. Они имеют ненужные для указателя и названий страниц спецсимволы — диактрику и некорретные символы Unicode (диапазон Private area), которые сбивают скрипт сортировки словника. В скане же статьи расположены по порядку не учитывающему эту диактрику. Сейчас занимаюсь нормализацией юникода из расширенного в стандартный набор, и тогда пересортирую словник. --Vladis13 (обсуждение) 14:57, 26 мая 2017 (UTC)
В (древне)греческом диакритики нужны, но они здесь совсем кривые. Пример того, как все должно было оформляться: РСКД/Ἁρμόσυνοι. Что видим: 1) использование букв основного греческого диапазона (0370 — 03FF) с комбинирующими диакритиками (0300 — 036F) вместо букв расширенного греческого диапазона (1F00 — 1FFF), например: ε̉ (U+03B5 + U+0309) вместо ἐ (U+1F10), η̃ (U+03B7 + U+0303) вместо ῆ (U+1FC6) и т.д.; 2) Использование букв с ударением (Tonos) вместо букв с придыханием (Psili или Dasia), например Ά вместо Ἀ или Ἁ; 3) просто мешанина символов (латинское u вместо греческого υ) и т. д. Вот это все нужно исправлять. — Lozman (talk) 15:54, 26 мая 2017 (UTC)
@Lozman: Т. е. надо сделать композицию юникода (слить буква+диакритика → буква расш.диапазона)?
Судя по правилам использования диакритики, w:псили (2-й абзац) ставится перед всеми первыми гласными. Кроме тех, что с «хы-кающим» придыханием w:дасия, +буквы Ро и Эпсилон всегда с дасии. Т. е. надо проверить начальные гласные, что везде именно псили (не акут и др.); а перед словами произносящимся на буквы «Г, Х» (РСКД/Ἁρμόσυνοι) — дасия. --Vladis13 (обсуждение) 18:19, 26 мая 2017 (UTC)
Нормализацию греч. диакритики внутри слов я пока отложу. Ибо нет чёткой побуквенной схемы — какую последовательность байт на какой символ менять. В источниках по многим словами разногласия в используемой диакритике, что требует специальных исследований и отдельной работы. А надо закончить заливку. --Vladis13 (обсуждение) 18:53, 26 мая 2017 (UTC)

Элемент Викиданных[править]

@Sergey kudryavtsev: отвалилась ссылка в Викитеке на статью в Википедии. Поправьте пожалуйста.

Кстати, почему вы ставите, что страница Реальный словарь классических древностей — только об издании 1885? Она же обзорная про все издания. Выложенные статьи — да, но не обзорная. --Vladis13 (обсуждение) 04:04, 30 мая 2017 (UTC)

Потому что, это явно указано параметрами {{Отексте}} (ЯЗЫКОРИГИНАЛА, НАЗВАНИЕОРИГИНАЛА и ПЕРЕВОДЧИК).
отвалилась ссылка в Викитеке на статью в Википедии — разберусь, только дайте пример такой статьи, где отвалилось. -- Sergey kudryavtsev (обсуждение) 07:13, 30 мая 2017 (UTC)
Я про страницу Реальный словарь классических древностей — в шапке нет ссылки на Википедию. Вобщем, сделал отдельную страницу для перевода: Реальный словарь классических древностей (Любкер / Филологическое общество). (Хотя не понимаю смысл такого усложнения незначимыми дублями. В Викитеке никогда не будет иных версий словаря, кроме этой одной.) Думаю теперь будет правильно обновить ссылку в Викиданных? --Vladis13 (обсуждение) 14:06, 30 мая 2017 (UTC)
Влад, вы что-то не то сделали. В ВТ не создаются дубли словарей в целях какого-то соответствия Викиданным; у нас независимый проект и мы не обязаны ломать установившуюся практику по такой причине. «Отдельная страница для перевода» уже есть — это Реальный словарь классических древностей. Ему соответствует элемент d:Q30059240. «Обзорной страницы» у нас быть не может, она может быть только в немецкой ВТ, потому что изначально это немецкий словарь, у нас страница только по конкретному переводу. Дубль я вынес на удаление. Ratte (обсуждение) 21:36, 30 мая 2017 (UTC)
Что-то я не понимаю… Вы хотите сказать, что в принципе для переводных изданий не может быть обзорных статей и страниц со списком переводов, страницы о них только на оригиальных языках? Т. е. надо удалить ссылку на ВТ из элементов например в Библия, Гамлет (Шекспир) и т. д.? --Vladis13 (обсуждение) 23:48, 30 мая 2017 (UTC)
«у нас страница только по конкретному переводу». — Не. Перечислены же: и независимый перевод Модестова, и 8-е нем. издание, которое вообще перевода «Филол.общ.» не касается... И др. издания — немецкие, рус. современные... И даже 1-е изд. 4-томное от 1883—1885 перевода «Филол.общ.», которое неизвестно насколько идентично однотомному изданию 1885 года. --Vladis13 (обсуждение) 23:48, 30 мая 2017 (UTC)
Виноват, я не очень хорошо выразился. Уточню свою аргументацию: я считаю, что несколько страниц для РСКД в руВТ на данном этапе не нужны. В отношении энциклопедий в руВТ сложилась общая практика, что в названиях не указываются авторы в скобках, поскольку их, как правило, довольно много (Филологическое общество — не автор), и различные доп. страницы не создаются. В частности, у нас спокойно существует БЭЮ без страницы в отношении первоисточника — словаря Мейера и 14 том ЭЛ без страницы в отношении Conversations-Lexicon. На странице БСЭ указаны все три издания опять-таки без кучи отдельных страниц. Резюмируя: я прошу согласиться со мной и не усложнять и не заниматься ненужным дублированием и созданием страниц-версий. Есть страница РСКД — и этого достаточно, а что там в Викидате — бог с ней. Ratte (обсуждение) 08:13, 31 мая 2017 (UTC)
Я тоже ститаю, что две статьи про РСКД не нужны. Вот если у нас появится второй перевод того же немецкого словаря, тогда — пожалуйста. -- Sergey kudryavtsev (обсуждение) 10:53, 31 мая 2017 (UTC)
С этим я абсолютно согласен (см. выше реплику от 14:06, 30 мая).
Но я не увидел аргументов против того, что эта статья - обзорная, см. выше моё перечисление упомянутых на странице изданий, не имеющих отношения к изданию 1885. Тогда если страница описывает весь словарь, а не только одно из десятков его изданий, к тому же имеет общее название страницы без уточнений, - то разве не следует указать эту страницу Викитеки в элементе Реальный словарь классических древностей (Q4391526)? Напомню, этот элемент - тоже обзорный как и страница. По оригинальным нем. и рус. изданиями есть отдельные элементы: Реальный словарь классических древностей, 1-е изд. (Q30068032), Реальный словарь классических древностей, 6-е изд. (Q30067878) и т.д. --Vladis13 (обсуждение) 16:40, 31 мая 2017 (UTC)
Это не обзорная страница, а страница о конкретном переводе 1885 года. «Общее название страницы без уточнений» — потому что по принятой практике в названиях энциклопедий уточнений нет, даже переводных энциклопедий, я выше примеры приводил. Обзорная страница о Reallexikon des klassischen Altertums für Gymnasien в руВТ попросту не нужна. Ratte (обсуждение) 16:45, 31 мая 2017 (UTC)
Что в странице о переводе 1885 делает упоминание 8-го не переведённого издания 1914 года? И др. посторонняя инфа? --Vladis13 (обсуждение) 16:51, 31 мая 2017 (UTC)
Посторонняя инфа не мешает (ну есть и есть), но если вам угодно, ее можно убрать (все равно в ВП общая история присутствует). Ratte (обсуждение) 16:56, 31 мая 2017 (UTC)
Инфы не о конкретном издании 1885 (посторонней) там больше половины, т.е. де-факто страница описывает (обозревает) всю историю словаря. И не вижу ответа, почему в аналогичных случаях у Библия, Гамлет (Шекспир) и т. д. страницы Викитеки указаны в Викиданных?
Тем не менее эта страница является головной именно для перевода 1885 года, на нее ведут ссылки РСКД/Статья, содержащие означенный перевод. Библия, кмк, неправильно указана в ВД, у нас Синодальный перевод, который является переводом, для него должна быть отдельная страница в ВД. У Гамлета много переводов, которые потенциально могут быть размещены в ВТ, поэтому для него целесообразно иметь обзорную страницу, в отличие от РСКД. Ratte (обсуждение) 17:22, 31 мая 2017 (UTC)
Хотя, кажется, и так понятно... В {{РСКД}} написано вот так | ВИКИПЕДИЯ = {{#if:{{{ВИКИПЕДИЯ|}}}|{{{ВИКИПЕДИЯ|}}}|Special:Search/{{{НАЗВАНИЕ|}}}}}, т.е. с точки зрения {{Отексте}} ссылка всегда задана вручную. Исправил вот так. -- Sergey kudryavtsev (обсуждение) 07:23, 30 мая 2017 (UTC)
Так вы массово снесли вообще все ссылки на Википедию. В прежнем варианте: при наличии статьи выдавалась она, при отсуствии — википоисковик, сразу можно было найти. Эта схема работает в {{ЭСБЕ}}, {{ТСД}}, {{БСЭ1}}, {{МЭСБЕ}} и др. словарях. Например, отлично выдается через поисковую ссылку в ЭСБЕ/Вогюэ, Эжен-Мельхиор статья в ВП. Чем РСКД хуже других энциклопедий? --Vladis13 (обсуждение) 15:43, 30 мая 2017 (UTC)
Согласен. Надо вернуть как было. Ratte (обсуждение) 21:42, 30 мая 2017 (UTC)
Сделал ссылку через параметр ПОИСК {{Отексте}} (недокументированный), по примеру МЭСБЕ. Так и в категорию «ссылка заданая вручную» не попадает, и ссылка есть. --Vladis13 (обсуждение) 23:51, 30 мая 2017 (UTC)
Ну, да. Это делается через параметр ПОИСК, а не через ВИКИПЕДИЯ. -- Sergey kudryavtsev (обсуждение) 10:39, 31 мая 2017 (UTC)

РСКД/Словник по рус. алфавиту[править]

Я так и не понял, зачем нужен сабж в свете наличия РСКД/Русский указатель статей. Может, того, снести? Ratte (обсуждение) 21:06, 1 июня 2017 (UTC)

  • Хороший вопрос. Но пока сомнения в его точности. В Указателе — 6700+ строк, а текущее число статей — 8052, причём это не все (см. как много красных на проверенной букве Z). Какие-то перечислены в Указатели через запятую в одной строчке:

* БракMatrimonium; — Έπιγαμία; — Γαμήλια; — Confarreatio; — Remancipatio; — Repudium; — Sponsalia

Формат интересный и удачный. Но является ли это форматом принятых в Викитеке словников, «в общем, как здесь принято» — ваши слова про словник вверху страницы. :) Вы могли бы с этим вопросом повременить недельку? Возможно скачаю текстовку с сайта, где вроде как все статьи, чтобы было с чем сравнивать. Надо будет посчитать в этом Указателе все уникальные термины (в таком формате они возможно дублируются), и сверить с числом в словнике. --Vladis13 (обсуждение) 22:49, 1 июня 2017 (UTC)
Этот указатель не словник. Одни строчки, как привёл выше — это не точные статьи о термине, а «облако» связанных с ним понятий. Но в большинстве других случаев другие ситуации, причём без уточнений:
Через тире — лат.-греч. написание, а не отдельная статья. В «Левин» — цитируется редирект на части других статей. В «Левка» — список омонимов. Везде отсутствуют номера страниц. Если переработать в формат словника, то это будет полный отрыв от печатного оригинала (сейчас тут только сортировка по современной орфографии). --Vladis13 (обсуждение) 14:02, 2 июня 2017 (UTC)
Если мы собираемся делать двойную навигацию (по ориг. и русским названиям), формат Указателя для этой цели не подходит; нужен словник именно в формате словника, с шаблонами типа {{Статья в словнике}}, где как минимум есть два параметра: 1 — оригинальное название статьи, 2 — русское название. В идеале — доработать шаблон {{Статья в словнике3}}, чтобы он, используя те же параметры, выводил их в другом порядке в зависимости от названия словника (в РСКД/Словник[[РСКД/{{{1}}}|{{{1}}}]] / {{{2}}}, в РСКД/Словник по рус. алфавиту[[РСКД/{{{1}}}|{{{2}}}]] / {{{1}}} или [[РСКД/{{{2}}}|{{{2}}}]] / {{{1}}}. Тогда можно будет просто копировать содержимое РСКД/Словник в РСКД/Словник по рус. алфавиту, отсортировав по второму параметру. Шаблон {{РСКД}} предполагаю реализовать средствами Модуль:Отексте и Модуль:Отексте/РСКД, он на порядок быстрее работает с большими словниками. Песочница с тестовой версией этого шаблона находится здесь (обратите внимание на временные показатели); в поле «Показать страницу» можно подставить другие названия. Навигация по русскому словнику пока не работает по указанной причине (требуется переработка словника). Но если эта вторая навигация не нужна, можно русский словник и удалить (можем просто собрать все русские редиректы в специальную категорию, да и дело с концом). — Lozman (talk) 00:19, 2 июня 2017 (UTC)
Серьёзный и хороший модуль. Но непонятный для новичка, ему бы документацию. Давайте подключим.
В модуле не вижу как настраивать смещение страниц скана относительно книги. Например, статья с книжным номером страницы 24, — но модуль делает ссылку на РГБ на страницу скана 24 (должна быть 16). При этом надо учесть, что в скане спаренные страницы книги, и что смещение может различаться. (В скане РСКД отсутсвует несколько групп страниц, поэтому нужно несколько правил смещения.) Также в книге может быть сразу несколько нумераций, например: в начале книги римскими буквами предисловие, потом текст с арабскими цифрами с единицы, потом опять римские с единицы, и опять арабские с единицы. И бывают страницы, по опечатке имеющие один номер. В Модуль:Header есть функция pagescan_calc(), решающая эти проблемы. --Vladis13 (обсуждение) 04:24, 2 июня 2017 (UTC)
Есть свойство offset у отдельных томов, лучше всего его можно видеть в Модуль:Отексте/ЭСБЕ. Пока, правда, только для одной пагинации и только в режиме «1 страница = 1 номер». Но я постараюсь его функционал расширить в ближайшее время. С документацией не обещаю, мне в 100 раз проще сделать что-то, чем объяснить, как это работает. Но, по крайней мере, я старался везде в коде оставлять комментарии, чтобы потом было проще разбираться. — Lozman (talk) 11:13, 2 июня 2017 (UTC)
Вопросы по модулю: 1) Как подключить в шапку в поле ДРУГОЕ доп. уточнения и ссылки, например на РСКД/Список сокращений названий трудов античных авторов? 2) Как передать в модуль параметры, например КАЧЕСТВО? 3) Надо поправить ссылку на страницы источника, напр. на РГБ не существует страницы скана 1167 (там всего 775). 4) Как задать раздельное смещение пагинации для ссылок на РГБ и ссылок на Индекс? Также может быть несколько Индексов, например для ДО и «:ВТ» с OCR в разной орфографии. 5) Что в Модуль:Отексте/РСКД в переменной scan = { "01003599381", 1 } значит «1»? 6) Ещё может быть в поле ДРУГОЕ сделать картинку не кликабельной? --Vladis13 (обсуждение) 15:05, 2 июня 2017 (UTC)
1) Сделаю. Не уверен, что это нужно указывать в каждой статье, но сделать не особо сложно. 2) Все параметры шаблона Отексте передаются с помощью local pargs = frame:getParent().args, и КАЧЕСТВО тоже; должно работать как обычно. 3) Это то, о чем я упоминал выше. Есть идея, как допилить функционал offsets для таких случаев, сделаю. 4) Это потребует более серьезной доработки. Вообще я предполагал давать ссылки в шапке на сам индекс, а не на страницы в нем (как уже сделано в статьях ЭЛ). Непонятно, зачем нужны ссылки на разные сканы одной и той же страницы. Выбрать источник сканов, который получше, на него и ссылаться, а остальные указать на заглавной странице. Также непонятно, почему у нас четыре индекса для одного тома, причем в двух случаях статьи разрезаны между двумя индексами. Индексы ДО и ВТ, если будут, будут указываться на разных страницах. В любом случае тут есть еще над чем работать, но на все случаи жизни не подстрахуешься, нужно решать конкретные проблемы по мере их возникновения. 5) Номер шаблона скана (свойство scanpat — таблица, в нем может быть несколько шаблонов, как, например в Модуль:Отексте/ТСД; то же и с indexpat). 6) Сделал. — Lozman (talk) 00:42, 3 июня 2017 (UTC)
2) В песочнице статья имеет параметр КАЧЕСТВО=2, но категория «50%» не подключается. Попробовал вызвать модуль так: {{#invoke:Отексте|textinfo|dict=generic|КАЧЕСТВО=2}} — не помогло.
4) «Выбрать источник сканов, который получше, на него и ссылаться», — имхо, в приоритете должна быть ссылка на индекс в Викитеке. а) тогда OCR будет потихоньку вычитываться, б) ссылки на сторонние сайты, в частности РГБ, не стабильны, — сегодня там файл есть, завтра может не быть, и с вопросом обратится будет не к кому; в Вики же есть история правок.
“Также непонятно, почему у нас четыре индекса для одного тома.» — Лимит на размер файлов на Викискладе — 100 Мб. Размер скана словаря на РГБ — 740 Мб, в нём нет текстового слоя. Я его распознавал, сжал до 400 Мб (с вобщем заметной утерей качества, меньше никак), и залил, нарезав на 4 части.
5) А как расшифровывается «pat» в «scanpat»? Если этот номер шаблона скана добавлен только для ТСД, то возможно не стоит усложнять им код? Возможно для ТСД для каждого издания лучше сделать отдельные подмодули ТСД1, ТСД2, ТСД3? Там сложность получается только с навигацей, но её в общем можно решить отдельной функцией. По моему опыту с ТСД, где была сделана уникальная для Викитеки публикация статей сразу 3-х изданий на одной странице, скриптовая реализация получается слишком сложной. Пришлось писать отдельный модуль, основной викиредактор ТСД Дмитрий не однократно писал, что код стал слишком сложный и непонятный. Не уверен, что такое понадобится для других проектов. Ведь если статьи изданий фактически дублируются, то можно не делать отдельных страниц, а лишь отметить разницу сносками с комментариями (напр.: ТСД1 и ТСД2, и на форуме обсуждались публикации 2-х редакций БСЭ1). А если отличаются значительно, как ТСД-2 и ТСД-3, то возможно лучше было бы публиковать их на отдельных страницах. --Vladis13 (обсуждение) 16:31, 3 июня 2017 (UTC)
В песочнице и не должно работать, там другой интерфейс, значок просто некуда выводить. Но в коде страницы он есть (<span class="ws-noexport" style="display:none"><span id="textquality" class="100%"></span></span>), поэтому в основном пространстве выводиться должен. По крайней мере, там, где модуль уже подключен (ЭЛ, РЭСБ, САР) — выводится.
В приоритете должна быть ссылка на индекс в Викитеке — то есть на файл; индекс только в ВТ и бывает. По идее, для каждого тома предполагается одна ссылка на файл (по возможности со страницей) и одна ссылка на индекс (в ПИ Индекс). Я так стараюсь делать везде, примеры — в том же ЭЛ.
Лимит на размер файлов на Викискладе — 100 Мб. — С функцией Chunked upload — 1 ГБ; я так загрузил почти все тома НЭС. И, насколько я вижу, текстовый слой в этом файле есть. Может, слоит попытаться перезалить целиком?
А как расшифровывается «pat» в «scanpat»? — pat[tern] )) Номер шаблона изначально сделан для БЭЮ, там 9 том отсутствовал в РГБ, и его приходилось брать с Руниверса (сейчас вроде уже есть и в РГБ). А ТСД я делал вообще одним из последних, и воспользовался готовой наработкой. Да и не факт, что в будущем еще где-то не понадобится. А усложнение кода тут минимально, любой другой способ сделать то же самое будет наверняка гораздо сложнее.
Возможно для ТСД для каждого издания лучше сделать отдельные подмодули ТСД1, ТСД2, ТСД3? — Только если тексты статей тоже будут разделены. Архитектура подмодулей организована по принципу «одна страница — один подмодуль», для использования нескольких подмодулей на одной странице придется существенно переписывать код всего модуля. Вот это как раз приведет к значительному усложнению кода, и именно только ради ТСД. Проблема с ТСД — не техническая, а концептуальная: я тоже считаю, что тексты разных редакций сводить не следовало. Но при использовании модуля Отексте сложность с ТСД ненамного выше, чем с другими словарями (и он не использует модули ТСД и Header). Вообще подмодули типа join предназначались немного для другого: для раздельной навигации в статьях с интегрированными дополнениями (как в ЭСБЕ или МСР), но способ вполне подошел и к ТСД. — Lozman (talk) 23:47, 3 июня 2017 (UTC)
Yes check.svg Сделано: 1 (параметр other); 3 (параметры factor — число номеров (страниц/столбцов) на одну страницу скана, и correction — поправка для случаев, когда последний номер на странице скана не кратен значению factor — напр., с. 1, 2-3, 4-5 и т. д., как в нашем случае). — Lozman (talk) 02:47, 5 июня 2017 (UTC)
Модуль не транслирует в шапки из словника второй параметр {{Статья в словнике3}} (перевод/оригинальное написание). Это нужно. --Vladis13 (обсуждение) 16:13, 2 июня 2017 (UTC)
Он должен подгружаться из второго (русского) словника, который пока не работает. Можно было бы в этом случае обойтись и одним словником, но тогда нужно еще кое-что допиливать в модуле. — Lozman (talk) 00:42, 3 июня 2017 (UTC)
В Модуль:Header это уже реализовано добавлением шаблона {{Статья в словнике3}} и парсингом его параметров в makelist(). Выбор извлечения 1-го или 2-го параметра делается аргументом «ДО=true»:

{{#invoke:Header|title|РСКД/Flaminini|РСКД/Словник/F}} → Flaminini
{{#invoke:Header|title|РСКД/Flaminini|РСКД/Словник/F|ДО=true}} → Фламинины

(Название аргумента — «ДО» недостаточно абстрактно. Во 2-м параметре шаблона может быть не только ДО, как в этом примере.) --Vladis13 (обсуждение) 15:33, 3 июня 2017 (UTC)
Здесь разные подходы: в Header функция достает одно конкретное значение, а в Отексте генерируется шапка целиком. Проблема проще решается с подключением второго словника (это уже работает в подмодуле ТСД). Можно попробовать реализовать и по одному словнику, опять-таки — если это не слишком усложнит код. Подумаю. — Lozman (talk) 23:47, 3 июня 2017 (UTC)
Yes check.svg Сделано (параметр jointitles == 2; значение 1 — собирает из разных словников). — Lozman (talk) 02:47, 5 июня 2017 (UTC)
P.S. Функция makelist ужасна сама по себе, именно в ней — основная причина тормозов при использовании этих шаблонов. И именно это было основной причиной, побудившей меня заняться разработкой нового модуля. Там другой алгоритм поиска, он на порядок быстрее. Я планирую постепенно переводить на использование модуля Отексте все шаблоны заголовков, начиная со словарей (уже используется в шаблонах ЭЛ, БЭАН, РЭСБ и САР). Поэтому я и предлагал сразу применять этот подход в РСКД, чтобы не делать двойную работу. — Lozman (talk) 13:40, 13 июня 2017 (UTC)
Великолепно! Вроде работают[1] все функции из {{Отексте}} + чёткая формализация параметров. Красиво. --Vladis13 (обсуждение) 23:32, 13 июня 2017 (UTC)
  • Выставил на удаление. И так давно отключена его публикация. Вместо него есть поисковик, + оригинальный указатель по рус. названиям (правда так и не проверялся насколько он полный). --Vladis13 (обсуждение) 10:38, 9 апреля 2018 (UTC)

Предложение по оформлению[править]

Предлагаю добавить картинку с обложкой на страницу статьи.--ЖуковВВ (обсуждение) 02:00, 3 июля 2017 (UTC)

✔ статьи о словаре? --Vladis13 (обсуждение) 02:57, 4 июля 2017 (UTC)

Неправильная викификация после «см.»[править]

Бот кое-где поставил неправильную викификацию. Напр., РСКД/Callistratus — викифицирован предлог «у». РСКД/Gaius — викифицировано сокращение «изд». РСКД/Gaesati — викифицировано сокращение «сл.». Я так понимаю, он скопом провикифицировал все слова, которые стоят после «см.», но там же не только словарные статьи могут быть. Ratte (обсуждение) 09:47, 3 июля 2017 (UTC)

✔ Почистил, спасибо что напомнили. Нашёл по первой строчной рус. букве, было ~50 помарок. --Vladis13 (обсуждение) 23:40, 3 июля 2017 (UTC)
@Vladis13: еще фамилии остались (в РСКД/Iudicium — «см. Zumpt»). Ratte (обсуждение) 05:01, 4 июля 2017 (UTC)
Почистил, из расчёта, что фамилии и слова за ними на латыни. --Vladis13 (обсуждение) 06:17, 4 июля 2017 (UTC)
Там не формализованные токены, это на полуавтомате. +Многие термины в нижнем регистре (РСКД/Securis), стандартный бот регистр менять не может. Может позже займусь. --Vladis13 (обсуждение) 00:06, 4 июля 2017 (UTC)

Якорь и №[править]

В РСКД/Argonautae зачем-то проставлены шаблоны {{якорь}} и {{}}, причем некоторые цифры налезли прямо на текст. В этом есть какая-то необходимость? Ratte (обсуждение) 21:22, 3 июля 2017 (UTC)

Якоря были на сайте-доноре ancientrome, сохранены. Не уверен что нужны. Как думаете?
{{}} тоже оттуда. Но эти цифры на полях есть в скане, и попадаются ссылки в тексте статей. (РСКД/Ostracismus → «Έκκλησία, 8» → РСКД/Ἐκκλησία п. 3, который на полях пронумерован как «8»). Возможно стоит заменить на {{left sidenote}}, как сделали в Платоне. Но в скане они с разных сторон колонок, как сделать в статьях? --Vladis13 (обсуждение) 23:52, 3 июля 2017 (UTC)
@Vladis13: предлагаю убрать якоря, а {{}} заменить на {{left sidenote}} (если в скане номера слева) и {{right sidenote}} (если в скане номера справа). Ratte (обсуждение) 06:25, 4 июля 2017 (UTC)
✔ якоря.
{{}} в 32 статьях. Возится со сканами и расставлять шаблоны вправо-влево имхо — потеря времени. Проще расставить их ботом с какой-то одной стороны. Какие поставить параметры в {{left sidenote}}/right чтобы не сдвигался текст? --Vladis13 (обсуждение) 07:09, 4 июля 2017 (UTC)
Ну давайте слева тогда. Не понял про сдвиг текста, left sidenote вроде ничего не сдвигает. Я обычно добавляю параметр align=right: {{left sidenote|цифра|align=right}}, чтобы цифры были поближе к тексту (пример). Ratte (обсуждение) 07:30, 4 июля 2017 (UTC)
Сделано. --Vladis13 (обсуждение) 08:25, 4 июля 2017 (UTC)
@Ratte: Может поменять на {{right sidenote}}? Слева мешают читать: слевасправа, слевасправа. --Vladis13 (обсуждение) 02:02, 5 июля 2017 (UTC)
Да, лучше на right sidenote поменять. Ratte (обсуждение) 05:18, 5 июля 2017 (UTC)

Ошибки[править]

РСКД/Claudii — красные ошибки. Ratte (обсуждение) 21:27, 3 июля 2017 (UTC)

✔ 6 статей. --Vladis13 (обсуждение) 02:38, 4 июля 2017 (UTC)

РСКД/Fabii — весь текст полужирным выделен. Ratte (обсуждение) 21:43, 3 июля 2017 (UTC)

✔ Было в 2 статьях. --Vladis13 (обсуждение) 02:38, 4 июля 2017 (UTC)
С 4 апострофами «'» подряд ещё есть ряд статей, но это связано с некорректной греч. диакритикой, почищу. --Vladis13 (обсуждение) 02:38, 4 июля 2017 (UTC)
Yes check.svg Сделано

РСКД/lex Iulia — ведет на несуществующую страницу. Кстати, много статей о различных leges пропущено. Ratte (обсуждение) 21:55, 3 июля 2017 (UTC)

В целом потеряшек не много, можно добавить вручную, найдя через поисковик. Законы Юлиев. --Vladis13 (обсуждение) 02:38, 4 июля 2017 (UTC)
@Vladis13: вы так и не поправили РСКД/lex Iulia, по-прежнему ведет на несуществующую страницу. Еще РСКД/lex Livia. В РСКД/Προδοσία ссылка на др. статью поломалась. Ratte (обсуждение) 13:00, 4 июля 2017 (UTC)
Там надо словник L вычитывать, соседних статей наверняка тоже нет. --Vladis13 (обсуждение) 01:26, 5 июля 2017 (UTC)
По вычитке словников ботом найду все красные ссылки. Сейчас слишком много возни получается с каждой — есть статья, нет, опечатка, или не загружена. --Vladis13 (обсуждение) 01:26, 5 июля 2017 (UTC)

Неправильная викификация по смыслу[править]

Еще встречается неправильная викификация, когда ссылка дается не на то слово. Напр., в РСКД/Πρόσοδοι: «добывание селитры, серы, каменной соли и т. п.». Слово «сера» почему-то викифицировано термином РСКД/Seres, это название народа, а не хим. вещество. РСКД/Sella curulis: слово «металл» викифицировано термином РСКД/Metalla (рудник). РСКД/Zoroaster: слово «магия» викифицировано термином РСКД/Magii (кампанский род). РСКД/Matrimonium: слово «подарки» викифицировано термином РСКД/Podarces. Ratte (обсуждение) 14:09, 8 июля 2017 (UTC)

Встречается иногда по буквам дальше E. (Это проблема сайта-донора, откуда было скопировано.) При вычитке желательно проверять ссылки. Если ошибка — перейти на страницу редиректа, нажать «ссылки сюда» в левом меню (пример), поправить, ссылок мало — быстрее вручную. В данном случае статьи о химич. сере (sulfur) в словаре нет, ссылку переправлять не на что, удалена. --Vladis13 (обсуждение) 08:15, 9 июля 2017 (UTC)

Пронумерованные значения[править]

Статьи, где есть несколько пронумерованных значений (РСКД/Diodorus, РСКД/Diocles), не соответствуют оригиналу. Во-первых, значения не начинаются с красных строк (абзацев), в тексте статьи вообще нет абзацев, значения разделяются обычным тире. Во-вторых, каждое значение начинается с заглавной буквы (а не маленькой) и заканчивается точкой (а не точкой с запятой). Ratte (обсуждение) 15:21, 4 августа 2017 (UTC)

  • Про разделение терминов абзацами в виде списков значений. Такой формат залит с ancientrome.ru, где вычитано 1/4 словаря по буквам A-E. И присутствует на всех сайтах в интернет, например Геракл, [2], [3]. Да, хотя это не дубль скана, но по крайней мере читабельно. Например, сравните [4] и [5], [6] и [7]. Мне не хотелось отходить от оригинала, но такие простыни просто никто читать не будет вообще, уйдут на другой сайт. По сути, оформление в ВТ и так не соотвествует оригиналу: Современная орфография имеет совершенно другое написание слов, другие слова, квадратные вики-сноски ([2]) не соотвествуют ДО формату сносок типа («**)»), оформление раздела сносок под страницами (в разделе «Примечания») не как в сканах (под линией), вики-кавычки елочки «» это не кавычки лапки „“, другие шрифты, и т. п. мелочи. Кроме этого, читабельность в книге улучшает, что там две колонки текста, небольшая порция на странице, и цифры на полях; в ВТ же текст широкий.
Тире, разделяющее термины, в скане отсутствуют во всей заливке, их нет ни на одном сайте. Они заменены на разделительные абзацы.
Термины в этих абзацах оканчиваются ';'. Это тоже во всей заливке, включая с ancientrome (пример). Ботом единообразно не заменить, ибо в скане тоже зачастую разделение то точками, то ';'. Например, в РСКД/Ptolemaeus в скане все пункты разделены точками, но в последнем списке «а)» тоже оканчивается точкой, но следующие в том же списке b) и далее — с ';'.
Также в скане значения могут начинаться и строчными и заглавными. Например, в РСКД/Ptolemaeus в A) → I и III — со строчных, в IV и далее — с заглавных, далее в B) вперемешку. И: «А) государей, I) в Македонии: … В) Писатели:».
Поэтому, сошлюсь на правило:

Справка:Руководство по размещению текстов#Оформление: Тексты Викитеки не претендуют на полное соответствие оформлению оригинала.

Реальной возможности переформатировать весь словарь не вижу. Если принципиально, можно в шапке указать, что термины разделены пробелами, а не тире как в скане. И что викификатором изменены кавычки лапки на «». Но тогда уж лучше переименовать все статьи с суффиксом «(ВТ)», вроде РСКД/Ptolemaeus (ВТ). --Vladis13 (обсуждение) 21:50, 4 августа 2017 (UTC)
  • @Ratte: Я могу ботом объединить абзацы, объединив через тире ' — ' как и скане. Но у меня остаются сомнения по обоим вариантам: 1) нечитабельные простыни по оригиналу, примеры выше; или 2) с читабельными абзацами, но не как в скане (модификация по цитированному выше правилу). Сейчас в корпусе статьи в обоих вариантах. Хотелось бы договорится, и услышать мнения других участников. --Vladis13 (обсуждение) 13:14, 28 февраля 2018 (UTC)
  • @Vladis13: кто книгу выкладывает, тот ее и танцует. Я всего лишь высказал пожелание. Тут все на ваше усмотрение. С другой стороны, а есть ли нечитабельные простыни? может все же и читабельные, м? Древностью все же интересуются люди с уровнем выше среднего. Ratte (обсуждение) 19:13, 28 февраля 2018 (UTC)
  • Ладно, спасибо за ваше мнение! Пусть пока будет как есть. Эта выкладка словаря совсем не эксклюзивная. Мне кажется, люди любого уровня поберегут свои глаза, читать такое, когда по соседней ссылке есть приличней. Где длинные перечни омонимов, наглядней разделять абзацами. Но если кто уберет их, как в скане, возражать не буду. Для коротких списков лучше придерживаться оригинала. --Vladis13 (обсуждение) 21:47, 28 февраля 2018 (UTC)

Стиль для Шаблон:Lang[править]

@Lozman: возможно ли добавить в Шаблон:Lang параметр style или size/размер, как у ряда др. шаблонов? В РСКД размер греч.шрифтов в скане меньше обычного шрифта. Сейчас уменьшаю с помощью шаблона-обёртки {{РСКД-греч.}}, но кажется это монструозное название и лишняя сущность. --Vladis13 (обсуждение) 02:17, 5 ноября 2017 (UTC)

Перенесено на страницу Обсуждение шаблона:Lang

Иллюстрации[править]

Есть ли какие-либо рекомендации, как оформлять иллюстрации в этом словаре? Может есть шаблоны для их включения? Для пробы сделал фиг. 1 в РСКД/Vestis (хитон). -- Sergey kudryavtsev (обсуждение) 14:57, 12 марта 2018 (UTC)

Использовал {{inline float}} в РСКД/Vestis, выглядит неплохо. В этом шаблоне есть недостатки:
  1. хотя в док-ции указано, что можно во втором параметре указать ноль («при значении 0 используется естественный размер изображения»), это работает не правильно: картинка уезжает на правое поле. Из-за этого приходится явно указывать ширину;
  2. всплывающая подсказка (tooltip) всегда «[img]». Лучше бы чтобы её можно было бы задавать отдельным параметром;
  3. единственный обязательный параметр почему-то третий. Я предпочёл бы, чтобы он был первым.
  • Исправил ошибку со съезжанием картинки при размере 0 и изменил формат всплывающей подсказки — теперь это, в порядке приоритета: значение специального параметра alt, 4 параметр (подпись), 3 параметр (имя файла). Но я предлагаю использовать более удобные шаблоны {{ifloat}}, {{lfloat}} и {{rfloat}} (см. ниже). — Lozman (talk) 20:38, 15 марта 2018 (UTC)
А название файла на Викискладе: <название статьи> <порядковый номер в статье> (RDCA) — это правильно? -- Sergey kudryavtsev (обсуждение) 08:00, 13 марта 2018 (UTC)
На Commons правила именования нет, только рекомендация называть понятней. «RDCA» — англ. аббревиатура названия словаря. Такой формат точен. Но вряд ли подойдёт для страниц названных по-гречески. — Неудобства ввода, крайне мало у кого подключена греч. раскладка. К тому же, смысл писать название словаря на международном англ. теряется, тогда лучше по-русски «РСКД». Учтём, что для файлов там есть блок описания, где можно описать подробности, и ниже ссылки на страницы использования файла, где будет греч. название статьи. Порядок слов и пунктуация в названии условная, если нет особых предложений. --Vladis13 (обсуждение) 09:41, 13 марта 2018 (UTC)
Я файл так назвал только потому, что в commons:Category:Reallexikon des classischen Alterthums (russian edition)/Pictures все файлы названы таким образом, вот и подумал, что есть такая договорённость.
Только «RDCA» — это не английская аббревиатура названия словаря, а немецкая (т. е. языка оригинала). Эта «RDCA» меня тоже смутила тем, что в ней нет указания на то, что это русский перевод Reallexikon des classischen Alterthums.
@Vladis13:Так как вы считаете нужно переименовать commons:File:Vestis 1 (RDCA).png? Иллюстрации ЭЛ я называл по-англицки вот так: File:Aristotle in Pluchart's Encyclopedic Lexicon.png. В том же духе commons:File:Vestis 1 (RDCA).png мог бы именоваться, например «Men's chiton in the Russian translation of Lübkers Reallexikon des classischen Alterthums.png» Длинновато и громоздко получается. Можно сократить до «Men's chiton in RDCA-ru.png» -- Sergey kudryavtsev (обсуждение) 08:11, 14 марта 2018 (UTC)
Конечно лучше переименовать, если есть интерес к качеству на Commons. Не менее важны там тематическая категоризация и описание. С другой стороны, для нужд Викитеки и Википедии хватит и названия по статье. Тут вопрос времязатрат, какой проект приоритетней и интересней улучшать. Скобки в «(RDCA)» вводить неудобно, imho аббревиатуру лучше после запятой или «in». Длинное название вряд ли кому-то нужно. Последний ваш вариант компактней и понятен, буду использовать. Возможно правильней не «Men’s chiton», а просто «Сhiton» — в статье иллюстрация к хитону, который там описан как унисекс. Кстати, посмотрел, на Commons артикль в начале названий не употребляют. --Vladis13 (обсуждение) 09:53, 15 марта 2018 (UTC)
Хорошо, я тоже буду называть по типу «<Изображённый объект> in RDCA-ru.png». «Men’s chiton» я предложил потому, что хитоны носили и женщины. Причём большинство картинок в commons:Category:Chiton — именно женские хитоны (мода!), поэтому «Men’s chiton» повысит релевантность поиска по Викискладу. -- Sergey kudryavtsev (обсуждение) 11:31, 15 марта 2018 (UTC)

Хорошая новость. У меня pdf распознан с картинками, можно их сохранить. В словаре ~220 картинок всего, формат jpg. Залил их на Яндекс Диск. Было бы здорово их обработать. — Где-то повернуть, почистить и осветлить фон, там где они были рядом на странице то могли сохранится в одном файле — разделить. Хотя могу залить и сразу Commons --Vladis13 (обсуждение) 09:50, 14 марта 2018 (UTC)

По-моему, не стоит тратить на этот промежуточный этап силы — всё-равно вам придётся назначить каждой картинке человеческое название. Лучше уж сразу брать с dlib.rsl.ru, вручную профотошопить и загрузить. -- Sergey kudryavtsev (обсуждение) 12:21, 14 марта 2018 (UTC)

Сделал первые четыре картинки в РСКД/Vestis. По-моему, не плохо получилось. -- Sergey kudryavtsev (обсуждение) 14:08, 15 марта 2018 (UTC)

Выглядит хорошо! --Vladis13 (обсуждение) 15:43, 15 марта 2018 (UTC)
@Sergey kudryavtsev: в Vestis не загружено ещё 2 картинки. Загрузите? --Vladis13 (обсуждение) 13:08, 21 марта 2018 (UTC)
Я помню, загружу. Недавно сделал карты для РСКД/Megalopolis и РСКД/Megaris. В карте Мегалополя пришлось исправлять геометрические искажения, т.к. при сканировании бумага не плотно прилегала к стеклу. -- Sergey kudryavtsev (обсуждение) 13:19, 21 марта 2018 (UTC)
Как вариант, сравните картинки, которые я загрузил на хостинг чуть выше. FineReader исправил некоторые искажения. Мне кажется, что распознанная картинка заметно чётче, чем загруженная на Commons, и эта с этой. --Vladis13 (обсуждение) 13:31, 21 марта 2018 (UTC)
Возможно, вам нравится размытость, которую даёт формат jpg, и resample к бо́льшему размеру. Пусть другие решают, что лучше.
Картинки в РСКД/Vestis догрузил. -- Sergey kudryavtsev (обсуждение) 14:30, 21 марта 2018 (UTC)
Размытость мне не нравится... Иллюстрации с картами и мелкими надписями лучше загружать чёткими и читабельными, иначе нет смысла. Возможно, размытость не критична для картинок. --Vladis13 (обсуждение) 16:21, 21 марта 2018 (UTC)
Предлагаю попробовать для оформления новые шаблоны: {{ifloat}}, {{lfloat}}, {{rfloat}}. Они основаны на {{inline float}}, но удобнее в использовании, и позволяют размещать несколько (до 5) картинок в ряд по горизонтали. Переоформил ими РСКД/Vestis. — Lozman (talk) 20:28, 15 марта 2018 (UTC)

Описание иллюстраций на Commons[править]

Коллеги, небольшое пожелание. Если вы указываете на Викискладе, что автор неизвестен, ставьте лицензию не PD-OLD, а PD-RusEmpire. И ставьте пожалуйста ссылку в источник не такую, а такую, иначе проверяющий не сможет прокрутить книгу вверх и проверить, что год действительно 1885. Ratte (обсуждение) 12:05, 13 марта 2018 (UTC)

C PD-RusEmpire согласен, а вот ссылку вернул взад, поскольку файл скачивался именно по этому URL. А ссылка [8] в описании есть — с номера страницы. Возможно, указание номера страницы стоит перенести в параметр Source? -- Sergey kudryavtsev (обсуждение) 03:57, 14 марта 2018 (UTC)
Ну или так, да. Можно еще использовать шаблон Web source, с указанием параметров site, home, info и pic. Ratte (обсуждение) 06:11, 14 марта 2018 (UTC)
Тогда уж лучше commons:Template:Book — это же книга. Но так как картинок во всём словаре сотни, если не тысячи, на мой взгляд имеет смысл создать на commons специализированный шаблон а ля commons:Template:Illustratsiya_Magazine с параметрами: название статьи, страница книги, страница скана на dlib.rsl.ru и пр. Тогда и оформление будет единообразным, и впоследствии его одним махом можно будет поменять. -- Sergey kudryavtsev (обсуждение) 07:17, 14 марта 2018 (UTC)
Поддерживаю. --Vladis13 (обсуждение) 09:19, 14 марта 2018 (UTC)
Шаблон: commons:Template:RDCA. Пример: {{RDCA|description={{ru|1=скульптура Зевса}} |page= |url=https://dlib.rsl.ru/viewer/01003599381#?page=8 }}. --Vladis13 (обсуждение) 10:16, 15 марта 2018 (UTC)

Загрузка скана[править]

Прошу помочь загрузить скан словаря. Я уже раз 10 пытался, глючит наверное из-за медленного интернета. Ранее я его загружал, сделал индекс словаря, но обнаружил, что файл загрузился битым: нет стр. 165 скана, пропало OCR. (Текущий загруженный скан разбит на 4 части, имеет низкое разрешение, что делает его бесполезным.)

Файл размером 840 Мб, поэтому загружать его надо инструментом «chunked upload» (внизу раздела «История файла»). В окне загрузки выключить асинронный режим, согласно инструкции к скрипту (я загружал при вкл. этой опции, может поэтому плохо загрузилось). Тогда, как понимаю, файл будет загружен во временное хранилище commons:Special:UploadStash, откуда потом его можно будет опубликовывать. Если это не получится из-за размера, то по ссылке на инструкцию написано есть совет. --Vladis13 (обсуждение) 16:32, 13 марта 2018 (UTC)

А у вас открывается эта страница 165 с файла на ПК и из индекса? --Vladis13 (обсуждение) 21:38, 13 марта 2018 (UTC)
ПК: [9]. Индекс: [10]. Ratte (обсуждение) 21:46, 13 марта 2018 (UTC)
Нет, 165 страница скана, там полноразмерная картинка. --Vladis13 (обсуждение) 21:47, 13 марта 2018 (UTC)
Там где рис. 32, 33? На ПК открывается, в индексе пусто. Ratte (обсуждение) 22:05, 13 марта 2018 (UTC)
Спасибо за подтверждение. Написал разработчику. --Vladis13 (обсуждение) 04:53, 14 марта 2018 (UTC)
По-моему, это не файл битый, а Викисклад его нормально не может обработать из-за веса и кол-ва страниц. Лучше, наверное, на фабрикатор. Ratte (обсуждение) 06:13, 14 марта 2018 (UTC)
Максимальный размер файла на Commons - 4 Gb. Там пишется, что закачать такой файл можно именно через Chunked upload, через обычный загрузчик только до 100 Мб. --Vladis13 (обсуждение) 06:52, 14 марта 2018 (UTC)

Может быть, если такие сложности возникают, загрузить скан постранично? Способ я некогда описал здесь и как раз на примере скана с dlib.rsl.ru. Основной недостаток - отсутствие текстового слоя. Зато номер страницы может быть прямо в названии файла — не нужно никаких вычислений, чтобы получить ссылку в ПИ «Страница:». -- Sergey kudryavtsev (обсуждение) 07:07, 14 марта 2018 (UTC)

Нашел ещё, что можно делать запросы к администраторам на загрузку больших файлов: commons:Help:Server-side upload. Сделал запрос: phab:T189646. Там ещё есть вариант самому загружать через сервер файлы размером до 5 Гб, но там пароль нужен какой-то.
Если эти варианты не подойдут, придется отдельно странички загрузить. Надеюсь, сбойная только одна. --Vladis13 (обсуждение) 07:53, 14 марта 2018 (UTC)
На фабрикаторе сказали, что возможно та страница не грузится потому что двойная, картинка шириной на развороте двух страниц. Хотя перед этой страницей ещё две таких же. Других таких нет в pdf. Закачаю отдельно. --Vladis13 (обсуждение) 18:48, 14 марта 2018 (UTC)

Словники РСКД[править]

Почему в словниках РСКД не используется {{Статья в другом словнике}}? Из-за этого в первых и последних статьях по буквам нет ссылок. Чтобы в РСКД/Babrius появилась ссылка назад, я добавил вызов этого шаблона в начало РСКД/Словник/B, а заодно и в конец РСКД/Словник/A для РСКД/Azotus. -- Sergey kudryavtsev (обсуждение) 11:53, 23 марта 2018 (UTC)

Yes check.svg Сделано --Vladis13 (обсуждение) 15:20, 23 марта 2018 (UTC)
Спасибо. -- Sergey kudryavtsev (обсуждение) 05:20, 24 марта 2018 (UTC)

Викиссылки[править]

Сергей, я заметил, что вы меняете русские ссылки-перенаправления на текущие названия статей (пример). Это только с эстетической целью, или есть нюансы какой-то оптимизации? Сейчас везде массово стоят русские, поскольку словарь заливался с русскими названиями. Ещё нюанс, я добавляю именно русские ссылки не специально, а поскольку в панели редактирования есть архиполезнейший инструмент — кнопка «ссылка», в ней автопоиск по части слова, поэтому ссылки можно добавлять быстро и просто, но они на перенаправления. Если есть какой-то смысл в переименовании ссылок, то сравнительно просто написать скрипт бота для этого. Потом регулярно его запускать. Можно и по другим произведениям ВТ. --Vladis13 (обсуждение) 15:42, 23 марта 2018 (UTC)

Я просто считаю, что прямые ссылки лучше ссылок на перенаправления. Иногда встречаются просто неверные ссылки, например, со слова «Климена» на РСКД/Климен (РСКД/Clymenus) вместо РСКД/Климена (РСКД/Clymene) — это я тоже исправляю. Ещё я вставляю {{якорь}} и даю ссылку с #. -- Sergey kudryavtsev (обсуждение) 05:18, 24 марта 2018 (UTC)
Ошибочные ссылки могут дублироваться на других страницах. Желательно переходить по ним на целевую страницу и проверять список «Ссылки сюда». Например, вчера обнаружилось путаница в «Ссылки сюда» на РСКД/Корон, почти все должны были вести на РСКД/Коронея, либо на РСКД/Корона.
Есть смутная идея сделать список ссылок, для которых есть статьи|перенаправления с окончаниями, вроде: Климен - Климен[а], Корон - Корон[а|ея]. Но кажется таких будет слишком много и найти там ошибки будет проблемой. [UPD: так и оказалось,] --Vladis13 (обсуждение) 14:03, 28 марта 2018 (UTC)
Потом сделаю скрипт поиска всех красных ссылок. Быстрее будет просто просканировать файл дампа ВТ, чем парсить ботом. --Vladis13 (обсуждение) 14:03, 28 марта 2018 (UTC)

РСКД/Olympia[править]

Раздулся интервал и исчезла красная строка в начале статьи. Что-то нахимичили со вставкой изображений, нужно исправить. Ratte (обсуждение) 20:50, 23 марта 2018 (UTC)

@Vladis13: А почему вы даёте названия файлов без «in RDCA-ru» (commons:File:Map of Olimpia.jpg и commons:File:Plan of Hippodrom in Olimpia.jpg)? Договорились же... — Это неподписанное сообщение было добавлено Sergey kudryavtsev (обс · вклад

Забыл. Долго пытался идентифицировать картинку (нашёл только через поиск по картинке Яндекса, гугл не находил), т.ч. из головы вылетело. --Vladis13 (обсуждение) 11:27, 24 марта 2018 (UTC)
Бывает. Вот вам список иллюстраций (неполный) — Участник:Sergey kudryavtsev/РСКД#Картинки. -- Sergey kudryavtsev (обсуждение) 07:08, 28 марта 2018 (UTC)
Отлично, выглядит хорошо разработанным! А как можно применять список связанных элементов ВД? --Vladis13 (обсуждение) 13:43, 28 марта 2018 (UTC)
А как можно применять список связанных элементов ВД? — Поясните, что значит «применять» в этом контексте? -- Sergey kudryavtsev (обсуждение) 14:06, 28 марта 2018 (UTC)
Ну использовать. Речь про список связей, который вы привели ниже списка иллюстраций. --Vladis13 (обсуждение) 14:31, 28 марта 2018 (UTC)
Я его использую просто для наблюдения за ростом числа связей (пересечений тем в разных словарях). Например, сейчас число «Статьей ВЭ, связанных через Викиданные со статьёй РСКД» всего 27 — стало быть либо в РСКД мало связанных с Викиданными статей на военную тематику, либо в ВЭ мало связанных с Викиданными статей про античных полководцев.
Только учтите, что тег DynamicPageList ограничивает список 200 ссылками. -- Sergey kudryavtsev (обсуждение) 15:44, 28 марта 2018 (UTC)

РСКД/Список сокращений названий трудов античных авторов[править]

Не могу найти этот список обозначений в скане. На какой странице он находится? Дело в том, что там есть опечатка — Теогония Гесиода обозначена как «theolog.», а в статьях она встречается как «theog.» Хотелось бы посмотреть как там в скане. -- Sergey kudryavtsev (обсуждение) 07:06, 28 марта 2018 (UTC)

  • В скане нет. Видимо был на сайте-доноре. На сайтах подписан несуществующим изданием от 1914 года: [11][12], [13]-[14]. Есть вероятность, что был добавлен в современном переиздании. Если сканов нет и это фактологический список, то он не защищается АП, и можно исправлять свободно. --Vladis13 (обсуждение) 14:28, 28 марта 2018 (UTC)

Загрузка лучшего скана[править]

Скан на РГБ не имеет разбивки по страницам, там по 2 страницы на листе (размер 830Мб). Для ПИ Страница он не подходит.
Попытался в FineReader разбить на страницы в хорошем качестве (текущий залитый имеет утерю качества, ~850Мб). К сожалению лучше не получается, перепробовал все режимы, включая коррекцию скана (выравн. страниц и строк), и без неё.
— Если запрещать потерю качества изображений сканов и разрешения, то выходной pdf получается размером 3.6 Гб (3.5 ГБ без OCR-слоя), это слишком много. Если же разрешать потерю качества или сохранять в djvu, то размер тоже 500—900 Мб, но качество совсем плохое. К тому же, у многих pdf-читалок проблемы с открытием создаваемых фалов, пишут что испорчен или неподдерж.формат.
Т. е. текущий залитый скан — это лучшее. Но тоже с проблемами — часть изображений грузится медленно, часть не грузится.
Может надумаю перезалить текст в ПИ Страница по нему. При этом стоит оставить ссылки на РГБ в шапках статей (на лучший скан), если это возможно. --Vladis13 (обсуждение) 02:11, 3 октября 2018 (UTC)

@Vladis13: ИХМО, FineReader применять как графический редактор весьма перпендикулярно. Предлагаю выгрузить скан постранчно (прямой URL на изображение страницы есть в Участник:Sergey kudryavtsev/Сканы постранично), разрезать средствами автоматизации Photoshop'а, сохраняя левую и правую части страницы, скажем, в PNG. Затем постранично загрузить на Викисклад. Сгенерировать список страниц (см. скрипт create_index.js, там же) и сделать индекс. Только вот текстовый слой не добавить. -- Sergey kudryavtsev (обсуждение) 04:04, 5 октября 2018 (UTC)
Любопытная идея, попробую, спасибо. С постраничными изображениями возиться и загружать не хотелось бы, там 1500 страниц... Попробую сначала разбить постраничено в файлы изображений, а потом в других программах склеить в pdf. --Vladis13 (обсуждение) 05:13, 5 октября 2018 (UTC)
Upd: Если сохраняю страницы как изображения в формате TIFF (сжатие без потерь), получаются по 3.5 Мб, * 1500 страниц = 6Гб. Даже хуже чем pdf на 3.5 Гб. Если же сохранять с потерей качества (JPEG), получится как pdf или djvu того же размера с утерей качества. Если же не упаковывать в pdf, а отдельными картинками заливать, то видимо получится тоже самое, только с массой возни с 1500 файлов. Т.ч. увы, смысла не имеет. --Vladis13 (обсуждение) 08:02, 5 октября 2018 (UTC)