Обсуждение Викитеки:Проект:ВЭ

Материал из Викитеки — свободной библиотеки
Перейти к навигации Перейти к поиску

Обсуждение проекта[править]

М.б. сюда перенести обсуждение из форума? Hinote (обсуждение) 14:26, 10 сентября 2014 (UTC)

Перенесено со страницы ВТ:Ф
Поскольку издание прекращено в 1915 году, то, вероятно, да. Другое дело, что это — последнее из нескольких (двух или трех) изданий этой энциклопедии, что следует учитывать при размещении. Кажется, сканы всех изданий есть на Руниверсе. — Lozman (talk) 09:36, 28 августа 2014 (UTC)
Уточнил, все три издания выходили под разными названиями: 1) Военный энциклопедический лексикон: В 14 т. — СПб.: Тип. штаба военно-учебных заведений, 1852—1858. 2) Энциклопедия военных и морских наук: В 8 т. — СПб.: Тип. В. Безобразова и Комп., 1883—1897. 3) Военная энциклопедия: В 18 т. — СПб.: Тип. Т-ва И. Д. Сытина, 1911—1915. — Т. е. можно размещать по отдельности каждое. — Lozman (talk) 09:51, 28 августа 2014 (UTC)
Издано до революции -- значит, свободно (сканы всех вышедших томов есть и на РГБ [издание не было окончено]). Но, вроде как, в Википедии это издание идет отдельно от военного лексикона: см. w:Военная энциклопедия Сытина и w:Военный энциклопедический лексикон. В Викитеке есть страница Военный энциклопедический лексикон. -- Badger M. (обсуждение) 10:03, 28 августа 2014 (UTC)
  • Коли свободно, может ботом её к нам? Потрясающе интересно. А я ботом не умею(( --S, AV 11:47, 28 августа 2014 (UTC)
Имхо, полезно было бы создать соотв. страницу в Викитеке с ссылками на сканы из РГБ (и другие, если они есть). А закачивать тексты -- это уже, на мой взгляд, факультативно. -- Badger M. (обсуждение) 22:23, 28 августа 2014 (UTC)
Страницу создать, разумеется, необходимо. И не только страницу, но еще и словники, шаблон заголовка и т. д., а потом уже приступать к заливке ботом. Но сама идея перспективная, я постараюсь заняться, если будет время. — Lozman (talk) 09:45, 29 августа 2014 (UTC)
Дабы заинтересовать - ответственно заявляю, что до революции про военное дело нет и не было источника способного хоть отдалённо конкурировать с сим. Буду ждать) --S, AV 21:02, 30 августа 2014 (UTC)
Список статей, по одному названию статьи на строке, 9122 названий (а не 9153, как указано на сайте-источнике; пока не понял почему...), отсортировано... Можно делать словники (не совпадающие по разбиению с теми, которые на сайте-источнике, естественно, ибо АП составителей). Соответственно, есть архив со статьями (~65Мб)... Hinote (обсуждение) 23:49, 2 сентября 2014 (UTC)
Разобрался почему расхождение в кол-ве названий статей, добавил дубликаты. Теперь список правильный, полный, можно делать словники... Hinote (обсуждение) 13:59, 3 сентября 2014 (UTC)
Почти готово (перевод html --> wiki-синтаксис всех статей, регулярными выражениями), скоро буду готов заливать. Hinote (обсуждение) 21:40, 8 сентября 2014 (UTC)
Создана "точка входа": Военная энциклопедия Сытина, Военная энциклопедия (Сытин, 1911—1915). Hinote (обсуждение) 22:50, 3 сентября 2014 (UTC)

Скачиваю с РГБ, собираюсь распознать и залить на склад. — VadimVMog (обсуждение) 06:53, 9 сентября 2014 (UTC)

Вадим, не забудьте Проспект. (а м.б. с него и начать?) Он небольшой, его текста нет среди массива статей, в нём есть список авторов. Hinote (обсуждение) 01:09, 10 сентября 2014 (UTC)
Сделал индекс Проспекта. Не уверен, что правильно указал для этой энциклопедии категории на складе. — VadimVMog (обсуждение) 11:39, 10 сентября 2014 (UTC)
Сделал индекс первого тома. В скане нет страниц 224, 225. Как быть с иллюстрациями? Их много, и кто-то должен обработать их все в графическом редакторе и поместить на склад в категорию commons:Category:Military Encyclopedia. Vol. 1 (Saint Petersburg,1911—1914). Я выну их из pdf-файла и помещу на файлообменник. — VadimVMog (обсуждение) 09:48, 11 сентября 2014 (UTC)
Вадим, не торопитесь тут с картинками, я хочу попробовать этот процесс автоматизировать (подсмотрел кое-что в en.wikisource)... Hinote (обсуждение) 10:11, 11 сентября 2014 (UTC)
Успел вытащить несколько иллюстраций. На всякий случай кладу сюда. — VadimVMog (обсуждение) 11:25, 11 сентября 2014 (UTC)

Заинтересованные участники, посмотрите на примеры статей. Характерный пример: Участник:Hinote/Песочница/ВЭ/Линейный корабль (кросс-ссылки, таблицы, достаточно длинный текст). Остальные -- см. подстраницы Участник:Hinote/Песочница/ВЭ. Картинки надо будет размещать отдельно (возможно из pdf-издания).
В таком состоянии готовы все статьи (>9000)...
Могу ВАР2 сразу вставить (если бы был деятификатор на LUA -- мог бы и второй параметр ВАР2 перевести в СО сразу при заливке при помощи шаблона с subst:, но у нас деятификатор в JS и не понятно, как его кнопку "нажимать" ботом)...
Или в таком виде оставить?
Статьи деятифицированы локально, до заливки; соединены с шаблоном ВАР2 части ДО и СО.

  • Залил в те же тестовые статьи (см. подстраницы Участник:Hinote/Песочница/ВЭ обработанные варианты с шаблоном ВАР2 и частями в ДО и СО). Так могут выглядеть все статьи, если нет возражений\пожеланий еще по оформлению... Hinote (обсуждение) 16:16, 12 сентября 2014 (UTC)

Подожду пока идей/откликов, прежде чем заливать (править массово локально проще, чем потом). Hinote (обсуждение) 22:45, 9 сентября 2014 (UTC)

  • М.б. перенести дальнейшее обсуждение работ и статуса проекта в, например, Обсуждение_Викитеки:Проект:ВЭ (страница обсуждения страницы проекта) или на самой странице проекта? Администрация, может быть перенести содержимое этой темы туда, а здесь оставить уведомление о переносе? Hinote (обсуждение) 14:28, 10 сентября 2014 (UTC)

Сравнил изготовленные мной djvu-файлы первого и второго томов с оригинальными pdf-файлами с РГБ и выяснил, что djvu-файлы в данном случае хуже и по качеству распознавания и по изображению страниц. Единственный выигрыш получается в размере файлов, но 150 мегабайт на файл — это не так страшно. Поэтому намереваюсь загрузить на склад pdf-файлы с РГБ. — VadimVMog (обсуждение) 04:22, 15 сентября 2014 (UTC)

Странно… Склад не принимает файлы из-за размера.

This file is bigger than the server is configured to allow

VadimVMog (обсуждение) 04:44, 15 сентября 2014 (UTC)

  • А если включить настройку "Разбить на части загрузку файлов свыше 5 МБ в Мастере загрузок"? Hinote (обсуждение) 05:57, 15 сентября 2014 (UTC)
    Не знаю, действует ли это на ограничение максимального размера. Я когда-то находил упоминание о том, что загрузка файлов свыше 100 Мб возможна только при использовании специальных загрузчиков (типа Vicuña или Commonist). — Lozman (talk) 07:19, 15 сентября 2014 (UTC)
    См. commons:Commons:Maximum file size: Ограничение на обычную закачку 100МБ, на закачку с включенной экспериментальной опцией chunked uploads -- 1ГБ, через server-side uploads -- размер технически не ограничен. Hinote (обсуждение) 07:55, 15 сентября 2014 (UTC)
    Да, спасибо, кусками по 5 Мб загружает, хоть и приходится делать несколько попыток — часто не хочет загружать, выдаёт какие-то ошибки. — VadimVMog (обсуждение) 11:23, 15 сентября 2014 (UTC)
    Первый том загрузил, второй не удалось — несколько часов пытался. Выдаёт «unknown error». Нужно бы обратиться к администраторам Викисклада, только где их искать? — VadimVMog (обсуждение) 14:33, 15 сентября 2014 (UTC)
    Обратился за помощью к commons:User:Billinghurst. Подождём. — VadimVMog (обсуждение) 05:18, 16 сентября 2014 (UTC)
    Получил ответ и понял, что неправильно обратился. Здесь описано, как загрузить. Для этого нужен сервер, на который нужно положить файлы pdf. Оттуда они будут загружены на Викисклад. Сможет кто-либо из участников на время положить на свой сервер эти файлы? — VadimVMog (обсуждение) 15:22, 17 сентября 2014 (UTC)
    Вадим, а там внизу описано, как использовать Google Drive для server-side upload... (Странно, что у вас не работает chunked uploads -- я в свое время с этой опцией перезалил тома ПСЗРИ, которые тоже больше 100МБ были, все успешно. А другим браузером пробовали?) Hinote (обсуждение) 21:25, 17 сентября 2014 (UTC)
    Пробовал Firefox и Chrome. — VadimVMog (обсуждение) 03:21, 18 сентября 2014 (UTC) P.S. Может тогда загрузите на склад? Чем возиться с server-side upload... — VadimVMog (обсуждение) 04:06, 18 сентября 2014 (UTC)
    У вас же свои версии pdf, с новым OCR-слоем, не те, которые на РГБ? Бросайте архив куда-нибудь, позагружаю... Hinote (обсуждение) 10:38, 18 сентября 2014 (UTC)
    Нет, нет, я сравнил OCR-слой pdf с РГБ с тем, что дал мой FineReader, — особой разницы нет, может быть, на РГБ OCR чуть лучше. Так что я загрузил первый том с РГБ. — VadimVMog (обсуждение) 15:48, 18 сентября 2014 (UTC)
    Скачал остальные тома с РГБ, займусь заливанием. Себе в TODO. Hinote (обсуждение) 20:13, 20 сентября 2014 (UTC)

Замечания[править]

1. По способу заливки: мне он представляется ненужным умножением сущностей. Зачем заливать оба текста на страницу СО с помощью шаблона ВАР, чтобы потом вытаскивать вариант ДО через включение? Почему не заливать каждый вариант на свою страницу? Механизм включения — замечательная вещь, но здесь его использование выглядит избыточным. Шаблон ВАР преимущественно, если не исключительно, предназначен для использования в пространстве имен Страница, да и там его необходимость под вопросом.

2. По именованию страниц: раз уж мы идем к внедрению системы редакций, будет неосмотрительно заливать 18 тысяч страниц, поименованных по старой системе, чтобы впоследствии их героически переименовывать. Предлагаю сразу начинать работать в соответствии с новой схемой (вероятно, вначале потребуется добавить какое-то количество статей вручную, чтобы убедиться в том, что все работает как надо). Предлагаю именовать так:

3. По общему оформлению: <div class='text'>, разумеется, будет добавляться в самом шаблоне. Шаблон я постараюсь сделать в ближайшее время по аналогии с другими энциклопедическими изданиями. — Lozman (talk) 20:31, 12 сентября 2014 (UTC)

  • По п.1 (заливка с ВАР или ВАР2 в одной странице) -- да, это я понял уже, что вроде не надо так, когда залил и посмотрел на результат... (Не попробуешь -- не увидишь). Однако, если говорить о плюсах и минусах, есть у такого варианта (с ВАР/ВАР2) и обоими текстами в одной странице и преимущество: мне кажется, исправлять ошибки и вносить синхонно изменения в оформление (таблицы, картинки) удобнее, имея оба текста на одной странице, т.е. в ВАР/ВАР2. Однако, я не настаиваю, как я сказал -- посмотрев на залитый тестовый вариант, он мне и самому не очень понравился -- важнее обсудить варианты, плюсы и минусы, и выбрать наилучший.
  • По п.2, несколько вопросов:
    • всё-таки ВТ, а не СО в качестве маркера варианта? СО -- для статей, у которых есть сторонний, не наш СО-вариант (т.е. для ВЭ если будет найдено стороннее издание в СО, из которого можно будет разместить здесь статьи), а наши варианты -- с маркером ВТ, так? Надо как-то правило сформулировать, когда используется ВТ, а когда СО... (м.б. потому что СО более привычно...)
    • страница ВЭ/ДОВоенная энциклопедия (Сытин, 1911—1915)/ДО) (описание в ДО) -- а надо ли ее вообще делать? Это же не статья-оригинал в ДО. Мы все равно без ошибок ее не напишем, это будет, по мне, излишнее умничание. Просто страница описания должна ссылаться и на ВТ-статьи и на ДО-статьи (и на словники в СО и в ДО, если будут отдельные словники в ДО с оригинальным порядком статей и их именованием в ДО). А также, если будет отдельно размещена редакционная вступительная статья и статья из Проспекта -- то на их варианты и в ДО и в СО (возможно с шаблоном ЕДО или 2О). А делать свою страницу с текстом в ДО -- имхо ни к чему...
    • по п.2 еще вопросы, по именованию: почему не ВЭ/Имя статьи (ВТ), ВЭ/Имя статьи (ДО)? Или ВЭ/Имя статьи/ВТ, ВЭ/Имя статьи/ДО? Если последнее, то есть еще место для страницы ВЭ/Имя статьи, которая есть список ссылок на варианты -- т.е. на свои подстраницы ВЭ/Имя статьи/ВТ, ВЭ/Имя статьи/ДО... Соотв., тут есть еще вариации каждой из этих схем именования с отдельным "корнем" для ДО и СО -- т.е. страницами ВЭ/ВТ и ВЭ/ДО или ВЭ (ВТ)/ и ВЭ (ДО)/, из каждой из которых "растут" статьи (Т.е. статьи вида ВЭ/ДО/Имя статьи/ДО или ВЭ (ДО)/Имя статьи (ДО)...)
  • По п. 3: Я, на самом деле, на вас тут и надеюсь, в части шапки. Разумеется, никаких div в тексте статей быть не должно, я добавил в тестовую статью для того, чтобы визуально посмотреть на оформление с div.

(Я вообще считаю, что надо это сделать в самом генерализованном шаблоне Отексте, или в шаблоне Документы, чтобы все тексты были в оформлении div class=text. Для тех немногих текстов, где нужно "выходить" за границы текстовых колонок (широкие таблицы, широкие иллюстрации) можно сделать, скажем, шаблон Отексте2, в котором div'а не будет и для этих немногих текстов его надо будет в нужных местах проставлять явно... Смысл в том, чтобы принять правило-консенсус, по которому все неслужебные тексты (т.е. страницы с Отексте) должны быть оформлены с class=text или аналогичным с полями и с выравниванием justified...)

  • Еще по п.3, про словники: я вообще правильно делаю, что занялся переделкой словников из текущих в словники по ~250 слов? Т.к. все равно по словнику на том не получится сделать, т.к. граница тома не проходит по букве и порядок слов в СО и ДО разный... Hinote (обсуждение) 15:11, 14 сентября 2014 (UTC)
  • Маркер СО подразумевает, что мы имеем дело с текстом в СО, опубликованным в каком-то авторитетном издании (за орфографию отвечают они). ВТ означает, что текст был либо приведен к такому виду участниками Викитеки (обычная деятификация, точнее, я бы ее называл нормализацией орфографии), либо взят в таком виде из какого-то неавторитетного источника (в этом случае за орфографию все равно отвечаем мы: можем и должны ее проверять и при необходимости исправлять).
  • Заглавная страница в ДО нужна исключительно для полноты редакции. Смысл в том, что каждая редакция должна содержать полный комплект необходимых страниц, т. е. быть полностью автономной. Иногда это избыточно, да. В частности, нет необходимости делать полное описание в ДО, если это описание делаем мы сами: достаточно дать ссылку с ДО на страницу с описанием. Или еще лучше: поместить описание, как и всякую отсебятину, на страницу со списком редакций (Военная энциклопедия (Сытин, 1911—1915)). Тогда сразу отпадет вопрос с его дублированием.
  • Именование статей рассматривается в контексте новой системы именования редакций. В ходе предшествующего обсуждения мы договорились помещать обозначение редакции с маркером ДО/СО/ВТ (или просто маркер в сокращенном обозначении — для словарных статей) в первом уровне вложения подстраниц, т. е. Название_страницы/Редакция_(Маркер)/Подстраницы (для обычных страниц) или Префикс/Маркер/Название_статьи (для словарных статей). Другие способы мне представляются менее удачными по следующим соображениям:
    • Добавление маркера к корневому элементу — например, ВЭ (ДО) — могло бы быть уместно для словарных статей, но названия обычных страниц и так уже перегружены разными суффиксами вроде фамилий авторов/переводчиков и пр., а применение для этих случаев двух разных механизмов я счел ненужным усложнением. К тому же при данном способе каждая редакция получает свой корневой элемент и существует как бы независимо от других, т.е вместо двух редакций получаем два разных издания;
    • Добавление маркера в качестве последнего уровня подстраниц потребует создания дизамбига типа ВЭ/Статья для каждой пары ВЭ/Статья/ДО + ВЭ/Статья/ВТ (для всех 9000 пар), иначе структура подстраниц просто рассыпается и теряет смысл. Но и в этом случае полноценная структура подстраниц будет только у виртуальной «редакции», состоящей из дизамбигов, а полноценных редакций ДО и ВТ мы не получим;
    • Добавление маркера непосредственно к имени статьи — ВЭ/Статья (ДО) — приведет к смешению обеих редакций на одном уровне вложения подстраниц, т. е. ВЭ/Статья (ДО) и ВЭ/Статья (ВТ) — две разные статьи ВЭ, но не обязательно из двух разных редакций. Таким образом: способ ВЭ/ДО/Статья — единственный, при котором редакции достаточно четко разделены, но не оторваны друг от друга.
  • Глобальное применение class=text через шаблон Отексте — вещь заманчивая, но это тема для отдельного обсуждения сообществом, здесь необходим консенсус. Думаю, это нужно выносить на Форум.
  • Разбиение словника на секции меньшего размера, чем том — вещь вполне обычная, как правило, я так и поступаю (хотя в случае с ВЭ среднее количество статей на том должно быть около 500? Это не очень много). Нужно ли менять порядок статей на алфавитный в СО? Это вопрос философский, боюсь, никакой ответ на него не будет 100 % удовлетворительным. Раньше я считал, что это имеет смысл: по этому принципу составлены, например, словники ЭСБЕ. Но с некоторых пор я пришел к убеждению, что произвольное изменение оригинального порядка статей — вещь не очень желательная, в чем-то даже граничащая с ОРИССом. Дело в том, что само понятие «алфавитного порядка сортировки» слишком неопределенно: сортировать ли раздельно верхний и нижний регистр? латиницу и кириллицу? учитывать ли при сортировке пробелы и пунктуацию? и т. д. Получается, что любое изменение порядка сортировки — уже редакторский произвол с нашей стороны. К тому же алфавитная сортировка используется в категориях, не нужно ее дублировать в словнике. Если же порядок статей в словнике СО сильно отличается от строго алфавитного, можно на этот случай предусмотреть какое-то примечание о том, что порядок статей соответствует дореволюционному изданию, а алфавитный список находится в категории. «По-моему, так!» :) — Lozman (talk) 11:58, 15 сентября 2014 (UTC)
Про схему именования -- полностью понятно и полностью согласен. Вы исходите из того, чтобы 1) для статей одной редакции иметь общий корень (ВЭ/ВТ/, ВЭ/ДО/), 2) все редакции -- тоже иметь под одним корнем (ВЭ/), 3) у любой статьи (и у прочих страниц, которые не являются статьями из издания, но присутствуют в проекте) в названии иметь ровно один маркер редакции (т.е. не ВЭ/ВТ/Статья/ВТ, например) -- все логично...
Залил в качестве примера на "штатные" места (не в свою песочницу, а в ВЭ/ВТ/, ВЭ/ДО/) статьи на букву Е ("короткая буква", 82 статьи). Посмотрите плз (и других участников, естественно, тоже приглашаю), все ли ок. Список на эту букву -- см. словники 09 и 10. Если посмотреть на словники и на цвет статей на эту букву -- видно, что у меня пропало несколько статей, что-то в них было не так, как у остальных оформлено, и они исключились где-то у меня в процессе трансформации из html в вики-синтаксис. Это не страшно, таких статей немного на весь набор статей в издании, буду потом отдельно с ними разбираться...
Присвойте плз, боту статус бота. Я, собственно, этого и ждал для возобновления тестовой (полутестовой -- буква Е уже в "штатном" режиме) заливки...
Сделайте плз, для шапки, чтобы добавлялся тег div и его закрывающий (это надо, как я понимаю, делать где-то "глубоко" в модуле...)
Жду "отмашку" на заливку остальных статей, если нет замечаний... Hinote (обсуждение) 22:41, 7 октября 2014 (UTC)

Названия статей[править]

  • "Абиссино-италианская война 1895—96 гг." -- м.б. "Абиссино-италиянская война 1895—96 гг."? Вряд ли авторы хотели звучать архаично, это было современное на то время издание. Hinote (обсуждение) 23:45, 10 октября 2014 (UTC)
    Италиянская тоже звучит архаично, только с более просторечным оттенком. К тому же, 100 лет назад эта форма уже была архаичной, а итальянская — вполне нормативной. Лучше оставить как есть. — Lozman (talk) 11:55, 25 октября 2014 (UTC)
    Конечно же, я имел в виду (тогда, когда писал выше) современное название -- "итальянская". Сам запутался в вариантах написания, придумать можно их много. Сейчас, когда посмотрел ближе и больше на названия статей, считаю, что чем ближе к оригиналу, тем лучше, да. Hinote (обсуждение) 01:24, 27 октября 2014 (UTC)
  • "Авганистан" --> "Афганистан"? Вычеркнул, т.к. посмотрел и увидел, что это -- и так отсылка на принятое ныне название Афганистан. Hinote (обсуждение) 21:36, 12 октября 2014 (UTC)
  • "Адербейджан" --> "Азербайджан"? Вычеркнул, т.к. решил, что это слишком сильное изменение оригинального текста. Можно рассмотреть переименование в "Адербейджан (Азербейджан)" -- ведь вроде именно этот текст в начале статьи выделен как ее название... Hinote (обсуждение) 21:36, 12 октября 2014 (UTC)
  • "Антисептика" -- интересно, почему не переименовали в "Антисептика и Асептика" или в "Антисептика и асептика"? Hinote (обсуждение) 16:46, 12 октября 2014 (UTC)
    Вероятно, стоит переименовать. Таких случаев немало, я некоторые желательные переименования указывал в комментариях. — Lozman (talk) 11:55, 25 октября 2014 (UTC)
  • "Б (Blanc) порох" -- м.б. перенести ее на оригинальное место, в словник 05? Hinote (обсуждение) 22:12, 12 октября 2014 (UTC)
  • "Меркатор (Гергард Кремер)" -- м.б. просто "Меркатор"? Hinote (обсуждение) 17:49, 24 октября 2014 (UTC)
    В статье указан именно так. Впрочем, не принципиально, можно и без уточнения. — Lozman (talk) 11:55, 25 октября 2014 (UTC)
  • «Лаксодромия» — в тексте печатного издания набрано именно так, и по алфавиту помещено соответственно. Неясно, что это: устаревшее написание или изначальная ошибка? Если второе, то стоит переименовать. — Lozman (talk) 10:21, 27 октября 2014 (UTC)
    Я думаю, надо оставить (точнее -- наоборот, поменять; в словнике оставить, а в названии статьи и в ее тексте -- вернуть к печатному изданию) как в печатном тексте. Такое написание (неправильное с точки зрения современных норм) встречается и сейчас. Но -- именно так написано в печатном источнике, через "а". Я не знаю, почему оно было осовременено, изменено в тексте статьи (это не моя корректива и я не настаиваю на современном написании), надо все-таки ближе к печатному тексту. Hinote (обсуждение) 16:03, 27 октября 2014 (UTC)
  • Надо "нормализовать", так сказать, написания названий полков -- чтобы в сложных их названиях (вида Такойто, NN-ый, такого-то такого-то, полк) везде были части разделены запятыми. Кое-где вы забыли запятые при подготовке словника (если посмотреть на печатное издание, то запятые есть; никакой тут проблемы нет -- просто корректива при вычитке), а еще кое-где -- пропущены в издании, в первых томах -- наверное, у издателей вначале тут не было консенсуса по написанию, он появился в процессе выпуска томов издания, а вначале был некоторый разнобой... В таких местах можно оформить добавленную запятую шаблоном Опечатка или Опечатка2 (в варианте ДО), а в СО, соотв. с исправленным -- просто добавить. Согласны? Hinote (обсуждение) 16:10, 27 октября 2014 (UTC)
  • По поводу компьютерных апострофов в названиях '-- все они д.б. изменены на типографские. Так? Hinote (обсуждение) 16:10, 27 октября 2014 (UTC)

Заливка[править]

  • Заливаю по буквам (так мне удобнее), перед заливкой применяя изменения статей, которые были сделаны в словниках (и которые помечены в словниках как статьи с измененным названием).
  • Некоторые страницы отсутствуют, "пропали" из моего набора -- это нормально, я это знаю, знаю примерное их число. Просто, такие статьи были оформлены не так, как остальные, и какой-то очередной grep или sed при преобразованиях их пропустил. С такими статьями буду разбираться отдельно потом -- у меня есть полный набор страниц, где должны быть и эти, пропущенные страницы.
  • Некоторые статьи в словниках после заливки остаются красными не по предыдущей причине, а из-за того, что в словниках название было изменено, но не помечено как измененное. Надо такие залитые статьи найти и переименовать. Кстати, Lozman -- а как вы находите такие статьи, которые были залиты, но на которые нет ссылок из словников -- методом пристального всматривания или же есть какой-нибудь инструмент?
  • pywikibot падает на некоторых страницах, в которых ему не нравится название -- например, nobr в названии страницы между годом и "г." или "гг.", вставленный викификацией. Такие страницы нахожу и исправляю вручную для заливки все-равно потом ботом.
  • ... Hinote (обсуждение) 11:41, 22 октября 2014 (UTC)
    Страницы, на которые нет ссылок из словников, генерируют ошибку Lua и по этой причине попадают в категорию Страницы с ошибками скриптов, там я их и отлавливаю. Странно, мне казалось, что я все или почти все переименованные статьи пометил в словнике («переименован» в комментарии). Может, где-то и пропустил. В названиях статей в качестве пробела допускается только обычный U+0020, никаких nbsp и т. п. Кстати, что-то сегодня глючит движок МедиаВики, в некоторых статьях забывает закрывать незакрытые секции, из-за этого все навигационные элементы оказываются внутри страницы. Не знаю, в чем тут дело, раньше я такого не замечал. — Lozman (talk) 11:56, 22 октября 2014 (UTC)
    "Страницы, на которые нет ссылок из словников, генерируют ошибку Lua" -- ошибки это, конечно, нехорошо, но здесь -- удобно получилось. "Странно, мне казалось, что я все или почти все переименованные статьи пометил в словнике («переименован» в комментарии)" -- Титаническую работу проделали, титаническую. Респект. ;-) "В названиях статей в качестве пробела допускается только обычный U+0020, никаких nbsp и т. п." -- смотрите, какая штука: в названиях страниц то да, не может быть; а вот в тексте словника, в ссылке на статью, может быть (например, в результате викификации) написано [[название&ampersand;nbsp;статьи]] (с обычным Unicode-символом nbsp, подставляемым викификатором), в html-ссылке действительно при этом nbsp меняется движком на обычный пробел; но, если это название было изменено -- то я его переношу, как новое название, в title статьи при заливке; и вот здесь pywikibot падает; может я конечно и ошибаюсь по поводу nbsp, что они там были, но 2 такие статьи "прошли" после того, как я поправил руками пробелы (стер и набрал пробел) в названии... Может просто совпадение, другие статьи некоторые тоже не проходят в заливке с первого раза (таймауты от серверов ВТ, наверное), запускаю для верности без перезаписи существующих статей 2-3 раза, но эти статьи не проходили раз 5, пока я вот так не поправил пробелы в названии. Может просто совпадение... Hinote (обсуждение) 20:38, 22 октября 2014 (UTC)

Последняя буква (П) залита. Также, нашел и подготовил забытые статьи (120 штук х 2 редакции -- действительно, у них было отличие в оформлении, из-за чего они отвалились у меня из общего набора статей, из-за большого кол-ва статей и особенностей обработки скачанного материала, я это не заметил в то время...). Hinote (обсуждение) 18:48, 26 октября 2014 (UTC)

Lozman -- переименуйте, наверное, до конца те статьи из "большой" заливки в предназначенные им названия (лучше это сделать, наверное, вам -- от меня остаются ссылки, опции для переименования без оставления ссылки я не вижу, возможно каких-то прав не хватает) -- и я запущу заливку потерянных статей. Hinote (обсуждение) 18:48, 26 октября 2014 (UTC)

После дозакачки потерянных, осталось в словниках красными 3 статьи ("Буркерсдорф", "Баден-Поуэль, Роберт Стефенсон Смис", и "Девятая сибирская..."). Первые 2 у меня есть (наверное еще один вид оформления), а вот последнюю не нашел у себя, странно... Hinote (обсуждение) 23:31, 26 октября 2014 (UTC)

Ее и в словнике не было. Добавил по скану. — Lozman (talk) 00:28, 27 октября 2014 (UTC)
Итого, "Баден-Поуэль..." -- залил вручную, лень было скриптами ворошить, "Буркерсдорф" -- была "слеплена" с предыдущей статьей "Бурка", "Девятая сибирская..." -- вы залили вручную. Итого, все статьи залиты (осталось посмотреть имена оставшихся по-моему 3-х статей в категории с ошибками). Yes check.svg Сделано Поздравляю! Hinote (обсуждение) 20:02, 27 октября 2014 (UTC)

Ссылки между ВЭ и ЭСБЕ не работают[править]

В {{ЭСБЕ}} нет параметра для Военной энциклопедии, а в {{ВЭ}} параметры ЭСБЕ и МЭСБЕ есть, но не работают. Пример: ВЭ/ВТ/Аарау, ЭСБЕ/Аарау и МЭСБЕ/Аарау. --- Sergey kudryavtsev (обсуждение) 12:32, 22 октября 2014 (UTC)

Сделал. Ссылка со статей в СО указывает на статьи ВЭ/ВТ/…, а со статей в ДО — на ВЭ/ДО/… (см., например, ЭСБЕ/Аарау/ДО). — Lozman (talk) 11:57, 25 октября 2014 (UTC)

Дальнейшее оформление статей[править]

  • Викификация -- наверное, не нужно тратить силы и ходить для этого по всем страницам, я сделаю LUA-версию викификатора, который можно будет вызывать из subst-шаблона, и тем самым сделать викификацию всех страниц ботом оптом... Как вам такая идея? Hinote (обсуждение) 14:51, 22 октября 2014 (UTC)
  • Иллюстрации -- опять-таки, призываю пока их не размещать в commons -- сделаю хелпер (видел у кого-то в en.wikisource, надо только вспомнить где именно ;-) ), который будет облегчать импорт сканов страниц из pdf или djvu и загрузку их на commons уже с заполненными полями... Hinote (обсуждение) 14:51, 22 октября 2014 (UTC)

Дальнейшее (картинки, пр.)[править]

  • Картинки. Могу попробовать выкачать (и залить на коммонс) готовые картинки с сопутствующей информацией. А именно: сама картинка, ее подпись, статья, к которой она принадлежит. Тома и номера страницы при этом не будет (но том и интервал страниц можно потом отдельно взять из словника по названию статьи...). Либо, можно ходить по страницам djvu или pdf сканов и заливать картинки на коммонс, вырезая их из изображений сканов страниц заново. Использование готовых картинок мне представляется более перспективным (качество у них вроде бы нормальное). Жалко, что нет информации о страницах -- нельзя будет при заливке на коммонс использовать номера страниц в имени файлов картинок. Вопрос, как называть картинки при заливке на коммонс, если использовать готовые... Для начала же, надо попробовать их выкачать с сопутствующей информацией (подписи, название статьи) Hinote (обсуждение) 01:04, 27 октября 2014 (UTC)
    5899 картинок доступно (причем из них для тома 15 -- 1 шт, для тома 18 -- 0 шт, т.е. не все; м.б. опять отличается оформление и я не все нашел; м.б. для этих томов их просто нет). Вопрос: что с этим делать? Hinote (обсуждение) 22:58, 28 октября 2014 (UTC)
  • "при чём" почти везде --> "причём" (но не везде). Подумать, как это автоматизировать... Hinote (обсуждение) 16:26, 28 октября 2014 (UTC)
    • могу ботом поменять везде, потом надо будет вручную менять там, где нужно другое написание. Это может быть выгодно, если слов со слитным написанием должно быть больше, чем слов с раздельным (вроде бы так и есть) Hinote (обсуждение) 18:22, 8 ноября 2014 (UTC)
    • А как считать, где больше? Ain92 (обсуждение) 18:51, 8 ноября 2014 (UTC)
      • Ну, разве что "методом пристального всматривания" ;-)), или м.б. по статистике языка... Вроде употребления написания "причем" намного больше, чем "при чем"... Hinote (обсуждение) 19:06, 8 ноября 2014 (UTC)

Акут и Гравис[править]

Обнаружил в статье Абордаж с современной орфографией гравис в слове «ворон». В СО может быть только Акут. Думаю таких статей не мало, и следует все включения грависа в СО-статьях ботом заменить на акут.--Silberrus (обсуждение) 17:54, 30 октября 2015 (UTC)

  • Согласен. Я такие вещи при конвертации из ДО в СО не конвертил. Надо будет аккуратно пройтись и найти, спасибо... (Кстати, там скорее всего и буква "о" с грависом вообще не кириллическая, а латинская, насколько я помню оформление источника...) Hinote (обсуждение) 18:02, 30 октября 2015 (UTC)