Обсуждение MediaWiki:Gadget-Deyatificator.js

Содержимое страницы недоступно на других языках.
Материал из Викитеки — свободной библиотеки

Можно ли было бы добавить еще замены:

  • Все/всеВсё/всё (до замены ѣ на е)
  • Ея/еяЕё/её

Это помогает ё-фикации. В случае Все/все не всегда из контекста в современной орфографии понятно, как хотел сказать автор, а иногда можно отловить опечатку в тексте. Замена ё на е — тривиальна, а вот обратный процесс — нет… --EugeneZelenko 14:42, 24 января 2011 (UTC)[ответить]

Хорошая идея C уважением, Виталий Чихарин 15:30, 24 января 2011 (UTC)[ответить]

Улучшения с момента выпуска[править]

  • 24.01.2011 — защита для слова «выя» (единственное существительное, кончающееся на «-ыя»), чтобы оно не менялось на «вые», а также слов: «оружие/всеоружие», «двое/трое/многомужия», «безбрежия», «малоснежия» и «полукружия» — чтобы не менялись по типу «свежия» → свежие. Добавлено слова «игуменией/игумении». Добавлено правило для двухэтажный, трехэтажный и т.п, «оффициальный», «кристалльный», «кожанный», «Волховцем».
  • 25.01.2011 правило для «близь», «контрбас», «честию», «съ» + гласная аоуыэ (напр., «съумасшедший»), «мыслию», «контрбас», «недоуменье», «ушол/пришол» и т.п., «шол» и все однокоренные, «в-полголоса», окончания на «-рния» (с защитой четырёх слов)
  • 01.02.2011 — правило для «подростал» и т.п. слов, правило для «о-земь», правило для «под ряд», правило для «в догонку».
  • 05.02.2011 — правило для «мятель», «привиллегии», «ростёт», «иконастас», «Псалтирь», «собственоручное», «покоющийся», исправил ошибку когда благочестие превращалось в благочестье, дополнительно окончания для прилагательных «-богия» (убогия), «-ранию» (бранию) с защитой одного слова (букранию)
  • 09.02.2011 — правило для «в дребезги»
  • 18.02.2011 — множество улучшений по предложениям EugeneZelenko от 15—18 февраля
  • 19.02.2011 — правило для «не в моготу»
  • 25.02.2011 — ошибочное исправление «счастий», правило для «купэ» и «галстух»
  • 26.02.2011 — ошибочные замены для слов с окончанием «-ранию» (исправлено)
  • 15.03.2011 — ошибка с «чести» и др. в этом регэкспе
  • 16.03.2011 — іота, -жъ
  • 19.03.2011 — Іорк, потому-что, только-что, турнэ и исправление ошибок
  • 30.03.2011 — исправлены ошибки
  • 01.04.2011 — улучшения по предложению EugeneZelenko
  • 08.04.2011 — ошибка с неверным исправлением слова страсти и т.п.
  • 09.04.2011 — текст внутри шаблонов {{lang}}, {{lang-bg}} и всех аналогичных больше не обрабатывается, три новых правила: «циплёнок», «на пропалую», «должно-быть» и «сторы»
  • 13.04.2011 — на перерѣзъ, плэдъ, задхлый
  • 21.04.2011 — исправлены две ошибки, добавлено правило для «притти».
  • 24.04.2011 — чемъ → чём (до замены ѣ на е)
  • 30.04.2011 — Новые правила: аттака, поочереди, на повалъ, на-лицо, на-перевес, на-перерез; исправлена одна ошибка
  • 04.05.2011 — давния, втечение
  • 10.05.2011 — исправлена ошибка, текст между языковыми шаблонами не обрабатывался. Дополнительные замены по предложениям EugeneZelenko и Л.П. Джепко
  • 14.05.2011 — на утёк
  • 18.05.2011 — выстиранный ошибочно заменялось на выстираный (некорректно сформулированное правило для «тиранния»)
  • 21.05.2011 — замена всемъ — всём, исправлена проблема с Македонии
  • 02.06.2011 — Немъ сразу меняется на Нёмъ, подъячий на подьячий
  • 15.06.2011 — исправлены 3 ошибки (паралич, г-же, подраставший), правило для «вприсядку»
  • 17.06.2011 — правило для «капишон», «аллилуія», «препорция»
  • 20.06.2011 — «низх», «низш» в начале слова → «нисх», «нисш», «на взрыд»
  • 21.06.2011 — ошибка с «аллилуія», добавлен «перевощик», «отцем», «наказует», «глиненый», «поперег», «загареться»
  • 22.06.2011 — Езоп → Эзоп
  • 26.06.2011 — Исправлены 2 ошибки, въ перемѣшку, въ перемежку, настежъ, -ль на конце слов, вызсказать, акуратный, серебрянный
  • 17.07.2011 — с просонья
  • 07.08.2011 — множество улучшений по последним предложениям.
  • 13.08.2011 — добавлена замена для двухточечной ї(Ї), улучшения и добавления
  • 18.08.2011 — 7 новых слов по предложениям VadimVMog
  • 20.08.2011 — исправлена ошибка со словом «расчёт», добавлено правило для «Миссиссипи», приставка предъ, по близости, не взирая на, всё таки.
  • 25.08.2011 — Таллер, установливать, розыгрывать, на равне с, проэкт, с молоду
  • 31.08.2011 — Исправлена ошибка с «Устанавл/Установл»
  • 10.09.2011 — Добавлены новые правила: «джентельмэн», «конфекта», «черезмерный», «на перебой», улучшена замена для ранее писавшихся раздельно слов по типу «в замен»
  • 28.09.2011 — Исправлена ошибка с «всё-таки», добавлено правило для «безразсудный», предложения Евгения Зеленко за 13—21 сентября
  • 10.11.2011 — «Возрасли», заваленка, на смарку, вразсыпную, жолудь, съ измальства, «панегерик»
  • 24.03.2012 — Много исправлений по предложениям EugeneZelenko
  • 26.03.2012 — Исправления выявленных проблем.
  • 11.06.2012 — По предложениям EugeneZelenko от 5 апреля — 5 мая, и «ариергард» по предложению VadimMog + исправление проблем
  • 31.12.2012 — «дикия», «къ-ряду», трех-, четырёх- и т.п. стишия и ещё множество всего, что накопилось.
  • 06.02.2013 — исправил 2 ошибки
  • 31.01.2014 — 10 новых правил по предложением EugeneZelenko

Гаджет[править]

Стоит оформить в виде гаджета для упрощения процесса включения/удаления из инструментов. Это был недостаток и предыдущего варианта. --EugeneZelenko 16:44, 24 января 2011 (UTC)[ответить]

Хорошо бы, но я пока не разбирался как делать гаджеты. Есть какой-то «туториал»? C уважением, Виталий Чихарин 17:01, 24 января 2011 (UTC)[ответить]
Теоретически всё просто: надо перенести код в пространство имён MediaWiki, добавить описание и включить в список. Дума, стоит посмотреть на другие гаджеты, как примеры. --EugeneZelenko 04:33, 25 января 2011 (UTC)[ответить]
Сделал, у меня работает. C уважением, Виталий Чихарин 12:08, 25 января 2011 (UTC)[ответить]

Улучшения[править]

Стоит добавить замены:

  • подъ рядъподряд
  • въ догонкувдогонку

EugeneZelenko 15:25, 26 января 2011 (UTC)[ответить]

Сделал. C уважением, Виталий Чихарин 12:56, 1 февраля 2011 (UTC)[ответить]
Это что же, «метель»? C уважением, Виталий Чихарин 17:19, 3 февраля 2011 (UTC)[ответить]
Да, включая все окончания и вариации типа метелицы. --EugeneZelenko 04:49, 4 февраля 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 09:21, 5 февраля 2011 (UTC)[ответить]
Сделал C уважением, Виталий Чихарин 07:50, 9 февраля 2011 (UTC)[ответить]
Сделал C уважением, Виталий Чихарин 19:59, 18 февраля 2011 (UTC)[ответить]
Сделал C уважением, Виталий Чихарин 13:21, 19 февраля 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 20:36, 25 февраля 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 09:13, 16 марта 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 10:30, 19 марта 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 06:28, 1 апреля 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 18:10, 2 апреля 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 06:02, 9 апреля 2011 (UTC)[ответить]
Стора → Штора давно уже сделано, разве у вас не заменяет? C уважением, Виталий Чихарин 05:35, 9 апреля 2011 (UTC)[ответить]
Не обрабатывается сторы. --EugeneZelenko 14:43, 9 апреля 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин
Сделал. C уважением, Виталий Чихарин 16:16, 13 апреля 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 17:43, 21 апреля 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 14:44, 24 апреля 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 04:04, 30 апреля 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 17:04, 10 мая 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 04:44, 14 мая 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 13:18, 21 мая 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 17:08, 2 июня 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 03:53, 15 июня 2011 (UTC)[ответить]
Сделаны все три слова. C уважением, Виталий Чихарин 08:57, 17 июня 2011 (UTC)[ответить]
Всё сделано. C уважением, Виталий Чихарин 05:10, 26 июня 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 18:18, 17 июля 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 05:16, 7 августа 2011 (UTC)[ответить]
  • на ряду с —> наряду с
  • в замен —> взамен
  • целию —> целью
  • праотцем —> праотцом

VadimVMog 19:40, 6 августа 2011 (UTC)[ответить]

Сделал. C уважением, Виталий Чихарин 05:16, 7 августа 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 08:32, 13 августа 2011 (UTC)[ответить]
  • придти → прийти
А придти — это словарное слово. C уважением, Виталий Чихарин 08:29, 13 августа 2011 (UTC)[ответить]
  • четыреугольнымъ → четырёхугольным (видимо, не учитываются падежные окончания, поскольку «четыреугольникъ» обрабатывается правильно VadimVMog 19:13, 9 августа 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 08:29, 13 августа 2011 (UTC)[ответить]
Добавил. C уважением, Виталий Чихарин 13:09, 25 августа 2011 (UTC)[ответить]
Добавил. C уважением, Виталий Чихарин 13:09, 10 сентября 2011 (UTC)[ответить]
Всё сделал. C уважением, Виталий Чихарин 18:01, 28 сентября 2011 (UTC)[ответить]
Всё сделал. C уважением, Виталий Чихарин 07:33, 10 ноября 2011 (UTC)[ответить]
Сделано. C уважением, Виталий Чихарин (обсуждение) 05:07, 24 марта 2012 (UTC)[ответить]
Сделано. C уважением, Виталий Чихарин (обсуждение) 08:21, 11 июня 2012 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин (обсуждение) 20:35, 30 декабря 2012 (UTC)[ответить]

EugeneZelenko (обсуждение) 03:30, 26 июля 2012 (UTC)[ответить]

  • въ попыхахъвпопыхах.
  • портмонэпортмоне.
  • чисто-на-чисточисто начисто.
  • кумачевый → кумачовый.
  • крючекъкрючок.

EugeneZelenko (обсуждение) 03:24, 28 июля 2012 (UTC)[ответить]

Сделал всё, что выше написано. C уважением, Виталий Чихарин (обсуждение) 09:02, 31 декабря 2012 (UTC)[ответить]
Сделал всё в этом блоке, за исключением «поешь», которое менять нельзя «поешь кашу, пока не остыла» C уважением, Виталий Чихарин (обсуждение) 17:51, 31 января 2014 (UTC)[ответить]
В этом случае писалось поѣшь. --EugeneZelenko (обсуждение) 03:47, 1 февраля 2014 (UTC)[ответить]

EugeneZelenko (обсуждение) 04:22, 28 февраля 2013 (UTC)[ответить]

--EugeneZelenko (обсуждение) 04:53, 7 марта 2013 (UTC)[ответить]

EugeneZelenko (обсуждение) 02:04, 30 июня 2014 (UTC)[ответить]

  • этагоэтого
  • (пробел)нибудь-нибудь
Nonexyst 13:48, 20 августа 2015 (UTC)[ответить]
  • и ещё инагоиного
Nonexyst 15:33, 26 августа 2015 (UTC)[ответить]

Пропала кнопка для конвертации орфографии[править]

Сегодня пропала кнопка для конвертации орфографии. Проверил НАСТРОЙКИ->ГАДЖЕТЫ->«Деятификатор». Галочка стоит. Браузер Мазила Фаерфокс 3.5.16 --Vladlen666 16:19, 8 февраля 2011 (UTC)[ответить]

Сегодня провели обновление ПО MediaWiki. Думаю, как-то с этим связано. C уважением, Виталий Чихарин 18:21, 8 февраля 2011 (UTC)[ответить]
Пропал не только деятификатор, исчезло всё что включалось через гаджеты. См. Викитека:Форум#Проблема с гаджетами. Попробуйте подключить деятификатор написав в своём файле JS
importScript('MediaWiki:Gadget-Deyatificator.js');

C уважением, Виталий Чихарин 18:27, 8 февраля 2011 (UTC)[ответить]

Теперь должно всё работать. C уважением, Виталий Чихарин 17:06, 9 февраля 2011 (UTC)[ответить]

Проблемы[править]

  • свиньи заменяется на свинии. Мне кажется, что обработка -ньи слишком общая (например, дуэньи). Лучше убрать и полагаться на проверку орфографии. --EugeneZelenko 04:31, 15 февраля 2011 (UTC)[ответить]
Сделал большой регэксп, вроде все варианты предусмотрел... Должно нормально работать. C уважением, Виталий Чихарин 19:50, 18 февраля 2011 (UTC)[ответить]
Исправил C уважением, Виталий Чихарин 19:50, 18 февраля 2011 (UTC)[ответить]
Наверное, исправление не совсем верное. Проблема с возчик в том, что воз — корень, а не приставка. Стоит обработать как исключение. --EugeneZelenko 04:19, 19 февраля 2011 (UTC)[ответить]
Посмотрел по словарю, это единственное слово, начинающееся на «возч». C уважением, Виталий Чихарин 12:50, 19 февраля 2011 (UTC)[ответить]
Ого! Не подумал что у счастья есть множественное число :) C уважением, Виталий Чихарин 20:29, 25 февраля 2011 (UTC)[ответить]
Исправил C уважением, Виталий Чихарин 20:36, 25 февраля 2011 (UTC)[ответить]
Как-то за кадром осталась проблема с собраніе/собранію. Тоже будет с завещанием, заседанием, посвящением и т. д. --EugeneZelenko 04:28, 26 февраля 2011 (UTC)[ответить]
Отнюдь нет. Проблема была только со словами, оканчивающимися на «-ранию». С заседанием и проч. всё в порядке. А с «-ранию» я исправил. C уважением, Виталий Чихарин 06:25, 26 февраля 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 15:27, 15 марта 2011 (UTC)[ответить]
Исправил. участию и участию — омографы, первое слово от участие, второе — от участь. Нужно будет исправлять вручную участию на участью там где это подходит по смыслу. C уважением, Виталий Чихарин 10:24, 19 марта 2011 (UTC)[ответить]
Исправил. Это была ошибка с «никогда не». C уважением, Виталий Чихарин 08:13, 30 марта 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 14:33, 30 марта 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 07:50, 30 марта 2011 (UTC)[ответить]
Исправлено. C уважением, Виталий Чихарин 14:27, 30 марта 2011 (UTC)[ответить]
Исправлено. C уважением, Виталий Чихарин 06:33, 1 апреля 2011 (UTC)[ответить]
C этим сложнее. Сделаю когда разберусь как это устроено в Викификаторе (там тоже текст внутри некоторых тегов не обрабатывается) C уважением, Виталий Чихарин 06:33, 1 апреля 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 05:34, 9 апреля 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 18:11, 2 апреля 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 19:28, 8 апреля 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 17:40, 21 апреля 2011 (UTC)[ответить]
Исправил. Проблема была та же что выше со «свинии». C уважением, Виталий Чихарин 04:08, 30 апреля 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 16:54, 18 мая 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 13:23, 21 мая 2011 (UTC)[ответить]
Так ведь «подраставший» как раз и правильно. Или я чего-то не понял? C уважением, Виталий Чихарин 03:45, 15 июня 2011 (UTC)[ответить]
Понятно, исправил. C уважением, Виталий Чихарин 13:45, 15 июня 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 03:47, 15 июня 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 03:49, 15 июня 2011 (UTC)[ответить]
  • После пустых lang не конвертируется текст. Пример: Знаете, {{lang|fr|mon cher}}<ref name="mon cher">{{lang-fr|}}</ref>, со мной однажды былъ презанимательный случай въ этомъ же родѣ. Знаете, подхожу я однажды, по глупости, къ одному антрепренеру и предлагаю: «А что бы вамъ, {{lang|fr|mon cher}}<ref name="mon cher" />, выписать, вмѣсто артистокъ, просто дѣвицъ, которыя бы, безъ всякихъ словъ, стояли передъ публикой на головахъ? --EugeneZelenko 03:47, 16 июня 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 08:58, 17 июня 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 06:44, 21 июня 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 04:55, 26 июня 2011 (UTC)[ответить]
Исправлена замена слова с заглавной буквы, но осталась ошибка с заменой со строчной. --EugeneZelenko 13:55, 26 июня 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 14:47, 26 июня 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 05:13, 7 августа 2011 (UTC)[ответить]
Это ошибка распознавания, в Dia должна быть латинская i, а оказалась кириллическая і. Вообще, неплохо было бы прикрутить исправление таких ошибок прямо в деятификатор. C уважением, Виталий Чихарин 04:58, 7 августа 2011 (UTC)[ответить]
Ага, вот я уже и сделал это. C уважением, Виталий Чихарин 05:17, 7 августа 2011 (UTC)[ответить]
Одиночные кириллические і/І заменяются на и/И. Проблемы, возможны, например с, отрывком по-белорусски. На всякий случай стоит сделать то же и для одиночных латинсих i/I. --EugeneZelenko 14:08, 7 августа 2011 (UTC)[ответить]
Эти замечания исправил. C уважением, Виталий Чихарин 08:27, 13 августа 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 13:03, 18 августа 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 05:19, 20 августа 2011 (UTC)[ответить]
Исправлено. C уважением, Виталий Чихарин 03:31, 10 сентября 2011 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин 17:48, 28 сентября 2011 (UTC)[ответить]
Мне кажется, что обработка варианта все ошибочна, т. к. до этого времени все уже были преобразованы во всё, т. е. к этому моменту все соответствуют исходному всѣ. --EugeneZelenko 03:24, 29 сентября 2011 (UTC)[ответить]
«Все» меняется на «всё» только если это отдельно стоящее слово, а с дефисом не меняется. Так что вроде всё верно. Но вы проверьте, если будут проблемы, то я стану чинить. C уважением, Виталий Чихарин 18:52, 1 октября 2011 (UTC)[ответить]
В этом случае как раз обрабатывается отсутствие дефиса :-) Думаю, что не помещает обрабатывать все- (в правильных сочетаниях) как отдельное все. Тогда и гадать про исходное е или ѣ не надо будет. --EugeneZelenko 03:17, 7 октября 2011 (UTC)[ответить]
ОК, заменил так. C уважением, Виталий Чихарин 07:28, 10 ноября 2011 (UTC)[ответить]
Исправил отмеченные проблемы, насчёт «счастия» в стихотворениях надо подумать... C уважением, Виталий Чихарин (обсуждение) 15:43, 26 марта 2012 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин (обсуждение) 08:28, 11 июня 2012 (UTC)[ответить]
Но проблема с остальными (четверо, восьми и т. д.) -стишія осталась. --EugeneZelenko (обсуждение) 13:40, 11 июня 2012 (UTC)[ответить]
Это тоже исправил. C уважением, Виталий Чихарин (обсуждение) 07:10, 31 декабря 2012 (UTC)[ответить]
Исправил и добавил (но это требуется только замены старых букв новыми). C уважением, Виталий Чихарин (обсуждение) 08:32, 11 июня 2012 (UTC)[ответить]
Исправил всё перечисленнное выше. C уважением, Виталий Чихарин (обсуждение) 09:02, 31 декабря 2012 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин (обсуждение) 17:45, 20 января 2013 (UTC)[ответить]
Исправил. C уважением, Виталий Чихарин (обсуждение) 06:25, 6 февраля 2013 (UTC)[ответить]

Исправил все отмеченные. В отношении замен -ьи/-ии (а также и гипподром, галстух, и т. п.) категорически не согласен с общепринятым мнением: данная замена не орфографическая, а стилистическая (архаизмы и разговорные варианты), и, как таковая, не должна производиться в деятификаторе. Предлагаю это обсудить. — Lozman (talk) 12:29, 26 июня 2013 (UTC)[ответить]

Замечания и предложения[править]

Можно добавить следующие автозамены:

  • ВАРШАВСКАГО -> ВАРШАВСКОГО
  • УЧЕБНАГО -> УЧЕБНОГО
  • ПЕРВЫЯ -> ПЕРВЫЕ

Причем интересно, что те же слова строчными буквами вроде меняются. --Л.П. Джепко 06:55, 4 мая 2011 (UTC)[ответить]

Подумаю как это сделать, это не так просто... C уважением, Виталий Чихарин 16:39, 10 мая 2011 (UTC)[ответить]
Сделал для этих окончаний, но есть сомнения, нужно ли это делать для всех прописных букв. C уважением, Виталий Чихарин 17:01, 10 мая 2011 (UTC)[ответить]
Сделано. C уважением, Виталий Чихарин 12:57, 18 августа 2011 (UTC)[ответить]
Сделано. C уважением, Виталий Чихарин 16:48, 20 августа 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 13:09, 25 августа 2011 (UTC)[ответить]
Готово. C уважением, Виталий Чихарин 03:29, 10 сентября 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин 18:22, 22 ноября 2011 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин (обсуждение) 08:34, 11 июня 2012 (UTC)[ответить]
Это ошибка, наверное? «Не» с глаголами всегда была раздельно или нет? C уважением, Виталий Чихарин (обсуждение) 20:50, 30 декабря 2012 (UTC)[ответить]
Сделал. C уважением, Виталий Чихарин (обсуждение) 20:50, 30 декабря 2012 (UTC)[ответить]
Все вышеперечисленное сделал. C уважением, Виталий Чихарин (обсуждение) 09:02, 31 декабря 2012 (UTC)[ответить]

Предлагаю исключить несвойственные функции[править]

Я пришел к убеждению, что деятификатор слишком часто лезет не в свое дело: значительная часть замен, которые он выполняет — не орфографические, а стилистические, следовательно, не только меняющие визуальное представление текста, но и влияющие не его звучание и отчасти смысл. Вот примерный список таких замен:

  • Ея → Её
  • компаніон → компаньон
  • піеса → пьеса
  • честию → честью, слабостию → слабостью, лёгкостию → лёгкостью и проч.
  • под сению → под сенью, жизнию → жизнью
  • мыслию → мыслью
  • целию → целью
  • -ностию → -ностью, -достию → -достью, -тостию → -тостью
  • -астию → -астью
  • партью → партию, хартью → хартию
  • -ньи → -нии (ухаживаньи → ухаживании)
  • олении → -оленьи
  • -ния на конце слова на -нью (бранию → бранью)
  • Окончанию на -нии → ньи
  • ариергард → арьергард
  • банкрут → банкрот
  • бифстекс → бифштекс
  • билліардъ → бильярд
  • взлохмоченного → взлохмаченного
  • внутренно → внутренне
  • гиероглиф → иероглиф
  • гипподром → ипподром
  • дотрогиваться → дотрагиваться
  • дышет → дышит
  • заведывал → заведовал
  • запрег → запряг
  • зверок → зверёк
  • игуменией → игуменьей
  • италиянский → итальянский, Италиянцы → Итальянцы
  • капишон → капюшон
  • контрбас → контрабас
  • конфекта → конфета
  • об его → о его
  • однех → одних, однеми → одними
  • Оне → Они, оне → они, одне → одни, однем → одним
  • отцем → отцом, праотцем → праотцом
  • панегерик → панегирик
  • пиеса → пьеса
  • почталион → почтальон
  • о пристрастьи → о пристрастье
  • проповедывать → проповедовать
  • пунсовый → пунцовый
  • сериозно → серьёзно
  • снурок → шнурок
  • снурка → шнурка
  • советывал → советовал
  • стклянка → склянка
  • стор → штор
  • усумнился → усомнился (также сумнение и т.п.)
  • о счастьи → о счастье
  • у ней → у неё
  • усвоивал → усваивал
  • установливать → устанавливать
  • черезмерный → чрезмерный
  • четыреугольник → четырёхугольник и варианты
  • шкап → шкаф
  • счастия → счастья, страстию → страстью, несчатия и т.п.
  • счастьй → счастий
  • предместьй → предместий
  • нея → неё, ея → её
  • успокоивать → успокаивать (но «успокоив», «успокоившись»)
  • затрогивал → затрагивал
  • выработывались → вырабатывались
  • разработывать → разрабатывать
  • трехугольною → треугольною
  • кистию → кистью (шире нельзя из-за «амнистию» и др.)
  • волкан → вулкан
  • наказуются → наказываются и варианты
  • сколопандра → сколопендра
  • любовию → любовью
  • кровию → кровью
  • лицем → лицом
  • госпожей → госпожой
  • облагороживающее → облагораживающее
  • приобревший → приобретший
  • нумера → номера (но «нумерация»)
  • баталионе → батальоне
  • праотцов → праотцев
  • противуположность → противоположность и все варианты
  • экспромпта → экспромта
  • дотрогиваться → дотрагиваться
  • здоровьи → здоровье
  • раздумьи → раздумье
  • удостоивающего → удостаивающего
  • недоуменье → недоумение и варианты
  • мущина → мужчина
  • галстух → галстук
  • препорция → пропорция
  • Монтань → Монтень
  • Горацие → Горации
  • Виргилий → Вергилий
  • Езоп → Эзоп
  • Аустерлицом → Аустерлицем
  • Волховцем → Волховцом
  • о Капитолие → о Капитолии

Главный принцип: если при изменении написания слова его звучание не изменяется, то замену можно считать орфографической; если меняется, то это стилистическая или даже лексическая замена (напр. дышет и дышит — разные слова). Такие замены приводят к созданию модифицированного текста, что недопустимо по правилам Викитеки (тексты должны максимально точно соответствовать подлиннику) — особенно в стихах, где из-за этого часто ломается метрика и пропадает рифма. Предлагаю перечисленные выше замены исключить. В идеале я бы вообще предпочел отказаться от деятификации и сохранять тексты только в той орфографии, в какой они опубликованы. Если текст, первоначально опубликованный в ДО, впоследствии также публиковался в СО, можно разместить обе версии — но именно как версии, которые потенциально могут отличаться не только орфографией, но и какими-то еще особенностями. Таких версий может быть сколько угодно, а не только ДО и СО, которые якобы идентичны (хотя это и не так). — Lozman (talk) 14:35, 15 октября 2013 (UTC)[ответить]

  • Категорически не согласен. Предлагаемый принцип не годится для прозаических текстов. Если есть какая-то проблема со стихами, то, значит, нужен отдельный деяфикатор для стихов. Только неискоренимый чудак-любитель древностей, из числа тех, кто любит запах плесени и жучков долго полежавших книг, может любить читать тексты в мёртвой орфографии. Это нефункционально и неперспективно. Пусть себе покойники тихо лежат на кладбищах, не надо их поднимать из могил: зомби всегда отвратительны. Большинство читателей однозначно предпочтут читать литературу, не путаясь во всяких давно утративших всякий смысл ятях и устаревших словоформах. Слова "дышет" нет в современном русском языке, это просто орфографическая ошибка, за которой нет никакой семантики. Перевод со старинной орфографии в современную орфографию - это все же перевод. Нет никаких "модифицированных текстов" в переводе. Есть фундаментальные общепризнанные принципы перевода, и не надо их нарушать, рассуждая о каких-то мифических нарушениях правил Викитеки. --Л.П. Джепко (обсуждение) 07:00, 16 октября 2013 (UTC)[ответить]
Много треска, мало смысла. Стихи от прозы отличаются только тем, что в них эти несуразности более заметны. Слова «дышет» нет в современном русском, но 200 лет назад оно точно было, и смысл его отличен от «дышит» (см. здесь). А от ваших рассуждений о «мертвой орфографии» действительно веет зомби-апокалипсисом: восхитительный нигилизм в полушаге от вандализма. Викитека содержит оригинальные тексты в том виде, в каком они опубликованы, вне зависимости от того, «живая» у них орфография или «мертвая». Если альтернативно одаренным читателям затруднительно читать в такой орфографии (хотя они и в новой читают не особо) — что ж, пусть для них будут версии в СО в том виде, как они делаются сейчас. Только это не основные версии, а переводы, сделанные участниками Викитеки, т. е. отдельные редакции, к тому же вторичные (производные от ДО); и это нужно обязательно обозначать для отличия от опубликованных редакций в СО. Скажем, не «Текст» и «Текст/ДО», как сейчас, а, например, «Текст/1890» (изначально в ДО), «Текст/1890 (перевод Викитеки)» (в СО), «Текст/1937» (изначально в СО). — К тому же суть предложение вообще не в этом: речь об избавлении деятификатора от стилистических замен, влияющих на смысл текста. На чисто орфографические замены никто не посягает. — Lozman (talk) 14:57, 16 октября 2013 (UTC)[ответить]
А я как раз считаю, что мало смысла в Вашем предложении. По-большому счету, оригинальная, опубликованная версия - это только версия, которая была изначально опубликована в ДО. Все остальные версии (кроме репринтных изданий), в том числе и в СО, это всегда редактированные, или как Вы говорите "модифицированные", что ж поделаешь, такова жизнь: всякое издательство при переиздании норовит что-то исправить к лучшему (правда, получается, как всегда). Какой-то у Вас чрезмерно пуристский подход чувствуется, стремление затормозить, остановить течение реки. Между тем, сейчас даже текст Библии подвергается редактированию и осовремениванию, переводу его на современные языки. Возьмите, к примеру, деятельность Юджина Найды и его вклад в теорию перевода. Оставим книжным червям-филологам их научные изыскания и копания в старых текстах на уже неживых языках, когда сам оригинальный текст на 50 страницах сопровождается обильными комментариями и пояснениями на 100 страницах. Не они наши читатели, они вообще по-любому предпочтут бумажную книжку, в крайнем случае ПДФ, уж никак не эл. книгу Викитеки. Наш читатель массовый и электронный, ему надо прочитать текст, не запинаясь на всякие яти и непонятные, непереведенные на современный язык слова. Поэтому мое предложение конкретно: повторяю, хотите, сделайте себе поэтический деятификатор, а нам оставьте этот для прозы, для научных и информационных текстов. Он очень хорош, а отдельные ляпы всегда можно легко исправить ручками. --Л.П. Джепко (обсуждение) 20:02, 21 октября 2013 (UTC)[ответить]
Убедили. Хорошо, я больше не вмешиваюсь в работу деятификатора. Возможно, со временем я сделаю (или не сделаю) какой-то персональный деятификатор для собственных нужд, но этот пусть остается как есть. — Lozman (talk) 09:35, 22 октября 2013 (UTC)[ответить]

Сначала я хочу высказаться о том, «это предложение ... могущим повлиять на политику проекта в целом». Не должны технические решения влиять (в смыле — «определять») на политику проекта. Т.е. никто не должен предполагать a priori, что если деятификатор поступает так, то это соответствует политике проекта. Деятификатор делался только для того, чтобы облегчить нашу работу. Я понимаю, что именно имел ввиду Lozman этой фразой, но призываю определиться, что мы решаем здесь лишь технический вопрос об заменах в деятификаторе. Факт состоит в том, что местами им неудобно пользоваться. Действительно, я иногда чувствовал желание некоторые из замен отключить. Чаще это случалось в стихах с заменами нея → неё, ея → её, оне → они. Технически было бы правильно иметь некий базовый набор замен (орфографический в терминах Lozman), и дать участникам возможность настраивать, какие из остальных применять. Например, если бы деятификатор загружал бы набор замен с какой-нибудь подстраницы участника (подобно тому как загружается Участник:Имя/common.js). Или же можно было бы указать набор дополнительных замен при добавлении кнопки с личную панель, тогда можно было бы сделать себе личный деятификатор для стихов и для прозы, о которых говорил Леонид. Быть может в Lua есть другие возможности для «кустомизации» нашего деятификатора?.. -- Sergey kudryavtsev (обсуждение) 06:24, 18 октября 2013 (UTC)[ответить]

Постоянно пользуюсь деятификатором для стихов и для прозы. Есть в нём отдельные замены, которые хотелось бы отключить. Однако, в основном, он оправдывает своё применение. Например, если бы он переводил бы слово "компаніон" в "компанион", то на каком языке считался бы полученный текст? Основные тексты показываются на современном русском языке. Желающие могут увидеть оригинал на ДО страницах. Конечно, при этом желательно сохранять ритм стихов. Кстати, словарь для него — хорошее подспорье для программы распознавания. --Averaver (обсуждение) 18:35, 20 октября 2013 (UTC)[ответить]

На русском языке соответствующего периода (XVIII, XIX в.), записанном в современной орфографии. Собственно, только такое различие можно считать орфографическим. То, что делается сейчас — не орфографическая замена, а фактический перевод с русского на русский (с языка одного исторического периода на язык другого исторического периода). Никто не говорит, что мы не вправе этого делать, но давайте тогда не будем называть это «двумя орфографиями» (поскольку различия текстов не исчерпываются орфографией). По сути мы делаем новую, модернизированную редакцию исходного текста, которая никак уже не может считаться просто орфографическим вариантом. Т. е. следует придерживаться одной из двух политик: либо 1) отказаться от модернизации текстов и производить чисто орфографические замены, либо 2) отказаться от системы «двух орфографий» (фиктивной) и перейти к системе «множественных редакций». При этом редакции могут быть как последовательными (опубликованные), так и параллельными (модернизированные Викитекой). Это позволит иметь неограниченное количество редакций одного и того же текста как в аутентичной орфографии, так и в «современной». — Lozman (talk) 14:08, 21 октября 2013 (UTC)[ответить]
Извините, а у Вас филологическое образование? Я, по образованию лингвист, веду это к тому, что понимаете ли Вы, что сохраняя архаичное слово в тексте, предназначенном для наших современников, Вы невольно меняете его стилистику для читателя, т. е. меняете смысл, искажаете исходную мысль автора? Это о Вашем отказе от конвертаций: "баталионе → батальоне", "черезмерный → чрезмерный", "Монтань → Монтень". Если автор не хотел звучать архаично или безграмотно? --Л.П. Джепко (обсуждение) 20:18, 21 октября 2013 (UTC)[ответить]
Сохраняя архаичные слова, мы меняем стилистику? Не знаю, может быть — в том смысле, что на момент создания текста эти слова не были архаичными? Но мы должны быть уверены в отношении каждой замены, что это именно так. Иначе замена архаизмов может исказить смысл гораздо сильнее, чем их сохранение. Впрочем, я уже принял решение и собираюсь по возможности устраниться от модернизации текстов. — Lozman (talk) 09:44, 22 октября 2013 (UTC)[ответить]

А вам не кажется, что в идеале для текстов в СО и ДО надо иметь разные источники? В СО и ДО, соответственно, чтобы не заниматься отсебятиной. В такой постановке поднятый вопрос не имеет принципиального значения, т.к. «переведённые» деятификатором тексты носят временный характер. -- Sergey kudryavtsev (обсуждение) 08:02, 22 октября 2013 (UTC)[ответить]

«Нет ничего более постоянного, чем временное». Во-первых, замена «переведенных» текстов опубликованными — процесс длительный, стремящийся к бесконечности. Во-вторых, многие тексты вообще не переиздавались после 1917 года и для них такой редакции просто не существует. Ну и главное — в любом случае необходимо признать факт, что мы имеем дело не с орфографическими вариантами, а с разными редакциями текста. Поэтому, оставив в покое деятификатор (пусть остается как есть), я считаю необходимым рассмотреть вопрос о переходе от искусственной системы ДО/СО к системе множественных редакций. Суть ее в том, что каждая опубликованная редакция текста, независимо от орфографии, имеет право на размещение в Викитеке, но именно в том виде (включая орфографию), в котором она опубликована. При наличии нескольких (двух или более) редакций на основной странице текста помещается список этих редакций с необходимыми пояснениями, а сами тексты редакций выносятся на подстраницы. Если нет опубликованных редакций в СО, или желательно иметь «модернизированную» версию старого издания — пожалуйста, используйте деятификатор, но сохраняйте эту версию как отдельную редакцию текста, с обязательным указанием, что данная редакция создана участниками Викитеки и нигде не публиковалась, а основана на такой-то опубликованной редакции. — Lozman (talk) 10:15, 22 октября 2013 (UTC)[ответить]
Не имею ничего против такого указания, читатели должны знать, что именно они читают. Так, например, известный в программистских кругах MSDN (Microsoft Developer Network) педантично предупреждает читателя о машинном переводе с английского своих статей, хотя это заметно и без этой подсказки. ;-) Пожалуйста, поясните на примере, как в «системе множественных редакций» будут называться подстраницы для На северном голом утёсе (Гейне; Михайлов) (из изд. 1958 года), На северном голом утёсе (Гейне; Михайлов)/ДО (из изд. 1858), а также не сушествующая пока Сосна и пальма (Гейне; Михайлов)/ДО (из изд. 1845)? -- Sergey kudryavtsev (обсуждение) 05:55, 23 октября 2013 (UTC)[ответить]
Например так:
  • На северном голом утёсе (Гейне; Михайлов)/Сочинения (1958)
  • На северном голом утёсе (Гейне; Михайлов)/Песни (1858)
  • Сосна и пальма (Гейне; Михайлов)/????? (1845) — смотря по названию сборника
Набросок предварительный, формат можно и нужно обсуждать, но общий принцип такой: в подстранице название издания и год. Длинные названия, думаю, можно сокращать. В принципе, ничто не мешает использовать сокращения, принятые в академических изданиях (ПСС и т.п.). Редакцию, созданную с использованием деятефикатора, лучше называть так же, как исходную, с добавлением некоего суффикса, например: На северном голом утёсе (Гейне; Михайлов)/Песни (1858): редакция Викитеки или даже На северном голом утёсе (Гейне; Михайлов)/Песни (1858): ВТ. — Lozman (talk) 09:46, 23 октября 2013 (UTC)[ответить]

Предлагаю оформить модулем[править]

Предлагаю данный функционал перевести на LUA и оформить модулем (если модуль можно вызывать и из интерфейсной части, т.е. по нажатию кнопки, как сейчас). Что это даст? Это даст возможность отображать автоматическую деятификацию для текстов в ДО. Например, сделать шаблон ВАР3, который в отличие от ВАР и ВАР2 будет принимать только один параметр -- текст в ДО, и отображать для СО-страниц текст, сгенерированный по правилам деятификации. Это может упростить работу участников Викитеки (во многих случаях качество деятификации достаточно, приходится делать механическую работу при использовании шаблонов ВАР и ВАР2 по дублированию текста ДО и его деятификации при помощи кнопки (это много действий -- оформление символами "|", выделение нужного куска текста, деятификация) -- а результат от автоматически произведенной деятификации все равно ничем не отличается... Hinote (обсуждение) 05:51, 19 января 2014 (UTC)[ответить]

Добавьте маркеры начала и конца блока регэкспов[править]

Добавьте, пожалуйста, в комментариях какие-нибудь однозначные маркеры в места перед началом и после конца блока с регулярными выражениями. Например так:

hide('\\{\\{lang[-|][a-z]{2,}\\|.*?\\}\\}') //Прячем текст, заключённый в шаблон с кодом языка

//+++ Начало блока регулярных выражений для замены текста
 
// По совету участника EugeneZelenko — первоначально Все/все/Ея/ея меняется на Всё/всё/Её/её

и

//

//--- Конец блока регулярных выражений для замены текста
 
restoreAll()

Это позволит автоматически из текущей версии файла "вытягивать" актуальный список регэкспов и делать из него без ручной правки, например, shell-скрипт с аналогичной функциональностью для обработки текстов не в браузере. Hinote (обсуждение) 20:10, 10 сентября 2014 (UTC)[ответить]

Объясните как пользоваться этим скриптом?[править]

Как его запускать в браузере и вообще? Я поддерживаю макрос для libreoffice с аналогичным функционалом, хотелось бы сравнить качество работы обоих макросов. --Михаил Ягих (обсуждение) 12:11, 27 июня 2015 (UTC)[ответить]

  • @Михаил Ягих Приветствую. В Настройки, таб Гаджеты. Нажать крыжик у строки-описания гаджета деятификации, если он не нажат, записать настройки. Затем -- на страницу с текстом в ДО (дореформенной орфографии) в режим редактирования. На панели инструментов вверху поля редактирования -- кнопка "ѣ-->е". Нажать ее -- текст, имеющийся в поле редактирования будет преобразован. Также можно выделить текст и нажать кнопку -- преобразован будет только выделенный участок. Если будут замечания по поведению -- интересно было бы услышать/поделиться мнениями, идеями, результатами тестирования и пр. Вообще, участники Викитеки довольно много работают с текстами в ДО -- из-за политики лицензирования фонда Викимедия и авторских прав, в то время как все дореволюционные произведения страной происхождения Российская Империя не охраняются и находятся в ОД (общественном достоянии)... Hinote (обсуждение) 12:24, 27 июня 2015 (UTC)[ответить]
    Спасибо получилось. Сравнил скрипты на Ася Тургенев: если убрать ёфикацию, которую я принципиально не делал, то все ровно деятификатор обрабатывает больше слов, хотя мой макрос лучше обрабатывает "по" с наречиями ("\<(П|п)о ([а-я]+)(ц|с)ки\>", "$1о–$2$3ки") и частицу "полу" ("\<(П|п)олу(-|–)", "$1олу"), вроде по правилам она всегда слитно пишется. Ну и еще всякие мелочи мне кажутся лучше реализованы в моем макросе. Хотя, конечно надо еще потестировать. Жаль что я раньше не нашел эту страницу. --Михаил Ягих (обсуждение) 13:32, 27 июня 2015 (UTC)[ответить]
    Да, он дает вполне удовлетворяющие сообщество ВТ результаты -- именно поэтому уже пару лет активно не менялся, сообщество здесь довольно консервативно (работает -- не трогай ;-). Хотя, как видно по этой странице обсуждения -- выше описаны случаи, и довольно много, где поведение можно и дальше улучшить. М.б. кто-нибудь когда-нибудь сделает очередную итерацию улучшений работы скрипта. В том числе, возможно, добавит и эти описанные вами кейсы, спасибо. На самом деле было бы интересно взять алгоритмы обоих реализаций, убрать обвязку-фреймворк, оставив только сами замены, описать одинаковым образом и сравнить... Это же, по сути, набор регэкспов... Я, например, для собственных нужд, для обработки текстов оффлайн, взял набор регэкспов из соотв. ф-ции скрипта и перевел в shell-скрипт, который делает аналогичные замены sed'ом. Hinote (обсуждение) 14:16, 27 июня 2015 (UTC)[ответить]

Замена всех -кия[править]

В скрипте очень сложно и в нескольких местах обрабатывается -кия. А ради чего столько труда? Я в скрипте для LibreOffice заменил сначала все -кия, а потом исправил немногочисленные исключения. Собственно, предлагаю обсудить какие есть исключения из замены -кия, то есть не прилагательные оканчивающиеся на -кия. Я нашел следующие исключения (все существительные):

Казакия, Туркия, Калмыкия, Фракия, Даккия, Словакия, Евдокия — это все имена собственные, их и все, как и другие потенциальные экзотические географические названия на -кия, можно обработать как исключения по заглавной букве [А-Я][а-я]+кия а остальные слова которые я нашел это какие-то редкие медицинские термины и названия трав, которые еще надо проверить на предмет года их появления в языке (автаркия афакия лейкоплакия маккия ракия рудбекия телитокия).

Это не предложение немедленно править скрипт. Никакого зуда на этот счет у меня нет. Это просто теоретический вопрос, для тех кому интересно пообсуждать тему.--Михаил Ягих (обсуждение) 16:12, 27 июня 2015 (UTC)[ответить]

Перевел скрипт в макрос для LibreOffice[править]

https://gist.github.com/mikhail73/c5af4c06e33b8fbedbe8

Перевод сделан с версии от 27 июня 2015. Я перевел только строки с регекспами. Комментарии удалил потому что не знаю как их вставлять в массив. LibreOffice поддерживает JavaScript, возможно макрос вообще можно подключить без конвертации, но я к сожаления не знаю как. Протестировал на Анне Карениний Л. Толстого — вроде работает. --Михаил Ягих (обсуждение) 09:25, 27 июля 2015 (UTC)[ответить]

  • Добавил в свой макрос практически все замены из деятификатора. Мне кажется сейчас мой макрос работает лучше деятификатора. Список слов обрабатываемых индивидуально почти совпадают, но регэкспы для массовых замен окончаний и приставок сильно отличается, хотя результат для Анны Карениной почти идентичен. В общем, если кто-то хочет проверить работу деятификатора, то в LibreOffice можно сравнивать с альтернативным макросом.--Михаил Ягих (обсуждение) 18:33, 10 сентября 2015 (UTC)[ответить]

Либо/нибудь[править]

Перед нибудь всегда должен ставиться дефис, так как это слово всегда идёт после вопросительных местоимений.

либо — не всегда, поэтому дефис должен ставиться, только если предыдущее слово — где; докуда; зачем; как; куда; насколько; откуда; отчего; почему; какой, какая, какие, каким, какими, каких, какого, какое, какой, каком, какому, какою, какую; кто, кого, кому, кого, кем, ком; сколько, скольких, скольким, сколькими; чей, чье, чьё, чьего, чьей, чьем, чьём, чьему, чьею, чьи, чьим, чьими, чьих, чью, чья; что, чего, чему, чем, чём. Вроде, все вспомнил.

И ещё: инагоиного, этагоэтого.

@Hinote Вы в последний раз редактировали код, поэтому обращаю Ваше внимание на всякий случай. —Nonexyst 14:31, 17 марта 2016 (UTC)[ответить]