Обновление скрипта "Поиск по набору регэкспов" для FBE - тестируем! | Либрусек

Вы здесь Главная » Блоги » Блог пользователя TaKir Обновление скрипта "Поиск по набору регэкспов" для FBE - тестируем! Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... https://lib.rus.ec/node/268750 и Курьезы сканировщика: http://lib.rus.ec/comment/372489 Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний - ошибок распознавания, которые можно включить в скрипт - прочих пожеланий и усовершенствований. Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): https://my-files.ru/p1yq7v альтернативные ссылки: https://ru.files.fm/u/j76r8q44 https://anonfiles.com/Yae3t470n2/17_TaKir-Sclex-30-09-2019_js https://www25.zippyshare.com/v/GgMyWsRc/file.html Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: ... /Fiction Book Editor/Scrips/06_Чистка Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" Тогда будет гораздо меньше лишних срабатываний. По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую. http://www.flibusta.is/node/441303 Блог пользователя TaKir Войдите или зарегистрируйтесь, чтобы отправлять комментарии Комментарии RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано вс, 01/12/2019 - 08:30 пользователем V_E ProstoTac написал: Поэтому закладывать подобные слова в скрипт не следует. Ну, я не специалист-филолог, но мне кажется, скрипт должен ориентироваться на литературный, а не на просторечный вариант. RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано вс, 01/12/2019 - 09:30 пользователем alexej36 В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача. RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано вс, 01/12/2019 - 10:18 пользователем V_E alexej36 написал: В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача. Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики. RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано вс, 01/12/2019 - 12:09 пользователем tvnic Идеальный скрипт в любом случае не сделать. Писалось выше - улучшить бы "Генеральную уборку". RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано пн, 02/12/2019 - 07:45 пользователем TaKir tvnic написал: улучшить бы "Генеральную уборку". Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски. Какие улучшения нужны? RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано пн, 02/12/2019 - 15:37 пользователем ProstoTac А апостроф? ...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027. RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано пт, 06/12/2019 - 10:17 пользователем konst1 V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы? RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано вт, 10/12/2019 - 07:24 пользователем V_E konst1 написал: V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы? Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете. RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано вт, 10/12/2019 - 07:40 пользователем konst1 V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания. RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано ср, 04/03/2020 - 01:50 пользователем V_E konst1 написал: V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания. Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое. RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -... Постоянная ссылка (Permalink) Опубликовано вт, 31/03/2020 - 06:37 пользователем V_E Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление: скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием. Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет? Добавлено позже: Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело") Страницы « первая ‹ предыдущая 1 2 3	Вход на сайт Имя пользователя * Пароль * Запомнить меня Регистрация Забыли пароль? Навигация Книги Издательские серии Премии Рекомендации Библиотечное ЧаВо Вычитка Про вычитку Технические темы Последние материалы Поиск по блогам и форумам Поиск книг Фильтр-список Популярные книги User menu Чёрно-белый список Книжная полка Последние комментарии Aliki RE:Подайте бедному копеечку на книжку с литреса... 17 часов laurentina1 RE:Ирина Александровна Велембовская - Немцы 1 день Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 4 дня Саша из Киева RE:Избранное 1 неделя Alligatoreader RE:Багрепорт - 2 1 неделя fedor.de RE:Отображение страницы Librusek 1 неделя Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 1 неделя kopak RE:Таинственная личность админа Флибусты 2 недели blahblahblah2024 RE:Беженцы с Флибусты 2 недели sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 2 недели sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 3 недели TaKir RE:Валерия Сергеевна Черепенчук   А. Н. Николаева - Мифы... 4 недели Oleg V.Cat RE:B343695 Александр. Книга 1 4 недели Isais RE:Калибрятина/Самиздатина 1 месяц md2k15 RE:Относительно Вархаммер 40 000 1 месяц tvnic RE:"Коллектив авторов" 1 месяц SergL197 RE:Регистрация 1 месяц ejik.v RE:Viva Stiver! 1 месяц Впечатления о книгах S@iRus про Иноходец (Рымжанов) 01 12 У меня сложилось такое же впечатление, как и у Олега, о данной серии. андрей169 про Шалашов: Господин следователь 1 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература) 29 11 Забавная книга. Мне лично зашло хорошо. С продолжением обязательно ознакомлюсь. Оценка: хорошо udrees про Баковец: Не тот господин 3 (Порно, ЛитРПГ, Самиздат, сетевая литература) 29 11 Книга строго для отдыха мозгов, тем кому нравится читать про влажные подростковые фантазии про гарем, воплощенные в реальность, и сексуальные подвиги, перемешанные с фэнтези. Герой настолько крут, что особо не заморачивается ……… Оценка: неплохо udrees про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература) 29 11 Последняя книга из серии, но не последняя книга про месть киборга Вертинского. Написано в том же стиле, что и предыдущие книги. Описание во многом уделено экшену, поэтому всегда держит в тонусе, сражения, драки, убийства и ……… Оценка: отлично! lukmak про Сочинения Иосифа Бродского в 7 томах 29 11 Бродский - гений. А кто его не понимает - что ж... Он непрост. Но, ребята, если вы его не понимаете - может, это ваша проблема?.. И пиндосы тут ни при чём. nik_ol про Донцова: Амур с гранатой (Иронический детектив, Детективы: прочее) 27 11 Конечно, я рада, что книги Донцовой выходят и выходят, но неужели, если она сама их пишет, то не помнит, что «старичок» был не Коробков, а Гри, её первый муж, до Ивана в этой серии?! Или всё-таки литературные негры клепают?! Оценка: неплохо neletay про Котов: Ценитель [СИ] (Городское фэнтези, Самиздат, сетевая литература, Приключения) 27 11 Прочитала только несколько первых глав - и уже очень, очень нравится. Нравится все - сюжет, стиль, язык, ГГ, а также автор, который за всем этим видится. С удовольствием читаю дальше, надеюсь не разочароваться. Lan2292 про Ермаков: Май, весна и апокалипсис. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература) 27 11 Так себе чтиво, но не скучно. Оценка: неплохо Chernovol про Коровин: После «Украины» (Политика, Публицистика) 25 11 Интересно, такие книги кто-то покупает или их бесплатно раздают. Оценка: нечитаемо sem14 про Лазарис: Белая ворона (Историческая проза) 25 11 Леонид Гомберг 24 июля 2007 Роман известного в Израиле прозаика, поэта и переводчика Владимира Лазариса «Белая ворона» (Тель-Авив: Ладо, 2003) в этом году был включен в «лонг-лист» популярной премии «Букер». И это ……… Оценка: отлично! decim про Осне Сейерстад 25 11 Попробовала бы Сурайя-реис не подать в суд! Муж бы убил. "Для контекста добавлю, что после публикации книги семья героя подала на Сейерстад в суд за клевету, но после апелляции писательница была признана невиновной, а через ……… tvv про Кич: Большой дом [СИ] (Ужасы, Мистика, Фанфик, Юмористическое фэнтези) 24 11 Совершенно замечательное "Оккультное Простоквашино". больше впечатлений