Типичные ошибки распознавания - собираем статистику для скрипта ФБЕ

Вы здесь Главная » Блоги » Блог пользователя TaKir Типичные ошибки распознавания - собираем статистику для скрипта ФБЕ Опубликовано чт, 06/01/2011 - 11:12 пользователем TaKir Собираю статистику по наиболее частым типичным ошибкам распознавания для включения их в скрипт ФБЕ: Варианты: пе (не), оп (он), пи (ни), ва (за), пее (нее), опа (она)... Прошу участвовать всех желающих. Дополненный список я хочу включить в недавно обновленный скрипт "Поиск по набору регэкспов", автор Sclex (http://groups.google.com/group/fiction-book-editor/browse_thread/thread/b4700ee54d255384), работающий под ФБЕ. Собранная статистика еще больше упростит отлов косяков сканирования и, соответственно, позволит более качественно и быстро делать верстку отсканенных книг и быстрее находить косяки в уже сделанных книгах тем, кто занимается их правкой-вычиткой. Сейчас данный скрипт у меня ищет: - смесь латиницы с кириллицей во всех вариантах, - смесь букв с цифрами, - неправильные дефисы-тире, - мусор после скана, - концы строк без знаков препинания - неполный курсив слова - указанные выше типичные ошибки распознавания и другие подозрительные места. Использование этого скрипта заметно сокращает время работы над книгой в ФБЕ. Блог пользователя TaKir Войдите или зарегистрируйтесь, чтобы отправлять комментарии Комментарии Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 04/07/2011 - 15:19 пользователем wotti Сайт группы по улучшению ФБЕ http://groups.google.com/group/fiction-book-editor Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 05/07/2011 - 13:10 пользователем JonVic wotti Раньше пробовал его подключать на кнопку в панели инструментов - у меня почему-то пропали все подсказки в нижней области окна... - это я один такой не счастливый? Да, Вы забыли сказать - чтоб поместить любой скрипт в панель инструментов - нужно создать иконку с именем скрипта и поместить ее рядом со скриптом. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 05/07/2011 - 13:19 пользователем golma1 JonVic написал: wotti Раньше пробовал его подключать на кнопку в панели инструментов - у меня почему-то пропали все подсказки в нижней области окна... - это я один такой не счастливый? Да, Вы забыли сказать - чтоб поместить любой скрипт в панель инструментов - нужно создать иконку с именем скрипта и поместить ее рядом со скриптом. Насчёт иконки - вы правы, это нужно подчеркнуть. Но скрипт можно и "подвесить" на hotkey. Я с этим именно так и сделала. Подсказки слева внизу - ОК. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 05/07/2011 - 13:26 пользователем wotti JonVic написал: wotti Раньше пробовал его подключать на кнопку в панели инструментов - у меня почему-то пропали все подсказки в нижней области окна... - это я один такой не счастливый? Да, Вы забыли сказать - чтоб поместить любой скрипт в панель инструментов - нужно создать иконку с именем скрипта и поместить ее рядом со скриптом. Ну на многие скрипты есть штатные иконки, но таки да. я пользуюсь версией ФБЕ 2.5 (2.6 у меня на ХР почему-то дико тормозит) А фича подсказки внизу экрана предусмотрена, ЕМНИП, только начиная с 2.6. Но я как-то привык уже без подсказок обходится ))) УПД. На кнопку в панели инструментов или панели скриптов? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 06/07/2011 - 00:49 пользователем JonVic Ошибся, да ставил на панель скриптов. Так на работе стоит FBE 2.6 (Win XP) и если помещаю на панель, то подсказки пропадают... да ладно, эт не существенно. Дома вынужден пользоваться FBE 2.5, т.к. в FBE 2.6 были проблемы с сохранением. А на панель инструментов можно добавить допустим "Сохранить как" и "Заменить"? Панель для редактирования доступна, но слева пусто... Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 06/07/2011 - 00:55 пользователем golma1 JonVic написал: А на панель инструментов можно добавить допустим "Сохранить как" и "Заменить"? Панель для редактирования доступна, но слева пусто... Нет. В перечне доступных их нет. Но снова рекомендую Вам "горячие клавиши". Тем более, что для "заменить" есть уже по дефолту - Ctrl+H. Для "Сохранить как..." тоже есть, но я, например, изменила на удобную для себя комбинацию. Кстати, все комбинации можно увидеть рядом с пунктами меню. А изменить их можно, как уже писал Wotti, через "Сервис -- Настройки -- Клавиши". Там есть и "навигация", и "просмотр", и "редактировать". Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 06/07/2011 - 01:09 пользователем JonVic golma1 Про комбинации клавиш в курсе, хоть я и старой закалки, мышка меня разбаловала ;) А что мешает увеличить список доступных команд в следующей версии?.. но это так, мысли вслух. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 06/07/2011 - 01:18 пользователем wotti JonVic написал: golma1 Про комбинации клавиш в курсе, хоть я и старой закалки, мышка меня разбаловала ;) А что мешает увеличить список доступных команд в следующей версии?.. но это так, мысли вслух. К сожалению SeNS очень занят в реале и развитие ФБЕ остановилось на v2.6. Улучшения сейчас происходят за счёт новых скриптов Sclex-а (и модернизации старых скриптов) и большой работы по наполнению и улучшению функции проверки орфографии, которую проводит Shaman. Но задумки по улучшению самой программы, его функционала - есть. SeNS обещал, как минимум, сделать панель работы с иллюстрациями. Как он сам сказал - Так что, еще раз: пробуем найти программиста! Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 10/07/2011 - 11:25 пользователем JonVic wotti Ясно. Жаль, а ведь как все начиналось... TaKir А когда будет готова Ваша версия скрипта "Поиск по набору регэкспов"? Спрашиваю не из праздного любопытства - собираю книжную серию и прогоняю скриптами... Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 10/07/2011 - 12:02 пользователем golma1 JonVic написал: TaKir А когда будет готова Ваша версия скрипта "Поиск по набору регэкспов"? Спрашиваю не из праздного любопытства - собираю книжную серию и прогоняю скриптами... А там Выше Roxana выложила - это и есть сборка всего появившегося в последнее время на основе регэкспов Такира. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 10/07/2011 - 22:13 пользователем JonVic golma1 Так это версия не от Такира, а от Roxana, а я спрашиваю Такира, где можно скачать его последнюю версию после "Скрипт__TaKir_24_01_2011.zip", если она есть конечно... Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 11/07/2011 - 00:37 пользователем golma1 JonVic написал: golma1 Так это версия не от Такира, а от Roxana, а я спрашиваю Такира, где можно скачать его последнюю версию после "Скрипт__TaKir_24_01_2011.zip", если она есть конечно... Хэх... Даже не знаю, что Вам ответить. В-) Ну да ладно, Такир сам ответит, если сочтёт нужным. ;-) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 11/07/2011 - 01:12 пользователем wotti Дело в том, что Такир и сделал этот блог, для возможности обсуждения и добавления скрипта. Этот скрипт, ув отличии от остальных - имеет возможность индивидуальной настройки. Версия Такира входит в первоначально выложенную версию скрипта. Она минимальна и послужила основой этой темы, обсуждения и добавления . Т/е версия Роксаны, Голмы, wotti, и др. являются просто расширенной версией Такира. Для некоторых книг, в зависимости от особенностей я добавляю пару строчек, для других - закрываю слэшами пару-тройку ненужных в данной книге регэспов. в общем этот скрипт может меняться не только у каждого юзера, но и у каждого файла. Скрипт Такира - базовый. Остальное - надстройки. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 11/07/2011 - 03:49 пользователем JonVic wotti Все это понятно и я не спорю - у каждого пользователя свои настройки... Просто хотелось начать плясать от "расписной" печки, а не от "буржуйки". Вы можете выложить свои настройки? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 11/07/2011 - 04:33 пользователем wotti JonVic написал: wotti Вы можете выложить свои настройки? Они у меня без пояснений, так как у меня стоит 2.5-версия в которой они не показываются, а выкладывать их я не планировал. Вы скажите какие именно вам нужны регеспы и, многие из отметившихся здесь, с удовольствием вам помогут их написать. А как вставить их в свой скрипт я уже описал)) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 11/07/2011 - 04:01 пользователем Roxana Еще в копилку: иди -> или узе -> уж пули -> пути гам -> там далее -> даже Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 11/07/2011 - 04:31 пользователем wotti Roxana написал: Еще в копилку: фация - грация иди -> или узе -> уж пули -> пути гам -> там далее -> даже фация - грация узе -> уж - отлично, можно сразу вставлять: `tagRegExp("(?<![а-яё])фация(?![а-яё])","i","Найдено: слово "фация" ("грация" с опечаткой).");` `tagRegExp("(?<![а-яё])узе(?![а-яё])","i","Найдено: слово "узе" ("уж" с опечаткой).");` гам -> там тоже неплохо ( с некоторым допуском на ложные срабатывания) `tagRegExp("(?<![а-яё])гам(?![а-яё])","i","Найдено: слово "гам" ("там" с опечаткой).");` А вот далее -> даже пули -> пути имхо создадут кучу холостых выстрелов))) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 11/07/2011 - 04:57 пользователем Roxana Согласна, но это как раз те случаи, которые можно отключать в зависимости от книги. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 12/07/2011 - 01:28 пользователем JonVic wotti Пояснения не актуально для меня - главное сочетания символов... - выложите, а там я разберусь и допишу подсказки... ;) Есть задумка свести данный топик воедино (может у Вас есть еще что добавить) и выложить здесь - для использования желающими... Может кто в курсе - как реализовать поиск "... Слово" в начале параграфа? (многоточие пробел Слово) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 12/07/2011 - 04:15 пользователем s_Sergius JonVic написал: Может кто в курсе - как реализовать поиск "... Слово" в начале параграфа? (многоточие пробел Слово) Я обычно ищу в режиме source, без регэкспов: `"<p>... "` Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 12/07/2011 - 04:48 пользователем golma1 JonVic написал: Может кто в курсе - как реализовать поиск "... Слово" в начале параграфа? (многоточие пробел Слово) RegExp `addRegExp("^[…] [а-я]","i","Найдено:многоточие в начале строки");` Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 12/07/2011 - 08:24 пользователем JonVic s_Sergius Если их много, да лучше удалить их все с помощью "Поиск и замена" в текстовом режиме... Но зачастую таких косяков очень мало, как и авторов любящих начинать абзац с многоточия. И часто я просто забываю проверить многоточие в начале абзаца. golma1 Спасибо, завтра попробую подключить эту напоминалку... Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 30/07/2011 - 22:19 пользователем JonVic В первой же книге нашел много ошибок, оказывается мало кто проверяет знаки препинания: [collapsed title=открыть] addRegExp("[!?.,:;][…]","i","Найдено:троеточие после знаков препинания..."); addRegExp("[.,:;][,]","i","Найдено:возможно ошибка синтаксиса"); addRegExp("[,:;][.]","i","Найдено:возможно ошибка синтаксиса"); addRegExp("[а-яё!-?»] […]","i","Найдено:троеточие пытается убежать"); addRegExp("[…][!-?]","i","Найдено:знаки препинания... после троеточия"); addRegExp("[а-яё] но ","i","Найдено: НО после слова без запятой, либо нужно ПО"); [/collapsed] Поправьте, если что не правильно, или можно что еще добавить... Еще в скрипт от Roxana можно добавить: [collapsed title=открыть] `tagRegExp("(?<![а-яё])тою(?![а-яё])","i","Найдено: слово "тою" ("того" с опечаткой).","",1);` `tagRegExp("(?<![а-яё])го(?![а-яё])","i","Найдено: слово "го" ("по или то" с опечаткой).","",1);` `tagRegExp("(?<![а-яё])ои(?![а-яё])","i","Найдено: слово "ои" ("он" с опечаткой).","",1);` [/collapsed] Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 18/07/2011 - 12:30 пользователем golma1 "гобой" --> "тобой" `tagRegExp("(?<![а-яё])гобой(?![а-яё])","i","Найдено: слово "гобой" ("тобой" с опечаткой).","",1);` Из "найдено буквы в пробелах" убрала "б" - слишком часто встречается в тексте. `addRegExp("[\\x20\\xA0\\t\\n\\r\\f][г,д,е,ё,з,й,л,м,н,п,р,т,ф,х,ц,ч,ш,щ,ъ,ы,ь,э,ю][\\x20\\xA0\\t\\n\\r\\f]","i","Найдено:буквы в пробелах");` Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 18/07/2011 - 14:07 пользователем Sclex "Б" действительно часто находилось, я как раз сегодня это обнаружил. Только запятые в регэкспе не нужны (а то будет находить запятую наравне с буквами), лучше просто: addRegExp("[\\x20\\xA0\\t\\n\\r\\f][гдеёзйлмнпртфхцчшщъыьэю][\\x20\\xA0\\t\\n\\r\\f]","i","Найдено: буква между пробелами"); Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 18/07/2011 - 14:39 пользователем golma1 Sclex написал: "Б" действительно часто находилось, я как раз сегодня это обнаружил. Только запятые в регэкспе не нужны (а то будет находить запятую наравне с буквами), лучше просто: addRegExp("[\\x20\\xA0\\t\\n\\r\\f][гдеёзйлмнпртфхцчшщъыьэю][\\x20\\xA0\\t\\n\\r\\f]","i","Найдено: буква между пробелами"); Ага, спасибо. :) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 18/07/2011 - 14:18 пользователем ab_ovo А чего он не ищет всякие "ххх- " (слово+дефис+пробел)? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 18/07/2011 - 14:31 пользователем wotti ab_ovo написал: А чего он не ищет всякие "ххх- " (слово+дефис+пробел)? ??? У меня прекрасно ищет: Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 16/08/2011 - 13:10 пользователем chas После OCR вместо И, П и Н часто появляется II. Записал в виде: tagRegExp("(?![а-яё])II(?![а-яё])","i","Найдено: слово \"II\" (\"И\" с опечаткой)."); Правильно? Или возможен другой вариант? Между знаками ? и ! должен стоять символ "<". Я убрал его, т.к. иначе строка не отображалась полностью. Почему-то. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 14/08/2011 - 06:12 пользователем wotti Вообще-то это должно искаться другими регеспами Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 16/08/2011 - 13:06 пользователем chas Ищется, когда имеется смесь латиницы с кириллицей. А если отдельно стоящий союз "И" - нет. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 05/09/2011 - 07:01 пользователем Zadd 11 → Н Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 10:45 пользователем wotti Поиск слов с двумя дефисами типа: как-ни-будь tagRegExp("([a-zа-яё]-[a-zа-яё]?-[a-zа-яё])","i","Найдено: слово в двумя дефисами).","",1); у меня частенько заглавная буква \Л\ превращается в \JI\ (особенно в инициалах): tagRegExp("(?<%![a-zа-яё])JI(?![a-zа-яё])","i","Найдено: \"JI\" (\"Л\" с опечаткой)."); УБРАТЬ ЗНАК % Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 11:49 пользователем XtraVert Цитата: поиск слов с двумя дефисами типа: как-ни-будь Большое спасибо, очень полезные добавления. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 13:15 пользователем wotti XtraVert написал:* Цитата: поиск слов с двумя дефисами типа: как-ни-будь Большое спасибо, очень полезные добавления. Могу предложить для поиска слов с двумя дефисами и замены вот такой отдельный регесп: ([a-zа-яё])-([a-zа-яё]?)- в поле замены: $1$2 Но нужно проверять - замена убирает дефисы вообще, так, что "ЗАМЕНИТЬ ВСЁ" здесь не пройдёт. Но мне удобно :)) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 13:17 пользователем golma1 wotti написал:* у меня частенько заглавная буква \Л\ превращается в \JI\ (особенно в инициалах): tagRegExp("(?<%![a-zа-яё])JI(?![a-zа-яё])","i","Найдено: \"JI\" (\"Л\" с опечаткой)."); УБРАТЬ ЗНАК % А почему так сложно? И "i", по-моему, тут лишнее. Мы же только о верхнем регистре говорим, или? У меня `tagRegExp("(JI)","","Найдено: ,буквы "JI" (возможно, Л).","",1);` тоже работает. Я что-то упустила? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 13:59 пользователем wotti golma1 написал: wotti написал: у меня частенько заглавная буква \Л\ превращается в \JI\ (особенно в инициалах): tagRegExp("(?<%![a-zа-яё])JI(?![a-zа-яё])","i","Найдено: \"JI\" (\"Л\" с опечаткой)."); УБРАТЬ ЗНАК % А почему так сложно? И "i", по-моему, тут лишнее. Мы же только о верхнем регистре говорим, или? У меня `tagRegExp("(JI)","","Найдено: ,буквы "JI" (возможно, Л).","",1);` тоже работает. Я что-то упустила? Ты права Наверное нужно таки вставить впереди кириллицу и пробел Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 14:07 пользователем golma1 wotti написал: Ты права Наверное нужно таки вставить впереди кириллицу и пробел Нет, пробел не надо, а то в начале строки не выловит. Или? А если кириллица, то сработает регэксп на "смесь кириллицы и латиницы". Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 14:21 пользователем wotti golma1 написал: wotti написал: Ты права Наверное нужно таки вставить впереди кириллицу и пробел Нет, пробел не надо, а то в начале строки не выловит. Или? А если кириллица, то сработает регэксп на "смесь кириллицы и латиницы". Дело в том. что этот косяк у меня проявляется ТОЛЬКО в начале слова или в инициалах Да бог с ним - я бывает и просто заменой меняю, если латинского нет в тексте Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 19/09/2011 - 14:40 пользователем golma1 wotti написал: Дело в том. что этот косяк у меня проявляется ТОЛЬКО в начале слова или в инициалах Угу, у меня тоже. Я именно для инициалов сделала. Но инициалы бывают и в начале строки. ;) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 31/10/2011 - 03:54 пользователем wotti Заметил что в ФР11 при сохранении в ФИ2 картинки часто оформляются тегом table А если картинок много - руками править не комфортно. в режиме кода сделать масс-замену регеспом найти: `(</table>)\|(<table>\|<td/>\|<td/>\|</tr>\|<tr>\|<th/>)` заменить на: ( ничего) Удобно когда изображений много и идут блоками. как в сериях ЖЗЛ или в "Повседневная жизнь" Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 31/10/2011 - 05:21 пользователем golma1 wotti написал: Заметил что в ФР11 при сохранении в ФИ2 картинки часто оформляются тегом table А если картинок много - руками править не комфортно. в режиме кода сделать масс-замену регеспом найти: `(</table>)\|(<table>\|<td/>\|<td/>\|</tr>\|<tr>\|<th/>)` заменить на: ( ничего) Удобно когда изображений много и идут блоками. как в сериях ЖЗЛ или в "Повседневная жизнь" Спасибо. А то я их каждую массовой заменой удаляла. :( Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 31/10/2011 - 05:17 пользователем golma1 wotti написал: Заметил что в ФР11 при сохранении в ФИ2 картинки часто оформляются тегом table А если картинок много - руками править не комфортно. в режиме кода сделать масс-замену регеспом найти: `(</table>)\|(<table>\|<td/>\|<td/>\|</tr>\|<tr>\|<th/>)` заменить на: ( ничего) Удобно когда изображений много и идут блоками. как в сериях ЖЗЛ или в "Повседневная жизнь" Спасибо. А то я их каждую массовой заменой удаляла. :( Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 24/11/2011 - 03:54 пользователем XtraVert Cгорел комп и "всё, шо нажито непосильным трудом, — всё погибло"(с). Программки нужные уже установил, но не хватает актуальных скриптов. Поделитесь, пожалуйста. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 24/11/2011 - 05:10 пользователем wotti Поиск по набору регэкспов http://minus.com/m74y1WFI0 Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 24/11/2011 - 05:33 пользователем justserge wotti написал: Поиск по набору регэкспов http://minus.com/m74y1WFI0 Скачалось - «Ярлык для 17_Поиск по набору регэкспов.lnk» - 943 байт. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 24/11/2011 - 05:58 пользователем wotti justserge написал: wotti написал: Поиск по набору регэкспов http://minus.com/m74y1WFI0 Скачалось - «Ярлык для 17_Поиск по набору регэкспов.lnk» - 943 байт. Сорри ступил: http://www.multiupload.com/L2KTM7AE47 Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 24/11/2011 - 05:56 пользователем XtraVert Цитата: Скачалось - «Ярлык для 17_Поиск по набору регэкспов.lnk» - 943 байт. таки да. не скрипты это. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 24/11/2011 - 06:19 пользователем XtraVert спасибо. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 06/12/2011 - 09:52 пользователем chas Перестал работать скрипт "Латиница в Кириллице". Подскажите в чем может быть проблема, плз. Страницы « первая ‹ предыдущая 1 2 3 4 5 6 7 следующая › последняя »	Вход на сайт Имя пользователя * Пароль * Запомнить меня Регистрация Забыли пароль? Навигация Книги Издательские серии Премии Рекомендации Библиотечное ЧаВо Вычитка Про вычитку Технические темы Последние материалы Поиск по блогам и форумам Поиск книг Фильтр-список Популярные книги User menu Чёрно-белый список Книжная полка Последние комментарии Aliki RE:Подайте бедному копеечку на книжку с литреса... 17 часов kopak RE:Таинственная личность админа Флибусты 2 дня kopak RE:О группе Дятлова. О той самой, того самого... 2 дня babajga RE:Ласси возвращается домой 3 дня sem14 RE:Подборка о Первой Мировой 4 дня Isais RE:удаление "двойников" 5 дней Isais RE:Кармен Мола - Пурпурная сеть [litres] 2 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 недели Isais RE:Катя Водянова - Дом и два жениха в придачу 3 недели Aleks_Sim RE:Прошу переформатировать, распознать, etc... 3 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 недели Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 месяц Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 месяц Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 1 месяц babajga RE:Белая княжна 1 месяц Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 месяц mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 1 месяц zlyaka RE:С Новым годом! 1 месяц Впечатления о книгах Barbud про Семин: Конструктор (Исторические приключения, Попаданцы, Самиздат, сетевая литература) 20 02 Малоинтересное чтиво без художественных достоинств и исторической достоверности. Автор поднаторел на написании сказок с магией и прочими вытребеньками, где не нужно знать историю и следить за отсутствием анахронизмов, поэтому ……… Оценка: нечитаемо nik_ol про Донцова: Дезертир из рая [litres] (Иронический детектив, Детективы: прочее) 19 02 Ребятки, а что так редко стали выкладывать Донцову, Луганцеву и Полякову? Ну, Полякова-то понятно, там её невестка как бы сейчас книги пишет, а Донцова? Скучаю уже, я её между Пелевеным читаю, например, для разгузки мозга))). Оценка: хорошо decim про Ксенз: Золотая стена (Современная проза, Публицистика) 19 02 Автор не буйный , это хорошо. Больше ничего хорошего. Ну там Фаэтон, Гиперборея, Атлантида... а Чёрное море, должно быть, выкопали на сдачу. Потомков ассуров(так в книге) сдали на съедение Горбачёв с Волкогоновым. Который ……… Оценка: нечитаемо mysevra про Зорич: Очень мужская работа [HL] (Боевая фантастика) 19 02 Здесь больше Зорича, чем Жарковского. «Тварь» показалась интереснее. Оценка: плохо mysevra про Жарковский: Времена смерти [litres] (Космическая фантастика, Научная фантастика) 19 02 Это было необычно, мне бы хотелось продолжения. Оценка: хорошо alexk про Скабер: Двойник Короля 5 (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература) 19 02 Неужели так сложно понять, что если аннотация не отображается, то в ней присутствуют символы, которые сайт либрусека игнорирует? И поправить залитый файл? Я уж не мечтаю о том, что вы будете заливать валидные файлы сразу... decim про Бобров: Эпоха мертворожденных [= Украина в огне] (Альтернативная история) 19 02 Автор не взял тяжёлую тему. Надорвался при первом подходе. Можно усвоить, что война была неизбежна. В данном раскладе да. И что мы усвоим ещё - что автор любит боёвку, аж пищит, и не любит баб как пол. И всё! Что ……… Nicout про Владимирский: На киевском направлении (Военная документалистика) 18 02 Сколько погибло советских солдат при взятии Киева? По немецким данным, под Киевом к 24 сентября было взято в плен 665 тысяч человек. По данным, опубликованным в 1993 году Генштабом Вооружённых Сил РФ, советские потери ……… pulochka про Малиновская: Под колпаком у ректора [litres] (Фэнтези, Юмористическое фэнтези) 18 02 Книга сама неплоха, НО....я не мазохистка! Серия из одной книги??Это уже из рук вон какое гадство! Нельзя так измываться над читателем. Я прямо спрашиваю автора: Где окончание и почему на самом актуальном месте ......ничего ……… Оценка: неплохо Belomor.canal про Ширвиндт: Мемуары двоечника (Биографии и Мемуары) 17 02 Текст, написанный сыном известного артиста, который с ранних лет был частью артистической среды. Вечеринки заканчивались в три часа ночи, а иногда и позже. Всё это происходило под руководством Маркуши Захарова из «Ленкома», ……… Оценка: хорошо Aleks_Sim про Владимирский: На киевском направлении (Военная документалистика) 17 02 Книга сделана и перезалита на основе текста из militera.lib.ru mysevra про Замяткин: Тай-чи языка, или Вас невозможно научить иностранному языку (Языкознание, Иностранные языки, Самиздат, сетевая литература) 17 02 По форме - много пустой болтовни в фиглярской манере, но по сути метод очень хорош, опробован на английском: в результате заполнились пробелы в аудировании и спонтанном говорении, которые до этого не могли исправить ни школа, ……… Оценка: отлично! больше впечатлений