Техническая тема про Finereader 6.0 Sprint Plus

На домашнем компе уже где-то с год стоит сабж, пиратский, естественно. Поскольку сканера дома нет, то я им практически не пользовался - один или два раза журнальные статьи распознавал. И вот на днях заметил, что какой бы текст не распознавал, в распознанном тексте дыры получаются. Типа, 10 строк распознаю - пять не распознаю, и так далее, только количество строк варьирует.

Я бы понял, если бы это была фича незарегистрированной версии по истечении триального периода, но про такое поведение нигде не написано.

Кто-нибудь сталкивался с таким и знает, как лечить? Или проще плюнуть и купить?

Если второе, то подскажите, какая версия Файнридера нужна, чтобы подсунуть ей целиком djvu или pdf со сканами и на выходе сразу получить их целиком распознанными?

Комментарии

Аватар пользователя Isais

Очень, очень замечательная версия FineReader 11: http://lib.rus.ec/node/333984
Имеет тот же неустраненный дефект: некоторые куски - по собственному усмотрению - распознает как "Оглавление", "Сноски", "Таблицы" и не включает в готовый файл. Приходится выкручиваться левым образом - на форуме golma1 рассказывала, как именно, надо поискать, - сверять файл с бумажным оригиналом и ждать выхода версии 12, где этот косяк клятвенно обещают устранить.

Вот делал сборник, там много абзацев в рассказах было ниже середины страницы и начиналось с ***. Все эти абзацы сожрались, пришлось заново открывать TIFF-ы и распознавать куски ScreenShot...

Пользуюсь FineReader 9 никаких праблем, одновременно с распознаванием во всех форматах можно править страницы и проч. Никаких преимуществ 10 и11 версии файна в упор невижу.

У 11-го преимущество - скорость распознавания. Неимоверная, по сравнению с 10-м.
А почему всего одна опечатка в посте? Разрыв шаблона, однако...

sem14 написал:
А почему всего одна опечатка в посте? Разрыв шаблона, однако...

Две.

Цитата:
У 11-го преимущество - скорость распознавания. Неимоверная, по сравнению с 10-м.

Плюс, куча форматов(фб2!) для сохранения распознанного.
Аватар пользователя PrePress

Да так себе он fb2 делает. Пилить их еще и пилить.

PrePress написал:
Да так себе он fb2 делает. Пилить их еще и пилить.

Я не знаю ни одну программу, которая делает fb2 сама по себе. Любой полученный файл - пилить ещё и пилить.
Аватар пользователя PrePress

golma1 написал:
PrePress написал:
Да так себе он fb2 делает. Пилить их еще и пилить.

Я не знаю ни одну программу, которая делает fb2 сама по себе. Любой полученный файл - пилить ещё и пилить.

Полностью согласен. Абсолютно. Но пилить после OOoFBTools, и пилить после FR11 — две совершенно разные вещи.

PrePress написал:
golma1 написал:
PrePress написал:
Да так себе он fb2 делает. Пилить их еще и пилить.

Я не знаю ни одну программу, которая делает fb2 сама по себе. Любой полученный файл - пилить ещё и пилить.

Полностью согласен. Абсолютно. Но пилить после OOoFBTools, и пилить после FR11 — две совершенно разные вещи.

И не уговаривайте, и не уговаривайте. Пробовала я ваши OOoFBTools. В-)

Я думаю, это, во-первых, дело привычки, а во-вторых, определяется усилиями, приложенными в самом ФР.
Я довольно много внимания уделяю самому распознаванию, поэтому в ФБЕ мне приходится делать намного меньше.

XtraVert написал:
Цитата:
У 11-го преимущество - скорость распознавания. Неимоверная, по сравнению с 10-м.

Плюс, куча форматов(фб2!) для сохранения распознанного.

Это мине напоминает такую же хрень с Autucad-ами 9,10,11,12 - голимый интерфейс по сравнению с 2008, куча никому нахрен не нужных наворотов, мелкие иконки и т.д. и т.п. Как будто нет отдельных программ FB2, прям челаэк-оркестр. Кампаниям просто нада отбивать бабки.
А они в етом долбаном файне даже не улучшили языковые библиотеки ... дореволюционные книги невозможно распознавать.
...ну о чем это, я главное попсу и фернтезийную хрень - без праблем... ебись она в рот ета мировая литература.

XtraVert написал:
Цитата:
У 11-го преимущество - скорость распознавания. Неимоверная, по сравнению с 10-м.

Плюс, куча форматов(фб2!) для сохранения распознанного.

Плюс возможность объединять стили.
Плюс... очень много.

11-я версия - качественный скачок вперёд по сравнению со всеми предыдущими.

Я "поймала страшное" - стили объединять конечно можно, но результат в фб2 такой же, как с "оглавлением" - их "суть" не заменяется. Особенно с заголовками плохо :( Пришлось в итоге вообще всю структуру документа сбрасывать и все размечать потом ручками.

SunnyCat написал:
Я "поймала страшное" - стили объединять конечно можно, но результат в фб2 такой же, как с "оглавлением" - их "суть" не заменяется. Особенно с заголовками плохо :( Пришлось в итоге вообще всю структуру документа сбрасывать и все размечать потом ручками.

Ээээ???
Я постоянно пользуюсь объединением стилей, с заголовками никаких проблем не было.
Вот чего не стоит объединять, так это "основной стиль". Проверено.

Добавлю: очень часто объединяю один из стилей "основной текст" с "заголовком", выбирая итоговым стилем "заголовок". Срабатывает 100 из 100.

(бьет себя пяткой в грудь и клянется) Уточняю - мне надо было половину распознавшихся "заголовков" загнать в простой текст. В ФР это было сделано, в редакторе они выплыли снова заголовками...

SunnyCat написал:
(бьет себя пяткой в грудь и клянется) Уточняю - мне надо было половину распознавшихся "заголовков" загнать в простой текст. В ФР это было сделано, в редакторе они выплыли снова заголовками...

Хммм... То есть, ты объединяла "заголовок" и "основной текст" в пользу "основного текста"? Или просто меняла стиль на странице?

При объединении заменённый стиль исчезает из списка со всеми своими атрибутами, поэтому непонятно, как это должно сработать.
Если будет ещё раз, покажи, пожалуйста, ладно?

Именно заменяла стиль полностью на основной текст. То же самое, один в один, было с "оглавлением" - стиль в FR заменялся, а назначенная роль - нет.
Оки, покажу, конечно...

Цитата:
Да так себе он fb2 делает. Пилить их еще и пилить.

Я с доками не дружу, мне проще сразу фб2 пилить.
Аватар пользователя PrePress

XtraVert написал:
PrePress написал:
Да так себе он fb2 делает. Пилить их еще и пилить.

Я с доками не дружу, мне проще сразу фб2 пилить.

Кто что предпочитает, понятное дело.
Мне, например, в Ворде нравится возможность выбирать ВСЕ фрагменты с определенным форматированием, а потом делать с этим выделением, что хочу. Например, всё жирное, по-центру, размера 12 сделать заголовком уровня 3, а похожее, но размера 14, заголовком уровня 2. И т.д.
Вот ни хрена в FBE так не сделать. При всем к нему уважении.

PrePress написал:

Мне, например, в Ворде нравится возможность выбирать ВСЕ фрагменты с определенным форматированием, а потом делать с этим выделением, что хочу. Например, всё жирное, по-центру, размера 12 сделать заголовком уровня 3, а похожее, но размера 14, заголовком уровня 2. И т.д.
Вот ни хрена в FBE так не сделать. При всем к нему уважении.

Так Вы читаете, что ли, в доке?
Аватар пользователя PrePress

golma1 написал:
PrePress написал:

Мне, например, в Ворде нравится возможность выбирать ВСЕ фрагменты с определенным форматированием, а потом делать с этим выделением, что хочу. Например, всё жирное, по-центру, размера 12 сделать заголовком уровня 3, а похожее, но размера 14, заголовком уровня 2. И т.д.
Вот ни хрена в FBE так не сделать. При всем к нему уважении.

Так Вы читаете, что ли, в доке?

Нет, разумеется, читаю я в fb2. Конкретно AlReader для КПК.
Но делаю fb2, если приходится самому, в основном, посредством Ворда с последующим использованием LibreOffice + OOoFbTools (или LOPyFB2Tools).

PrePress написал:
golma1 написал:
PrePress написал:

Мне, например, в Ворде нравится возможность выбирать ВСЕ фрагменты с определенным форматированием, а потом делать с этим выделением, что хочу. Например, всё жирное, по-центру, размера 12 сделать заголовком уровня 3, а похожее, но размера 14, заголовком уровня 2. И т.д.
Вот ни хрена в FBE так не сделать. При всем к нему уважении.

Так Вы читаете, что ли, в доке?

Нет, разумеется, читаю я в fb2. Конкретно AlReader для КПК.
Но делаю fb2, если приходится самому, в основном, посредством Ворда с последующим использованием LibreOffice + OOoFbTools (или LOPyFB2Tools).

Тогда я не поняла досады на то, что в ФБЕ не сделать разного типа заголовки.
Если Вы имеете в виду, что OOoFbTools и иже с ними делают сразу вложенные секции, то, на мой взгляд, инструмент ФБЕ для вложения секций намного удобнее. Как минимум, нагляднее. ;)

Но я чувствую, что мы снова начинаем войну остроконечников с тупоконечниками. ;)

Речь идёт о FineReader. И 11-ю версию нельзя сравнить ни с одной предыдущей. В ней есть свои баги (новые по сравнению с предыдущими версиями), но преимуществ намного (sic!) больше.

Аватар пользователя PrePress

golma1 написал:
Тогда я не поняла досады на то, что в ФБЕ не сделать разного типа заголовки.

Разумеется, в FBE можно делать заголовки разного уровня.

Я говорю только о трудозатратах на это. Своих собственных.
Повторюсь, в Ворде я выберу ВСЕ фрагменты с определенным форматированием, будь их сотни или тысячи, за 1 (одно) действие и назначу им определенный стиль. А в FBE для этого нужно либо использовать соответствующие скрипты (я в курсе про "Разбить документ на разделы..."), либо работать ручками с каждым конкретно, если у них нет определяющего признака, типа "Глава" в заголовках.

PrePress написал:

Я говорю только о трудозатратах на это. Своих собственных.
Повторюсь, в Ворде я выберу ВСЕ фрагменты с определенным форматированием, будь их сотни или тысячи, за 1 (одно) действие и назначу им определенный стиль. А в FBE для этого нужно либо использовать соответствующие скрипты (я в курсе про "Разбить документ на разделы..."), либо работать ручками с каждым конкретно, если у них нет определяющего признака, типа "Глава" в заголовках.

Вы пропустили мою реплику про работу с ФР. ;) То, что Вы делаете в Ворде, я (большей частью) стараюсь сделать сразу в ФР.
Впрочем, подытоживая, произнесу сакраментальную фразу: важен полученный результат, а не тот путь, которым к нему пришли.

И снова подчеркну: здесь речь идёт только о FineReader'e. И о том, имеет ли смысл переходить на последнюю, 11-ю, версию. :)

Аватар пользователя PrePress

golma1 написал:
И снова подчеркну: здесь речь идёт только о FineReader'e. И о том, имеет ли смысл переходить на последнюю, 11-ю, версию. :)

А я поддержу.
FR11 лучше предыдущих версий! Хотя бы по скорости. Да и по качеству распознавания хуже точно не стал. И дореволюционный текст нормально распознает, хоть выше некоторые и ругались.

Вот только генерацию fb2 я бы ему в особый плюс таки не ставил. Но это сугубо моё личное мнение. Не обращайте внимание.

PrePress написал:
Не обращайте внимание.

Нет-нет, и не уговаривайте. Обязательно буду.

Цитата:
Это мине напоминает такую же хрень с Autucad-ами 9,10,11,12 - голимый интерфейс по сравнению с 2008, куча никому нахрен не нужных наворотов, мелкие иконки и т.д. и т.п. Как будто нет отдельных программ FB2, прям челаэк-оркестр. Кампаниям просто нада отбивать бабки.
А они в етом долбаном файне даже не улучшили языковые библиотеки ... дореволюционные книги невозможно распознавать.
...ну о чем это, я главное попсу и фернтезийную хрень - без праблем... ебись она в рот ета мировая литература.

Успокойтесь, здесь не Флибуста.

в ФР11 просто указывайте в текстовом блоке "Назначение текста - Основной", а не Авто... помогает.... а напильником - по любому... хоть в ФБ2, хоть в Ворд... а качество распознавания куда лучше предыдущих версий... причем на флибусте 2 сборки, от Moralist качественнее распознает (и весит больше и памяти жретЪ :) )
а вот чтобы из него выводить(печатать) в djvu - требуется виртуальный принтер с виртуальными картриджами от Camoniva... :(
имхо - данная фича бесполезна

X