Внимание! При экспорте из FineReader 11 в fb2 возможно потеря текста!!!!
Опубликовано ср, 23/05/2012 - 00:23 пользователем Belomor.canal
Forums: Привет всем! 3 апреля. Суббота ФР -11 интерпретировал как СНОСКУ! При экспорте в fb2, все сноски, которые ФР-11 не знает куда отнести в итоговый текст не попадают! В данном случае текст этой записи пропал! Смена стиля ничего не дала!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
DenyK RE:Подайте бедному копеечку на книжку с литреса... 1 день
babajga RE:Плюмаж 2 дня Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 4 дня babajga RE:Блошкинс и Фрю. Опасное путешествие 4 дня kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя alexk RE:Багрепорт - 2 1 неделя babajga RE:Удивленная сова 3 недели Larisa_F RE:Серия «Квадрат» издательства «Текст» 3 недели Aleks_Sim RE:Беженцы с Флибусты 3 недели edvud RE:Прошу переформатировать, распознать, etc... 3 недели monochka RE:С 8 Марта! 3 недели babajga RE:Книга чуДОМищ 4 недели ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц sem14 RE:«Уроки русского» 1 месяц Isais RE:Древний Рим. Подборка книг 1 месяц babajga RE:Отчаянная осень 1 месяц babajga RE:Сказки Сени Малины 1 месяц Впечатления о книгах
Barbud про Леонтьева: Zа право жить (Современная проза, О войне)
03 04 Сойдет для принудительного внеклассного чтения в военизированном лицее имени Вошьдя и Учителя по предмету "Старые сказки о важном". Издавать надо сразу в рулонах. Оценка: нечитаемо
sem14 про Даниэль Мусеевич Клугер
03 04 Сегодня, 3/4/25, скончался и был похоронен Даниэль Клугер ז"ל благословенной памяти.
decim про Брук: Чёрный атаман. История малоросского Робин Гуда и его леди Марианн (Историческая проза, Современные любовные романы, Приключения: прочее)
03 04 Дамский софт-прон в подражание многочисленным "укрощениям дерзкого герцога". Что действие происходит не в Британии времён регентства, а в Малороссии времён гражданской войны, и за герцога тут Махно - мелочи. Те же изнасявки, ……… Оценка: нечитаемо
obivatel про Токсик: Лорд Системы 22 [СИ] (Боевая фантастика, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
03 04 Годное чтиво. 22-й том, а до сих пор не надоело. Бредятина конечно, но мир описан непротиворечиво и логика событий не хромает. Оценка: хорошо
Nivigor про Леонтьева: Zа право жить (Современная проза, О войне)
02 04 Сколько бандерюг тут отметилось! Оценка: отлично!
ne_fanat про Капба: Как приручить дракона. Книга 1 [СИ] (Альтернативная история, Киберпанк, Попаданцы, Самиздат, сетевая литература)
02 04 Выскажусь за первые 4 книги цикла. По крайней мере человек умеет писать намного лучше подавляющего большинства заливаемых тут авторов. Нормальный, хороший, правильный язык и складное повествование. Рекомендую. Оценка: хорошо
virtcatty про Леонтьева: Zа право жить (Современная проза, О войне)
02 04 Не сильно Литературно, но читать можно, и ГЛАВНОЕ НУЖНО! Чтобы люди знали. Для Лысенко ВА Да Я Русский патриот и не в коем случае как Вы пишете "рашен" Кому жить , а кому умереть каждый решает САМ и способствует этому тоже САМ!
mysevra про Толкачев: Паутина противостояния [антология] (Фэнтези)
02 04 Слабенько даже по сравнению с предыдущей антологией. Оценка: неплохо
mysevra про Толкачев: Правила крови [антология] (Городское фэнтези)
02 04 Рассказы Панова понравились, остальное - на любителя. Оценка: хорошо
mysevra про Терехов: Каменный мост (Современная проза)
02 04 Была бы хорошая летопись тех времен и будней номенклатуры, если бы не "жесткая рефлексия самого героя" вместе с его беспорядочной личной жизнью. Даже хуже чем сериал, из-за которого решила прочитать книгу. Оценка: неплохо
Лысенко Владимир Андреевич про Леонтьева: Zа право жить (Современная проза, О войне)
01 04 Как всегда только мы русские можем решать, кому жить, а кому умереть. Если не по нашему то они бандеровцы. Нечитаемо, только для рашен патриотов. Оценка: нечитаемо
Paul von Sokolovski про Первый в касте бездны
31 03 Мне понравился этот сериал. Легко читается, симпатичный главгерой , чем то напомнило старую литературу для подростков. Отлично. |
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Изменить размер шрифта стиля "Сноска" и "Оглавление" на ЗНАЧИТЕЛЬНО отличающийся от основного текста и проглядывать при распознании в FineReader. Найденный кусок вырезать, копировать в блокнот и возвращать копированием из блокнота.
Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Спасибо! Значит тема закрыта
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы - всё, лежащее ниже пустой строки или отбивки * * *.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Isais]Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы
Спасибо! Именно так! Ну что ж, известно кто учится на своих, а не на чужих ошибках! В общем я пока буду в ворд- там просто смотришь в конец файла и все сразу понятно!! Скачал последний билд, но вряд это это поправио!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Совершенно верно. :)
Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Метод борьбы с этими ошибками был уже описан Desenchantee. :)
Что касается самостоятельной расстановки сносок силами самого ФР, то качество этой версии хоть и намного лучше, но всё равно 100%-ной гарантии правильной расстановки нет.
Поэтому я предпочитаю пользоваться старинным методом: переношу текст сноски к слову, к которому она относится, заключая его в фигурные скобки. В ФБЕ потом эти сноски расставляются одним кликом.
В документальной литературе, где сносок очень много, сноски так не расставляю. Но после экспорта в фб2 методично - страница за страницей - проверяю сноски на наличие в боди "Примечание". Недостающие добавляю. Да, часто их текст оказывается после всего текста, но не менее часто он просто отсутствует.
При количестве сносок более 200 - этот способ всё равно более рациональный, на мой взгляд.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote golma1]Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Отличный способ с гарантией!!!!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Небольшое техническое дополнение - мне так удобнее. После объединения, находите первую сноску, нажимете кнопку стили, далее OK и сноска окрасится зелёным цветом. Далее листа страниы (Alt+стрелка) вы видите зелёные куски текста - это и есть область СНОСКИ!!! Так очень быстро можно посмотреть весь проект! Ярко зелёная область просто бросается в глаза!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Кстати говорят есть новый билд. Кто ни будь на нём пробовал? У меня 11.102.481 прошлогодний
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Спасибо что предупредили! Скачал из торрентов собирался ставить. Мой совет ребятам из Фр - сделайте опцию "различать" и "не различать"! После таких шуток, когда полстраницы обычного текста превращается в сноску, лучше без! И конечно хорошо бы, что бы экспорт из ФР был управляемый - если я сделал стиль сноска то это и есть сноска!