Внимание! При экспорте из FineReader 11 в fb2 возможно потеря текста!!!!
Опубликовано ср, 23/05/2012 - 00:23 пользователем Belomor.canal
Forums: Привет всем! 3 апреля. Суббота ФР -11 интерпретировал как СНОСКУ! При экспорте в fb2, все сноски, которые ФР-11 не знает куда отнести в итоговый текст не попадают! В данном случае текст этой записи пропал! Смена стиля ничего не дала!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Tafobau RE:Не присылает пароль на почту 13 часов
monochka RE:Подайте бедному копеечку на книжку с литреса... 13 часов kopak RE:О группе Дятлова. О той самой, того самого... 2 дня babajga RE:Плюмаж 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя babajga RE:Блошкинс и Фрю. Опасное путешествие 1 неделя alexk RE:Багрепорт - 2 2 недели babajga RE:Удивленная сова 3 недели Larisa_F RE:Серия «Квадрат» издательства «Текст» 4 недели Aleks_Sim RE:Беженцы с Флибусты 4 недели edvud RE:Прошу переформатировать, распознать, etc... 4 недели monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц sem14 RE:«Уроки русского» 1 месяц Isais RE:Древний Рим. Подборка книг 1 месяц babajga RE:Отчаянная осень 1 месяц Впечатления о книгах
Oleg68 про Бушков: Времена звездочетов. Наш грустный массаракш (Фэнтези, Самиздат, сетевая литература)
07 04 Не шедевр, но мне понравилось. Опять на самом интересном пауза. Оценка: отлично!
Олег Макаров. про Усманов: Конец или начало? [СИ] (Героическая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
07 04 Белиберда картонная с самого начала. Трёх страниц достаточно, чтобы понять Оценка: нечитаемо
Stager про Старуха
07 04 УГ. Литературы тут нет совсем. Это чисто заклёпочническое построение, а вот с заклёпочничеством у автора большие проблемы. Он не знает того, что знает любой любознательный школьник и что даже сносно описано в Википедии. Поэтому ………
mysevra про Терехов: Каменный мост (Современная проза)
07 04 Я бы читала, мне было интересно, но автор постоянно сбивается на тошнотворное описание каких-то эпизодов взаимоотношений главного героя с его женщинами - зачем мне это знать? Оценка: плохо
mysevra про Свечин: Адский прииск (Исторический детектив)
07 04 Добротно и обстоятельно. Очень интересно описан край. Прочитала с большим удовольствием, теперь хочу прочитать всю серию. Оценка: отлично!
mysevra про Горд: LOVE-леди. Искусство отличаться от других женщин (Психология)
07 04 Наверное, кое-что можно взять на вооружение, хотя риторика американских подростковых сериалов сильно удешевляет идею. Интересно было бы воочию сравнить байгужинку, последовательницу Валяевой и барышню, проработавшую эту книгу. Оценка: неплохо
Gilean про За чужой мечтой
06 04 Читать интересно, но вот мало логики. Ну и как всегда сериал не закончен. Что не понравилось - переходы между книг, читаешь следующую и как будто не врубаешься что происходит? Через главу или две понимаешь о чем речь ………
Олег Макаров. про Панов: Кто-то просит прощения [litres] (Триллер, Детективы: прочее, Мистика)
06 04 Какая-то муть. Не дочитал. После предыдущей даже обидно Оценка: нечитаемо
lukyanelena про Вудворт: Парный танец (Любовная фантастика)
06 04 Какая-то ода абьюзу. И безобразно написаны эротические сцены. Убожество. Полно пафоса и штампов. Такое впечатление, что отдали на аутсорс какой-то малолетке. Оценка: плохо
Г.Гуслия про Скотина
05 04 Очень хорошо, можно даже сказать отлично. Вроде бы как обычный попаданец, но много свежих нюансов. Язык хороший, читается легко. Жалко, что пока только две книги. Надеюсь, продолжение будет не хуже и достаточно скоро.
magmel про Грайдер: Стажер Ли Су Джин (Попаданцы, Самиздат, сетевая литература)
05 04 Понравилось, перекликается с произведениями Кощиенко
dolle про Шаргородский: Слишком смышленый дурачок (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
05 04 Как бы попаданец в почти боярку.Оригинально, свежо и необычно. Понравилось.Отлично. Оценка: отлично! |
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Изменить размер шрифта стиля "Сноска" и "Оглавление" на ЗНАЧИТЕЛЬНО отличающийся от основного текста и проглядывать при распознании в FineReader. Найденный кусок вырезать, копировать в блокнот и возвращать копированием из блокнота.
Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Спасибо! Значит тема закрыта
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы - всё, лежащее ниже пустой строки или отбивки * * *.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Isais]Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы
Спасибо! Именно так! Ну что ж, известно кто учится на своих, а не на чужих ошибках! В общем я пока буду в ворд- там просто смотришь в конец файла и все сразу понятно!! Скачал последний билд, но вряд это это поправио!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Совершенно верно. :)
Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Метод борьбы с этими ошибками был уже описан Desenchantee. :)
Что касается самостоятельной расстановки сносок силами самого ФР, то качество этой версии хоть и намного лучше, но всё равно 100%-ной гарантии правильной расстановки нет.
Поэтому я предпочитаю пользоваться старинным методом: переношу текст сноски к слову, к которому она относится, заключая его в фигурные скобки. В ФБЕ потом эти сноски расставляются одним кликом.
В документальной литературе, где сносок очень много, сноски так не расставляю. Но после экспорта в фб2 методично - страница за страницей - проверяю сноски на наличие в боди "Примечание". Недостающие добавляю. Да, часто их текст оказывается после всего текста, но не менее часто он просто отсутствует.
При количестве сносок более 200 - этот способ всё равно более рациональный, на мой взгляд.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote golma1]Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Отличный способ с гарантией!!!!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Небольшое техническое дополнение - мне так удобнее. После объединения, находите первую сноску, нажимете кнопку стили, далее OK и сноска окрасится зелёным цветом. Далее листа страниы (Alt+стрелка) вы видите зелёные куски текста - это и есть область СНОСКИ!!! Так очень быстро можно посмотреть весь проект! Ярко зелёная область просто бросается в глаза!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Кстати говорят есть новый билд. Кто ни будь на нём пробовал? У меня 11.102.481 прошлогодний
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Спасибо что предупредили! Скачал из торрентов собирался ставить. Мой совет ребятам из Фр - сделайте опцию "различать" и "не различать"! После таких шуток, когда полстраницы обычного текста превращается в сноску, лучше без! И конечно хорошо бы, что бы экспорт из ФР был управляемый - если я сделал стиль сноска то это и есть сноска!