Проблема конвертации PDF
Опубликовано сб, 07/06/2008 - 08:33 пользователем MegaDwarf
Forums: Проблема заключается в том, что при сохранении некоторых пдф книг в ТХТ файл (к примеру средствами того же адоби ридера) каждая строка начинается с новой строчки :))). Т.е. напиханы символы возврат каретки и новая строка (так что ли называется? \r\n короче). Как будто это стихи... Ну и в общем на КПК это безобразие читать потом очень неприятно. Может кто-то с этим сталкивался и успешно решил эту незадачу? ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Nicout RE:Таинственная личность админа Флибусты 0 сек
Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 15 часов Belomor.canal RE:Подайте бедному копеечку на книжку с литреса... 2 дня mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 3 дня zlyaka RE:С Новым годом! 4 дня Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 5 дней SparkySpirit RE:Прошу переформатировать, распознать, etc... 1 неделя SparkySpirit RE:Жорж Санд - переводы 19 века 1 неделя Саша из Киева RE:Наш дом - СССР 1 неделя babajga RE:Чернушка. Повести 1 неделя Саша из Киева RE:Сказки далёких островов 1 неделя babajga RE:Лопоухий бес 2 недели babajga RE:Ежик покидает дом 2 недели babajga RE:Сказки бабушки Черепахи 2 недели babajga RE:Свист диких крыльев 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 3 недели Isais RE:Не тот автор 1 месяц Впечатления о книгах
polyn про Мартова: Одна смертельная тайна [litres] (Детективы: прочее)
05 01 Необычайно атмосферная книга, что даже я,обычно мало обращающая внимание на антураж, прониклась. Автор проделал гигантскую работу, изучая крестьянский быт середины 19 – начала 20 века российской глубинки. Оценка: отлично!
Дядя Морган про А. В. Панов
05 01 полёт Юрия Гагарина он тоже отрицал" И правильно отрицал, ведь Ю.Гагарин "Бога не видел", а значит небесной тверди не достиг, крутился где-то поблизости, в стратосфере.
Саша из Киева про Куанг: Отчий край [Quê nội ru] (Детская проза)
04 01 У книги Во Куанга "Отчий край" ("Quê nội") есть продолжение - книга "Tảng Sáng" ("Рассвет"). Но, к сожалению, на русский язык она не переведена.
slafan про Вадим Агарев
04 01 Написано грамотно. Но постепенно сюжет замедляется, непрерывная повторяемость действий ГГ уже надоедает, набор «шуток» один и тот же, все женщины от них ежедневно «выпадают из действительности», 90% текста - описание того, ………
Анни-Мари про Анна Леденцовская
04 01 Действительно, Леденцовская - так сладко, что слипается, и рояли рядами, причем не в кустах, а вместо них.))) Но читается неплохо.
Олег Макаров. про А. В. Панов
04 01 Кейсинг - непосредственный участник событий, нуи профессионал разумеется, не диванный эксперд" Только одно скажу: полёт Юрия Гагарина он тоже отрицал.
Oleg68 про Кобен: Вне игры [Fade Away ru] (Детективы: прочее)
03 01 Книга понравилась. Очередная интересная история про Майрона Болитара. Оценка: отлично!
187 про А. В. Панов
03 01 Как подметил sd_kozel, Кейсинг - непосредственный участник событий, нуи профессионал разумеется, не диванный эксперд. Кстати у автора вышла книга "Программа «Артемида»: Новый лунный обман США. Афёра 21-го века." - о очередной ………
kerch64 про Шамбаров: Как Царь Алексей Михайлович и Богдан Хмельницкий Украину освободили (Исторические приключения, История)
03 01 Книга" не историческая а продукт современной российской пропаганды. Исторические исследования не оперируют терминологией типа - "проглотить", "одолевать", "громил" и т.п. Все это создает нужный автору эмоциональный фон. ……… Оценка: плохо
Barbud про Тарханов: Объективная реальность (Исторические приключения, Самиздат, сетевая литература)
02 01 Начав читать главу 11, с удивлением узнал, что жену Сталина звали Светланой. Это точно не наш мир!)) Оценка: плохо
Олег Макаров. про Столичный доктор
02 01 Хорошая серия. Мне понравилась. Я, правда, не спец по выискиванию ошибок, я просто удовольствие от чтения либо получаю, либо не получаю |
Re: Проблема конвертации PDF
попробуй его загнать сначала в html, а уже потом в fb2
Re: Проблема конвертации PDF
BD и FBD в помощь. OCRpad тоже хорош.
Re: Проблема конвертации PDF
Всем спасибо! Разобрался маленько :) Только вот OCRpad найти не удалось - все ссылки битые.
Re: Проблема конвертации PDF
Умеешь торрентами пользоваться? Если умеешь, вот:
http://thepiratebay.org/tor/4073583/Book_Processing_Soft_%5BScanning__Scan_Conversion_Processing__OCR_
- ссылка на соответствующий софт (там гигабайт 7, выбирай, что хошь)
Re: Проблема конвертации PDF
Да просто я не очень люблю всякие там торренты и проч. :) Но в отсутствии альтернативы пришлось заюзать твою ссылку. Спс
Re: Проблема конвертации PDF
Могу прислать/выложить более полные скрипты для OCR pad. Те, что в комплекте - далеко не все случаи обрабатывают.
Линк на саму прогу OCR pad и описание: (http://www.the-ebook.org/rus/?p=250)
Re: Проблема конвертации PDF
Ну если не очень сложно, то конечно выложи куда-нить: полюбопытствую, да может еще кому-нибудь будет полезно :)
Re: Проблема конвертации PDF
Распаковать, положить в папку "Bookcleaner что-то там" где установлена сама прога ocr pad.
http://www.savefile.com/files/1601114
при запуске Bookcleaner-а (иконка-веник) выбрать этот файлик, нажать реплэйс ол и вперед.
При необходимости - редактирвать этот файл, или создать новый, добавляя свои варианты замен.
Re: Проблема конвертации PDF
Распаковать, положить в папку "Bookcleaner что-то там" где установлена сама прога ocr pad.
http://www.savefile.com/files/1601114
при запуске Bookcleaner-а (иконка-веник) выбрать этот файлик, нажать реплэйс ол и вперед.
При необходимости - редактирвать этот файл, или создать новый, добавляя свои варианты замен.