О создании OCR-слоя в дежавю. Вопрос знатокам
Опубликовано вс, 14/04/2013 - 00:19 пользователем sad369
Forums: Есть одна проблема с работой DjvuOCR, может кто-то знает решение?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
babajga RE:Отчаянная осень 1 час
babajga RE:Сказки Сени Малины 2 часа babajga RE:Сказки 2 часа babajga RE:Мои четвероногие друзья 3 часа DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 7 часов Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 12 часов Isais RE:Древний Рим. Подборка книг 2 дня Isais RE:Семейственность в литературе 5 дней kopak RE:Таинственная личность админа Флибусты 1 неделя kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя babajga RE:Ласси возвращается домой 1 неделя sem14 RE:Подборка о Первой Мировой 1 неделя Isais RE:удаление "двойников" 1 неделя Isais RE:Кармен Мола - Пурпурная сеть [litres] 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели Isais RE:Катя Водянова - Дом и два жениха в придачу 4 недели Aleks_Sim RE:Прошу переформатировать, распознать, etc... 4 недели Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 месяц Впечатления о книгах
Stager про Валин: Штурмуя Лапуту (Боевая фантастика, Героическая фантастика, Самиздат, сетевая литература)
26 02 Повествование окончательно стало бессвязным и немотивированным. Даже рояли кончились. Но забавно, местами увлекательно. Оценка: неплохо
Lan2292 про Nooby: Торговец (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
26 02 чЕЛОВЕК ПИСАЛ, ТРАТИЛ ВРЕМЯ, НО К СОЖАЛЕНИЮ НА ВЫХОДЕ ПОЛУЧИЛАСЬ ХРЕНЬ, А Я ЧЕСТНО ПЫТАЛАСЬ ПРОРВАТЬСЯ ЧЕРЕЗ СТРОЧКИ, НО УВЫ И АХ. Оценка: плохо
iggy71 про Маканин: Валечка Чекина (Современная проза)
25 02 Писатель намеревался, видимо, создать загадочный образ провинциалки, "в которой что-то есть", и типа все хотят с ней познакомиться поближе, и она такая себе любвеобильная, духовная и проч. Автор ей симпатизирует, но вот образ ……… Оценка: плохо
konst1 про Рубина: Окна [Авторский сборник] (Современная проза)
25 02 Вдруг Борис заметил: – Между прочим, знаешь ли ты, что еще совсем недавно, в XVIII веке, жители Корнуолла промышляли таким вот способом: в особо сильный шторм выносили на берег большие фонари и расставляли рядами там, ……… Оценка: отлично!
Дей про Господин следователь
25 02 Очень интересно. Детективная и, скажем так, бытовая линии отличные, любовная же не понравилась. Влюбился с первого взгляда, лучше её нет (это ещё даже не разговаривал с ней ни разу), вот эти китайские церемонии с ухаживаниями ………
Олег Макаров. про Капба: Как приручить дракона - 4 [СИ] (Альтернативная история, Киберпанк, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 02 Капба прекрасен как всегда. Четвёртый том не хуже (лучше!) предыдущих, хотя казалось бы куда ещё. Очень отличная книга. Оценка: отлично!
obivatel про Калинин: Вторая Отечественная [litres] (Альтернативная история, Боевая фантастика, Попаданцы)
24 02 Автор датэл: "если именно благодаря революционерам Россия потеряла шанс выйти из нее в качестве главного победителя". . Если пишешь что-то о периоде, не поленись узнать как оно было. Царя опрокинули крупнейшие промышленники ……… Оценка: плохо
mysevra про Себастьянович: Новая книга о сыроедении, или Почему коровы хищники (Здоровье)
24 02 Подход для таких ленивых как я - нет обязательных самостоятельных чисток. «Мягким тканям потребуется не менее 2 лет, а скелету - около 7.» Непонятно, есть ли это время. Оценка: отлично!
mysevra про Артюшкина: Голем [litres] (Детективная фантастика, Социальная фантастика, Научная фантастика)
24 02 Такой замечательный мир, отличный язык, но невыносимо неспешное развитие событий – кажется вот-вот случится что-то значимое, а нет, очередной проходной момент. Оценка: неплохо
Isais про Абдуллаев: Заговор в начале эры (Исторический детектив, Политический детектив)
24 02 Скучно, нудно, нехудожественно. Вместо живых картин -- картонные декорации, никто из персонажей не вызывает эмоций -- ни любви, ни ненависти, каждый абзац сопровождается таким же по размеру морализаторским поучением, высказанным ……… Оценка: плохо
Nevskaya про Сушков: «Ленинградское дело»: генеральная чистка колыбели революции (Документальная литература)
22 02 Бралась за книгу с трепетом, родная тема, Блокада, Ленинград и все такое... Прочла со стыдом, дочитывала только потому, что не умею бросать начатое. Вранье сплошное, откровенное, бесстыжее, запредельное. Уже много где на форумах ……… Оценка: нечитаемо
Belomor.canal про Акунин: На санях (Современная проза)
22 02 Лучшая, самая лучшая книга Семейной Саги Оценка: отлично! |
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
На этом сайте: http://djvu-soft.narod.ru/index.htm пробовали пошарится, вопросы позадавать?
На нём спецов по работе с форматом DjVu гораздо больше, чем здесь.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Судя по числу дежавю книг, появившихся здесь за последний год, здесь тоже книгоделов хватает. Но, разумеется я задал тот же вопрос на специализированном форуме у Ершова.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
занимаюсь дежавюками, но с таким не сталкивался и не заморачивался, поскольку встроенная в djvu express editor оцр от iris коряво понимает русский язык, а ежли через файнридер распознавать - нафига тогда джвю? :D сразу уж тогда в фб2
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Что-то у меня туго с объединением. Я использую сильно облегченную версию DEE, кажется, там нет этой функции. Если я правильно понял, то полная версия может объединить графику одного файла с текстовым слоем другого?
OCR от DEE использовать смысла нет. Проще заново весь файл через файнридер прогнать. Но проблема в том, что в файле №1 уже был спеллчек сделан перед сохранением в дежавю. Терять такую работу это не выход.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Может поможет эта тема?
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Совет господина Zadd
успешно сработал! Премного благодарен! Хотя немного муторно по одной странице косяки вычищать, но другого способа видимо нет. Правда распознавал "чистовую" версию с черно-белым текстом, а как повел бы себя DjvuOCR на этот раз не скажу. Обошелся файнридеровскими дежавюшками (несколько файлов по одной странице), которые прикрепил к итоговому файлу.
Небольшая поправка: раньше делали. Сейчас это уже моветон.
Upd. По здравому размышлению хочу добавить, что проблема разрешена лишь частично. Все же примерно 60 страниц (из 560) окажутся с новым, не таким качественно исправленным текстовыи слоем, каким он был после спеллчека Голмы1. Так что жалоба на работу djvuOCR остается в силе.