DJVU vs FB2 (и немного о Платоне)

Forums: 

В последнее время в обновлениях библиотеки преобладают книги в формате DJVU. Формат полезный, но не очень удобный, особенно если речь идет не о десктопе и мониторе в 17-19", а о, скажем, КПК. DJVU выкладываются, но эти же книги в родном и знакомом формате FB2 практически не появляются.

Возможно, кто-то порекомендует чем и как можно конвертнуть Диджейвю в эфбиту, да еще и так, чтобы сохранились все имеющиеся в книге сноски (notes)?

Calibre с этим делом справляться не умеет. Или не хочет. Туповат, в общем, Калибр для такого дела.

И коли речь зашла на предмет конвертнуть, как бы с CHM провернуть такое же, т.е. либо в FB2, либо хоть и в RTF. Oпять же, с сохранением сносок и проч.

А запыхтел я на эту тему из-за Платона, да, того самого, что туточки в дежавю лежит:
http://lib.rus.ec/a/9665#
Там у него 4-томник, Лосевым сделанный, но диджей-вуйнуый. А нам бы чего покомпактнее. Да и вообще обидно. В DJVU выкладываются потрясающие книги, кои с наладонника сутками бы читал, а сидя у монитора - в лом.
Ну не люблю я Пидифу и Диджея Ву, пусть даже там страницы нумерованы. Мне диплом не писать, диссер тоже.
А на FB2 заливальщики потихоньку забивают...

Хоть Платошу дали бы... Хоть в Рэтэфэ... Это уже проще.

Я пользуюсь онлайн-конвертером, вроде неплохой
http://ebook.online-convert.com/ru/convert-to-fb2

laurentina1 написал:
Я пользуюсь онлайн-конвертером, вроде неплохой
http://ebook.online-convert.com/ru/convert-to-fb2

Завис он с диджейвюшкой. Обработка, да обработка...

Я дежавюшки обычно в епабы переделываю. Получается получше, и моя читалка их прекрасно читает

laurentina1 написал:
Я дежавюшки обычно в епабы переделываю.

Вот. Пора переходить с fb2 на epub. Да, последний - "рыхлый" формат, но хоть нет этих бесящих ограничений.

Аватар пользователя V_E

Каких ограничений?

Аватар пользователя Isais

Astrowalk написал:
laurentina1 написал:
Я дежавюшки обычно в епабы переделываю.

Вот. Пора переходить с fb2 на epub. Да, последний - "рыхлый" формат, но хоть нет этих бесящих ограничений.


Конечно-конечно. И жанров в епабах в таком количестве нет, и картинки встанут как хочется им, а не верстальщику, и дескрипшн на бумажное издание и на оригинал надо пихать в сам текст, так что фиг его робот увидит...
А главное - "останется только один" шаман-профи, который превзошел верстку в EPUB-е, а не 5000 энтузиастов с простеньким fb2 наперевес! То-то правообладателям раздолье - никто не их права и приоритет не покусится.

Isais написал:
А главное - "останется только один" шаман-профи, который превзошел верстку в EPUB-е, а не 5000 энтузиастов с простеньким fb2 наперевес! То-то правообладателям раздолье - никто не их права и приоритет не покусится.

Лучше одна качественная книга, чем 5000 некачественных (которых тут, на либрусеке - 99%). Берите пример с http://feb-web.ru .

Цитата:
Лучше одна качественная книга, чем 5000 некачественных

Ковертнуть книжку в EPUB достаточно просто. Именно поэтому некачественных EPUB-ов будет гораздо больше, чем fb2.

Эй, я для себя лично делаю, если невтерпеж ждать, пока заметят и сконвертят в фб.
Так что не надо на меня всех собак вешать

Аватар пользователя Isais

Astrowalk написал:
Isais написал:
А главное - "останется только один" шаман-профи, который превзошел верстку в EPUB-е, а не 5000 энтузиастов с простеньким fb2 наперевес! То-то правообладателям раздолье - никто не их права и приоритет не покусится.

Лучше одна качественная книга, чем 5000 некачественных (которых тут, на либрусеке - 99%). Берите пример с http://feb-web.ru .


Цитата:
Фонд «ФЭБ»
Для развития и эффективного управления Фундаментальной электронной библиотекой «Русская литература и фольклор», а также для содействия сохранению и распространению культурного и научного наследия создан и приступил к деятельности Фонд «Фундаментальная электронная библиотека» (Фонд «ФЭБ») — некоммерческая организация, учрежденная академиком РАН Валентином Лаврентьевичем Яниным, Институтом мировой литературы им. А. М. Горького РАН и Научно-техническим центром «Информрегистр» Мининформсвязи РФ.
В проекте участвуют:

Институт мировой литературы им. А.М. Горького Российской академии наук (ИМЛИ РАН) — создание и ведение ФЭБ
Научно-технический центр "Информрегистр" Министерства информационных технологий и связи Российской Федерации (НТЦ "Информрегистр") — создание и ведение ФЭБ
Межведомственный суперкомпьютерный центр РАН — программно-техническая поддержка
Институт русской литературы (Пушкинский Дом) РАН (ИРЛИ) — участие в филологическом сопровождении проекта
Российская Государственная библиотека Министерства культуры Российской Федерации (РГБ) — участие в подготовке библиографии
Институт русского языка им. В. В. Виноградова Российской академии наук — подготовка словарных материалов
Петрозаводский государственный университет Министерства образования Российской Федерации (ПетрГУ) — подготовка и ведение ЭНИ “Достоевский”
Российский государственный гуманитарный университет Министерства образования Российской Федерации (РГГУ) — участие в подготовке информации
Центр проблем информатизации в сфере культуры Министерства культуры Российской Федерации (Центр ПИК) — участие в подготовке графических материалов
b.uniq'e design studio - дизайн сайта
Российский гуманитарный научный фонд
Российский фонд фундаментальных исследований
Программа «Филология и информатика» Отделения историко-филологических наук РАН
Федеральная целевая программа «Русский язык на 2002-2005 г.г.» Минобрнауки РФ


Вот когда у Либрусека будет такая поддержка от министерств РФ и РАН, собственный фонд и прочее, так сразу непременно и возьмем пример.
А пока не путайте фундаментальную научную и публичную библиотеки - это совсем разные цели, книжные фонды и читательские аудитории.

Цитата:
Лучше одна качественная книга, чем 5000 некачественных

Да прям! Если мне нужна книга, то я предпочту некачественную (из которой при желании сделаю качественную), чем отсутствие ее.

Like Indigo написал:
Цитата:
Лучше одна качественная книга, чем 5000 некачественных

Да прям! Если мне нужна книга, то я предпочту некачественную (из которой при желании сделаю качественную), чем отсутствие ее.

Тут спорный момент.
Если нужна книга, а есть некачественный текст сомнительной полноты или достоверности, то ну его нафиг, скорее всего.
Один фиг придется искать первоисточник и сравнивать, править.

А если есть скан, пусть даже не очень качественный, но поддающийся обработке, то это лучше, чем ничего, согласен.

Astrowalk написал:
Isais написал:
А главное - "останется только один" шаман-профи, который превзошел верстку в EPUB-е, а не 5000 энтузиастов с простеньким fb2 наперевес! То-то правообладателям раздолье - никто не их права и приоритет не покусится.

Лучше одна качественная книга, чем 5000 некачественных (которых тут, на либрусеке - 99%). Берите пример с http://feb-web.ru .

DJVU -> FB2 только через ABBYY FineReader.
Если есть текстовый слой, можно его вытащить. Но чтоб его облагородить возьни будет больше чем заново распознать.

Аватар пользователя Isais

Wizzzard написал:
Возможно, кто-то порекомендует чем и как можно конвертнуть Диджейвю в эфбиту, да еще и так, чтобы сохранились все имеющиеся в книге сноски (notes)?

Исключительно FineReader-ом. И сноски будут в нужном месте (частью - точно, если повезет, то и все).
Wizzzard написал:
И коли речь зашла на предмет конвертнуть, как бы с CHM провернуть такое же, т.е. либо в FB2, либо хоть и в RTF. Oпять же, с сохранением сносок и проч.
Иногда пользуюсь компилятором ChmBookCreator - у него есть функция провернуть фарш обратно сохранить текст в RTF или чем-то подобном, чтоб можно было оэфбешить.
Wizzzard написал:
А на FB2 заливальщики потихоньку забивают...
Не, не думаю. Просто база растет, надо и старые рыба-китовские причесывать, и новые конвертить, а верстальщиков не прибавляется. Так что все сам, все сам... (С)

Да и верстальщик верстальщику рознь. Иной раз проще с нуля чем править doc (rtf) протиснутый через конвертер.
..."ничего личного, только факты"

Аватар пользователя V_E

А нельзя ли как-то отфильтровать выборку книг в формате pdf и дежавю; Посмотреть, что есть в этих форматах. В последнее время мне попадались неплохие экземпляры, которые легко и качественно распознаются. И на их основе сделать fb2 версию достаточно просто.

Аватар пользователя V_E

Спасибо, посмотрел. Дошел до 24 страницы (из шестисот с лишним). Нашел пару книг, которыми, возможно попробую заняться. Но, скорее всего, будет работать метод случайного тыка.

FB2 мертворожденный формат. Его ограничения заводят в тупик развитие библиотеки. DJVU между тем отлично читается на eink с экраном от 10" по диагонали.

Astrowalk написал:
DJVU между тем отлично читается на eink с экраном от 10" по диагонали.

О как!
Огласите весь список доступных в продаже устройств на еинк с экранами больше 10 дюймов.
А то мужики-то не знают...

TaKir написал:
О как!
Огласите весь список доступных в продаже устройств на еинк с экранами больше 10 дюймов.
А то мужики-то не знают...

Ну, округлил :), 9.7". Я уж давно и художественную литературу часто читаю в pdf/djvu. Достали дурацкие ошибки распознавалок вроде "ведено" вместо "велено", не говоря уж об утрате авторских курсивов и т.п.

Astrowalk написал:
FB2 мертворожденный формат. Его ограничения заводят в тупик развитие библиотеки.

если проводить параллели, то fb2 - это doc, а epub - pdf... первый - читай и правь, а второй - только читай... можно, конечно, и редактировать, но только вместе с "танцами с бубном" :D

ANSI_us написал:
если проводить параллели, то fb2 - это doc, а epub - pdf... первый - читай и правь, а второй - только читай... можно, конечно, и редактировать, но только вместе с "танцами с бубном" :D

Вот интересно, кстати, как хранится исходник, из которого делают качественные epubы. Небось что-то вроде латеха или опять же xml.

Astrowalk написал:
ANSI_us написал:
если проводить параллели, то fb2 - это doc, а epub - pdf... первый - читай и правь, а второй - только читай... можно, конечно, и редактировать, но только вместе с "танцами с бубном" :D

Вот интересно, кстати, как хранится исходник, из которого делают качественные epubы. Небось что-то вроде латеха или опять же xml.


у кого как, наверное, если вообще хранится... во всяком случае, калибре пофигу из чего (и главное - как!) конвертить, е-куб - только из хтмл и текста, а sigil по "навороченности" напоминает всяческие редакторы хтмл (много лишних окошек со всякой инфой, на которые смотреть страшно :)... уж FBE куда удобней сделан

кстати, выкачивал я как-то не то с гуттенберга, не то еще откуда (от буржуев,в общем) одного автора... пдфки сделаны - ничего не скажешь, хорошо (весят, правда, много), явно сделаны на сканавтомате, а вот насчет епуб - тихий ужас... мало того, что виньетки всякие за текст приняты и распознаны как мусор, как еще и картинки порезаны в большинстве случаев...

Astrowalk написал:
ANSI_us написал:
если проводить параллели, то fb2 - это doc, а epub - pdf... первый - читай и правь, а второй - только читай... можно, конечно, и редактировать, но только вместе с "танцами с бубном" :D

Вот интересно, кстати, как хранится исходник, из которого делают качественные epubы. Небось что-то вроде латеха или опять же xml.

EPUB - это папка HTML, запакованная в ZIP, и вместо того, чтобы именовать её HTML.ZIP, её обозвали "новым" форматом EPUB. Тьху!
Библиотека Ершова и не подозревает, что она ипабы делать начала, ещё когда и "формат" такой не придумали.
На самом деле там есть ещё такие тонкости как двойное дублирование оглавлений в нескольких подпапках. Ну и плюс к тому, что современный HTML может быть достаточно сложным для читалок и очень часто, ГОРАЗДО чаще, чем с FB2, случается ситуация, когда файл EPUB, хорошо читаемый на одной читалке, совершенно не читается на другой, вроде бы точно такой же.
Вроде как было такое, что студия Лебедева сделала супер-пупер-мега изобретательные, охренительно замечательные EPUBы, которые читались ТОЛЬКО на ipad-ах(или ipod-ах? не помню точно). Короче, когда посыпались жалобы от владельцев неяблопродукции о том, что "ваши файлы не читаются на наших устройствах." Короче, пришлось им все супермегакрутые EPUBы переделывать.
Вот вам и самый лучший формат!
Аватар пользователя V_E

Руки прочь от fb2! Или хоть объясните, о каких ограничениях идет речь? А читалку в 10 дюймов в карман не положишь. Это только дома читать - вот это ограничение, да еще какое.

V_E написал:
А читалку в 10 дюймов в карман не положишь.

Да будут скоро разворачивающиеся экраны, будут, карманные вы души. Как будто трудно сумку с собой носить. У меня всегда айпад с собой в качестве мобильной читалки.

Аватар пользователя V_E

Не тот вопрос. Кому-то айпада хватает, а кому-то надо несколько дней без подзарядки читатать. Вопрос был о каких-то ограничениях fb2, которых нет в epub. Хотелось бы узнать, о чем именно идет речь.

DJVU - картинка, а fb2 вектор, поэтому без длительных телодвижений никак...

Вектор?! Полагаете? А вы эта... энтот самый "fb2 вектор" обыкновенным ТЕКСТОВЫМ редактором открывать не пробовали?!
Как варианты: о векторной графике см. здесь: http://ru.wikipedia.org/wiki/Векторная_графика
А о fb2-формате: http://ru.wikipedia.org/wiki/FictionBook

Alex2L написал:
Вектор?! Полагаете? А вы эта... энтот самый "fb2 вектор" обыкновенным ТЕКСТОВЫМ редактором открывать не пробовали?!
Как варианты: о векторной графике см. здесь: http://ru.wikipedia.org/wiki/Векторная_графика
А о fb2-формате: http://ru.wikipedia.org/wiki/FictionBook

Пробовала открыть. Из статьи по вашей ссылке:
Цитата:
Векторная графика...
...Типичные примитивные объекты
...Текст (в компьютерных шрифтах, таких как TrueType, каждая буква создаётся из кривых Безье)...

palla написал:
...Текст (в компьютерных шрифтах, таких как TrueType, каждая буква создаётся из кривых Безье)...

Вы всерьёз полагаете, что "обычный текстовый редактор" имеет дело с кривыми Безье? :)

VadimV написал:
Вы всерьёз полагаете, что "обычный текстовый редактор" имеет дело с кривыми Безье? :)

Это строчка из статьи в вики

palla написал:
VadimV написал:
Вы всерьёз полагаете, что "обычный текстовый редактор" имеет дело с кривыми Безье? :)

Это строчка из статьи в вики
Ну так, эта строчка и говорит о том, что Вы ошиблись, назвав FB2 "векторным" форматом. Хотя, Рыжий Тигра делал как-то софтины для вставки в FB2 векторных рисунков(читалка понимает, но FBE не понимает). Идея была в том, что для рисунков на читалках больше подходит векторный формат SVG, чем растровые JPG и PNG, т.к. векторная графика не зависит от размера читалки: 5 дюймов, 6, 7, 9, 10 - для векторной графики всё едино, а вот для растровой все эти случаи совершенно разные и картинка, сделанная для одного размера читалки, может не читаться или плохо отображаться на другой читалке. Тут ещё надо, чтобы читалка умела воспроизводить SVG. Pocketbook умеет.
Вроде как в цветных иллюстрациях размер файла векторной картинки получается гораздо больше, но вот если попробовать в монохроме, то, возможно, там как раз даст выигрыш.
Аватар пользователя alexej36

Можно DJVU пропустить через файнридер. Много времени не займет при мощности современных процессоров... А потом как есть, без вычитки конвертировать в Fb2... Вполне пригодно для чтения должно получиться. В библиотеку в таком виде нельзя заливать конечно.

alexej36 написал:
Можно DJVU пропустить через файнридер. Много времени не займет при мощности современных процессоров... А потом как есть, без вычитки конвертировать в Fb2... Вполне пригодно для чтения должно получиться. В библиотеку в таком виде нельзя заливать конечно.

Насколько я понял, это единственный способ. Правда эфбитушка сырая будет, и с ней работы еще вагон. Но читать можно. А можно (не супер-долго) и заголовки разметить, хотя бы главных уровней.

лично я клепаю дежавюки для сохранения места на диске (и для последующего распознавания), а выкладывать начал по причине отсутствия времени... народу тут много, вдруг кто и возьмётся... а так - ФР11 (портабле сборка от Moralist), в ней автоматом распознал, а потом сиди и правь\вычитывай в ней же... а уж потом - допил в FBE... самый простой способ

Я с удовольствием читаю DJVU на PocketBook 912. Очень удобно.

Посмотрел я на большие экраны, этож 9 тыщ, обидная цена, а кудаж нам бедным сиротам, да из дярёвни...(((
А читать то хоится... Вот и танцуем с бубнами помаленьку.

Хотя серьёзно. Не вижу смысла худлит и иже с ним держать в дежавю, ладно техническая литература....тут уж не разгуляешься, тока дежавю или pdf.
Даже книжку с малым количеством графиков/схем/таблиц можно красиво сделать в Fb2.
И ещё, как то я слабо представляю, как дежавю без слоя текста потом качественно распознать, вот сейчас кинул на пробу, что-то кракозябры полезли...

Astrowalk написал:
FB2 мертворожденный формат. Его ограничения заводят в тупик развитие библиотеки. DJVU между тем отлично читается на eink с экраном от 10" по диагонали.

А сейчас обидно сказал, это где тупик, покажи, интересно же, может какая новая эра грядет.

Togan написал:
И ещё, как то я слабо представляю, как дежавю без слоя текста потом качественно распознать, вот сейчас кинул на пробу, что-то кракозябры полезли...

Если djvu сделан качественно, то в распознавании никаких проблем не будет.

Togan написал:
А сейчас обидно сказал, это где тупик, покажи, интересно же, может какая новая эра грядет.

Так уже грянула - epub, а вы тут сидите и не замечаете. Давно пора принять его как основной, а fb2, так уж и быть, генерировать для желающих.

FB2 - тупик, потому что неспособен объять все нужды презентации. А поскольку эра маленьких экранчиков постепенно отходит в прошлое, свойство "униэкранности" теряет свою важность.

О.о ну ты сказал... это епаб мертворожденный)
Этот вариант был бы интереснее но давно как то все заглохло...
UPD: оказывается не заглохло.. кто то щас пилит потихоньку http://gribuser.livejournal.com/1757.html

Аватар пользователя V_E

Вот и я говорю: какие ограничения? Нормальный формат для художественной литературы. А главное - открытый.

"Мертворожденность" fb2 если и существует, то - имхо - от дурной органицации в продвижении и развитии формата.
А DJVU - хорош для сверки. А если упростят работу с ним - то станет конкурентом pdf для перевода бумаги в цифру в официальных библиотеках. Да и для домашнего использования неплох, а если проработано оглавление - то и удобен.

Аватар пользователя V_E

Да, конечно, развивать fb2 надо! Жаль, не владею навыками программирования. Но есть и еще одна проблема. Некоторые читалки не реализуют даже тех возможностей, формата, которые есть на сегодняшний день.

Аватар пользователя V_E

Дублирующееся сообщение удалено

sd написал:
А DJVU - хорош для сверки. А если упростят работу с ним - то станет конкурентом pdf для перевода бумаги в цифру в официальных библиотеках. Да и для домашнего использования неплох, а если проработано оглавление - то и удобен.

куда уж проще? ScanTailor+DjvuSmall+DjvuImager+DDE_5 (для особо ленивых - без ScanTailor :)... + закладки BookmarkTool... одно в дежавюках плохо - нет возможности вставить внутрь файла инфу (как в пдф)... точнее - есть, но вряд ли это стандарт и будет ли читаться...

Чего привязались к Векторной графике, мы в кореле, которой дро, деревенский сартир векторный чертили, потом в компас перегоняя, и что теперь))) По моему вы не туда уходите.
FB2 на сегодняшний день единственный удобоваримый кросплатформенный формат для литературы без графиков и совсем уж сложного форматирования (формулы и т.п), притом преимущества перевешивают недостатки....
Если Либрусек заделается научной библиотекой, тогда спору нет, будем все гнать дежавю, оно так даже как-то легче получается.... А пока наш девиз много книг)) то будем упор делать на fb2, а для дежавю и прочих pdf есть генезис, милости просим...
Кстати, при попытке скачивания Платона, на его зеркало и выкидывает, а там...упс...полок видно не хватило....

P.S. Единственное в поддержку существования Платона в дежавю, так это древнегреческий....

Аватар пользователя Isais

Togan написал:
P.S. Единственное в поддержку существования Платона в дежавю, так это древнегреческий....
(В скобках: в fb2 легко вставляются прописные и строчные греческие буквы и всякие особые латинские - с умляутами и т.п.)

Страницы

X