fb2 и FBReader. Кто виноват и что делать?
Опубликовано чт, 28/05/2009 - 03:15 пользователем qwe-
Forums: Если в книге (формат fb2) попадается открывающая угловая скобка ("<"), FBReader считает, что это начало тега и, как следствие, не выводит весь текст начиная с этой строки и до конца (на латинском тексте не проверял).
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
babajga RE:Отчаянная осень 3 часа
babajga RE:Сказки Сени Малины 3 часа babajga RE:Сказки 3 часа babajga RE:Мои четвероногие друзья 4 часа DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 8 часов Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 13 часов Isais RE:Древний Рим. Подборка книг 2 дня Isais RE:Семейственность в литературе 5 дней kopak RE:Таинственная личность админа Флибусты 1 неделя kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя babajga RE:Ласси возвращается домой 1 неделя sem14 RE:Подборка о Первой Мировой 1 неделя Isais RE:удаление "двойников" 1 неделя Isais RE:Кармен Мола - Пурпурная сеть [litres] 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели Isais RE:Катя Водянова - Дом и два жениха в придачу 4 недели Aleks_Sim RE:Прошу переформатировать, распознать, etc... 4 недели Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 месяц Впечатления о книгах
Stager про Валин: Штурмуя Лапуту (Боевая фантастика, Героическая фантастика, Самиздат, сетевая литература)
26 02 Повествование окончательно стало бессвязным и немотивированным. Даже рояли кончились. Но забавно, местами увлекательно. Оценка: неплохо
Lan2292 про Nooby: Торговец (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
26 02 чЕЛОВЕК ПИСАЛ, ТРАТИЛ ВРЕМЯ, НО К СОЖАЛЕНИЮ НА ВЫХОДЕ ПОЛУЧИЛАСЬ ХРЕНЬ, А Я ЧЕСТНО ПЫТАЛАСЬ ПРОРВАТЬСЯ ЧЕРЕЗ СТРОЧКИ, НО УВЫ И АХ. Оценка: плохо
iggy71 про Маканин: Валечка Чекина (Современная проза)
25 02 Писатель намеревался, видимо, создать загадочный образ провинциалки, "в которой что-то есть", и типа все хотят с ней познакомиться поближе, и она такая себе любвеобильная, духовная и проч. Автор ей симпатизирует, но вот образ ……… Оценка: плохо
konst1 про Рубина: Окна [Авторский сборник] (Современная проза)
25 02 Вдруг Борис заметил: – Между прочим, знаешь ли ты, что еще совсем недавно, в XVIII веке, жители Корнуолла промышляли таким вот способом: в особо сильный шторм выносили на берег большие фонари и расставляли рядами там, ……… Оценка: отлично!
Дей про Господин следователь
25 02 Очень интересно. Детективная и, скажем так, бытовая линии отличные, любовная же не понравилась. Влюбился с первого взгляда, лучше её нет (это ещё даже не разговаривал с ней ни разу), вот эти китайские церемонии с ухаживаниями ………
Олег Макаров. про Капба: Как приручить дракона - 4 [СИ] (Альтернативная история, Киберпанк, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 02 Капба прекрасен как всегда. Четвёртый том не хуже (лучше!) предыдущих, хотя казалось бы куда ещё. Очень отличная книга. Оценка: отлично!
obivatel про Калинин: Вторая Отечественная [litres] (Альтернативная история, Боевая фантастика, Попаданцы)
24 02 Автор датэл: "если именно благодаря революционерам Россия потеряла шанс выйти из нее в качестве главного победителя". . Если пишешь что-то о периоде, не поленись узнать как оно было. Царя опрокинули крупнейшие промышленники ……… Оценка: плохо
mysevra про Себастьянович: Новая книга о сыроедении, или Почему коровы хищники (Здоровье)
24 02 Подход для таких ленивых как я - нет обязательных самостоятельных чисток. «Мягким тканям потребуется не менее 2 лет, а скелету - около 7.» Непонятно, есть ли это время. Оценка: отлично!
mysevra про Артюшкина: Голем [litres] (Детективная фантастика, Социальная фантастика, Научная фантастика)
24 02 Такой замечательный мир, отличный язык, но невыносимо неспешное развитие событий – кажется вот-вот случится что-то значимое, а нет, очередной проходной момент. Оценка: неплохо
Isais про Абдуллаев: Заговор в начале эры (Исторический детектив, Политический детектив)
24 02 Скучно, нудно, нехудожественно. Вместо живых картин -- картонные декорации, никто из персонажей не вызывает эмоций -- ни любви, ни ненависти, каждый абзац сопровождается таким же по размеру морализаторским поучением, высказанным ……… Оценка: плохо
Nevskaya про Сушков: «Ленинградское дело»: генеральная чистка колыбели революции (Документальная литература)
22 02 Бралась за книгу с трепетом, родная тема, Блокада, Ленинград и все такое... Прочла со стыдом, дочитывала только потому, что не умею бросать начатое. Вранье сплошное, откровенное, бесстыжее, запредельное. Уже много где на форумах ……… Оценка: нечитаемо
Belomor.canal про Акунин: На санях (Современная проза)
22 02 Лучшая, самая лучшая книга Семейной Саги Оценка: отлично! |
Отв: fb2 и FBReader. Кто виноват и что делать?
FBReader - дурацкая читалка.
Невалидные файлы - это чаще всего ошибки либрусековского конвертора, которым были сделаны fb2 во времена основания Либрусека; скобки - это обычно неправильно обработанные комментарии в теле текста.
Невалидных файлов хватает - вот список: http://lib.rus.ec/stat/invalid
Если не уверены, что корректно, то может и не надо?
Отв: fb2 и FBReader. Кто виноват и что делать?
Я не сторонник FBReader, но он здесь ни при чём. На открытые угловые скобки и другие читалки ругаются, хотя и по разному.
HaaliReader вообще не открывает книгу, СoolReader 2 показывает всё только до этого символа, конец книги теряется, а вот CoolReader 3 и AlReader не отображают всего лишь остаток абзаца, а дальше всё показывается нормально.
И FB Editor 2.0 такие книги не открывает.
Отв: fb2 и FBReader. Кто виноват и что делать?
Так я и не говорил, что дело в читалке - я просто считаю FBReader бестолковой читалкой (уточню - дурацкой и бестолковой для компьютера, мобильной мелочью я не пользуюсь).
Отв: fb2 и FBReader. Кто виноват и что делать?
FB Designer прекрасно открывает. Если в этой программе заменить треугольные скобки, скажем, на квадратные, то проблема будет решена и для других читалок.
Отв: fb2 и FBReader. Кто виноват и что делать?
>FBReader - дурацкая читалка.
Linux альтернативы?
>скобки - это обычно неправильно обработанные комментарии в теле текста.
Вернее, что-то типа сносок, но не столь это важно.
>Невалидных файлов хватает - вот список: http://lib.rus.ec/stat/invalid
Угу. У меня из этого списка вся Кристи, Чейз и Макбейн.
>Если не уверены, что корректно, то может и не надо?
Точнее сказать, уверен что некорректно :) (не заменён ">" на ">"), но по крайней мере всё читается. Вот и спрашиваю: "Что делать?"
Отв: fb2 и FBReader. Кто виноват и что делать?
Меня это тоже интересует, я альтернативы не нашел.
Отв: fb2 и FBReader. Кто виноват и что делать?
Я под Линухом пользую PyBookReader.
http://reeed.ru/prog_ornament_lin.php
Отв: fb2 и FBReader. Кто виноват и что делать?
Под Дебианом вроде бы работает Coolreader3. Под Федорой мне его собрать толком не удалось.
Отв: fb2 и FBReader. Кто виноват и что делать?
>Под Федорой мне его собрать толком не удалось.
Coolreader3 почти без проблем собрался (под Fedora). Да, описанной проблемы у него нет, но функционал - никакой.
Инструкции по сборке:
1. Распаковать исходные тексты и зайти в каталог с исходниками.
2. От root`а поставить пакет wxGTK-devel, если не стоит (yum -y install wxGTK-devel)
3. Запустить сценарий ./run_make_linux.sh
4. Зайти в каталог optimized и выполнить make install
5. Создать символьную ссылку /usr/share/fonts/truetype/msttcorefonts на каталог с TTF шрифтами от Microsoft.
Отв: fb2 и FBReader. Кто виноват и что делать?
Ну, функционал меня интересовал только с точки зрения единообразия с lbook'ом. А затык был в том, что не увиделся порт wxGTK, по-моему. Надо будет еще раз попробовать :)
Отв: fb2 и FBReader. Кто виноват и что делать?
>Я под Линухом пользую PyBookReader.
Там кроме автоскролинга перед FBReader преимуществ я не вижу.
Да и падает он на таких файлах. Кроме того давно не развивается.
AlReader - отличная читалка, прекрасно идёт под wine, но там организации книг нет.
Отв: fb2 и FBReader. Кто виноват и что делать?
Кхм... по стандарту XML знаки "<" или ">" ( и несколько других) в тексте встречаться не должны. точка. именно для их замены и были изобретены "& g t ;" , "& l t ;" и подобное.
FB2 же подвид XML.
Так что делайте валидные книги в соответствии с стандартом и не будет у вас проблем.
Отв: fb2 и FBReader. Кто виноват и что делать?
>Кхм... по стандарту XML ............
Ну так, о чём и речь. :) Поменял "<" на "<" и как бы начало читаться. Вопрос не о читалках, а о том, нужны ли кому-либо 78 читаемых файлов и куда это всё кинуть.
Не то что бы у меня какое-то чувство вины, но как бы люди руки приложили, файло кинули, и в целом я минут десять потратил на замену херьки "<" оптом...
Отв: fb2 и FBReader. Кто виноват и что делать?
Ну так не понял в чем суть жалобы ? - не валидные файлы надо править, если вы поправили - огромное вам спасибо. Конечно лучше чтоб они изначально заливались валидными но все же не валидные лучше чем ничего так что вроде все в порядке :)
Отв: fb2 и FBReader. Кто виноват и что делать?
>Ну так не понял в чем суть жалобы ?
Да небыло жалоб никаких. Суть в том, что есть читаемые файлы и лить их или не лить, а если лить, то куда?
Отв: fb2 и FBReader. Кто виноват и что делать?
Ну, вообще-то, раз Вы сами говорите, что "Точнее сказать, уверен что некорректно", то, может, ну его? ;)
А ещё лучше, вышлите на библиотечное мыло, я посмотрю, ДОисправляю и залью.
Отв: fb2 и FBReader. Кто виноват и что делать?
Отлично. Мыло какое? По большому счёту, там всего лишь нужно найти "<" и поменять следующую за ним ">" на ">". (У меня просто времени нет совсем. Извините.)
Отв: fb2 и FBReader. Кто виноват и что делать?
bibliotekar.librusec (][) gmail.com
в теме напишите "для Голмы". я буду знать.
Отв: fb2 и FBReader. Кто виноват и что делать?
Отправил. Извиняюсь за задержку.
Отв: fb2 и FBReader. Кто виноват и что делать?
Посмотрела.
Там угловыми скобками выделены сноски. Поэтому их надо не заменять, а оформить правильным образом. ;)
Сделаю.
Отв: fb2 и FBReader. Кто виноват и что делать?
>Там угловыми скобками выделены сноски.
Угу, об этом я выше говорил. Подозреваю, что большинство книг из списка - http://lib.rus.ec/stat/invalid этим и страдают.
>Поэтому их надо не заменять, а оформить правильным образом.
Я тут фильтр строчек в тридцать нарисовал, который это исправляет. В общем, могу им по файлам оптом пройтись. Не знаю только как их оптом из библиотеки выдуть. :) Ну или сам фильтр скинуть если нужен (он на awk).
Отв: fb2 и FBReader. Кто виноват и что делать?
Стыдно признаться, но я в этих всех фильтрах ни бельмеса не понимаю... :(
Посему ничего конкретного ответить не могу.
Отв: fb2 и FBReader. Кто виноват и что делать?
Да чего тут стыдного, Вам это в общем-то и не нужно.
А способа все книги с ошибками оптом скачать случайно не знаете?
Отв: fb2 и FBReader. Кто виноват и что делать?
Нет, не знаю. :(
Отв: fb2 и FBReader. Кто виноват и что делать?
Способ выкачать оптом нашёл. :) Теперь вопрос. Есть прекрасная программка исправляющая некоторые проблемы fb2 - fb2fix (http://www.assembla.com/wiki/show/fb2fix). Если я выкачаю оптом все битые файлы, обработаю корявые сноски, затем пропущу через сиё чудо и оптом волью обратно через http://lib.rus.ec/upload/ftp/fb2 это нормально?
Отв: fb2 и FBReader. Кто виноват и что делать?
Не думаю, что это хорошая идея. :(
1. Такая акция уже однажды происходила.
2. fb2fix делает файлы номинально валидными. Сноски при этом не расставляются, форматирование (например, разбиение на главы) не производится. Таким образом, файлы из списка невалидных исчезнут, но лучше от этого не станут.
Я - против. Сорри. :)
Отв: fb2 и FBReader. Кто виноват и что делать?
Ок. А если просто сноски поправлю?
Отв: fb2 и FBReader. Кто виноват и что делать?
Что Вы имеете в виду под "поправлю"?
Отв: fb2 и FBReader. Кто виноват и что делать?
>Что Вы имеете в виду под "поправлю"?
Да в общем-то именно то, с чего всё и начиналось. :)
В результате должны получиться файлы, со сносками вместо текста в угловых скобках. По крайней мере ридеры на них загибаться не будут.
Отв: fb2 и FBReader. Кто виноват и что делать?
Не знаю, честно говоря. Пока такие файлы можно выловить - то ли пожалуется кто, то ли в процессе разгребания списка "инвалидов".
Если Вы пройдётесь по ним своим скриптом, то они будут считаться валидными, но форматирования им это не добавит.
Для меня это - сомнительная выгода.
Отв: fb2 и FBReader. Кто виноват и что делать?
Не совсем так. Изложу технологию.
1. Выгребаем все невалидные файлы. Приметно 2200 штук.
2. Отбрасываем все файлы в которых нет текста вида "<Текст на русском". Остаётся примерно 900 штук.
3. В каждом из них смотрим на первое вхождение такого текста и текста перед ним. Если визуально это похоже на сноску, то считаем, что и далее по тексту это сноски. Таких файлов 256 штук.
4. Исправляем в них сноски и посылаем Вам.
5. Вы смотрите опытным глазом и выкладываете то, что на Ваш взгляд нормально.
Отв: fb2 и FBReader. Кто виноват и что делать?
В некоторых из тех файлов, что Вы прислали, только часть угловых скобок была замещена (первая?). Так что мне пришлось менять остальные.
Но коль Вы можете выделить такие "битые" файлы, было бы жаль упускать такой случай. ;)
Учитывая, однако, что каждый файл мне придётся всё равно проверить и скриптом расставить сноски, не вижу необходимости исправлять в них сноски до этого.
Поэтому встречное предложение. :)
Вы делаете первые три пункта из Вашего списка и высылаете мне полученные после фильтра файлы. Я их постепенно форматирую и выкладываю.
На файлах Агаты Кристи наработала уже некоторый алгоритм, который позволяет это делать довольно быстро.
Что скажете?
Если согласны, то мне достаточно одних файлов, списки ошибок не нужны, я их все "вижу". :)
Отв: fb2 и FBReader. Кто виноват и что делать?
>... только часть угловых скобок была замещена (первая?)
Ой, как давно это было. :)
>Вы делаете первые три пункта из Вашего списка и высылаете мне полученные после фильтра файлы.
Не вопрос. Но, уточните, в каком виде Вам будет удобнее проверять. Есть четыре варианта:
1. Ничего не менять.
2. Заменять только левую скобку.
3. Заменять обе скобки.
4. Сразу делать сноску.
>На файлах Агаты Кристи
Кстати, 256 штук - это вместе с Кристи. :)
Отв: fb2 и FBReader. Кто виноват и что делать?
Заменять обе скобки на фигурные. Можете? :)
Отв: fb2 и FBReader. Кто виноват и что делать?
На что угодно (любую последовательность символов). :)
Заменять обе скобки?
В принципе можно делать сноску, но и оставлять текст. Если ссылка правильная, то убивать текст, если нет, то сноску и ссылку.
Отв: fb2 и FBReader. Кто виноват и что делать?
Нет, ничего такого делать не надо. ;)
Замените, пожалуйста, обе угловые скобки на соответствующие фигурные. Этого будет достаточно.
P.S. Агата Кристи сделана. :)
Отв: fb2 и FBReader. Кто виноват и что делать?
Сделано (один нюанс - если после скобки латинская буква, то увы...). Получилось 29 мегабайт. Вам всё сразу или частями?
>Агата Кристи сделана. :)
Круто. :)
Отв: fb2 и FBReader. Кто виноват и что делать?
Можно сразу. Выложите куда-нибудь, ладно?
Отв: fb2 и FBReader. Кто виноват и что делать?
С выложить проблема. Отправил мылом.
Отв: fb2 и FBReader. Кто виноват и что делать?
Приложения к письму нет. :( Боюсь, что дело в объёме приложения.
Если другого способа нет, нужно разбить на несколько архивов. Скажем, по 5М. Такое приложение должно пройти.
Отв: fb2 и FBReader. Кто виноват и что делать?
Конечно нет. Это я как всегда файл не вложил. :)
Правда и гугломыл отказался такой большой принимать. Пришлось сжать 7zip`ом. Надеюсь, открыть сможете. Если что, вот ссылка на архиватор - http://www.7-zip.org/download.html
Отв: fb2 и FBReader. Кто виноват и что делать?
Обижаете. В-)
Всё получила. Займусь. :)
Отв: fb2 и FBReader. Кто виноват и что делать?
>Обижаете. В-)
Это я на всякий случай. :)
Спасибо.