Вы здесьПроект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.
Опубликовано пт, 04/04/2008 - 01:59 пользователем soshial
Форум пока очень неудобный для этого, так что пока будем обсуждать здесь...
Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;)
я предлагаю "сплочиться" =D
просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.)
Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет.
СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ.
FAQ:
> Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу.
Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =)
что хотите то и выбираете)
> С каким форматом предстоит работать?
с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =)
общая информация здесь и тут
в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;)
1. общая информация о формате
2. описание тегов и простой пример книги.
3. как сделать книгу
4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только
5. несколько статей и инструкций по fb2
6. Создание электронных книг в формате FictionBook 2.1: практическое руководство
> Условия, правила вычитки, форматирования?
правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.)
[quote]а теперь главное!
в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
babajga RE:Удивленная сова 1 день
Larisa_F RE:Серия «Квадрат» издательства «Текст» 3 дня Aleks_Sim RE:Беженцы с Флибусты 3 дня edvud RE:Прошу переформатировать, распознать, etc... 3 дня monochka RE:С 8 Марта! 6 дней babajga RE:Книга чуДОМищ 1 неделя alexej36 RE:Подайте бедному копеечку на книжку с литреса... 1 неделя ProstoTac RE:Подборка о Первой Мировой 1 неделя babajga RE:Нержавеющая сабля 1 неделя sem14 RE:«Уроки русского» 1 неделя Isais RE:Древний Рим. Подборка книг 1 неделя kopak RE:О группе Дятлова. О той самой, того самого... 2 недели babajga RE:Отчаянная осень 2 недели babajga RE:Сказки Сени Малины 2 недели babajga RE:Сказки 2 недели babajga RE:Мои четвероногие друзья 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Isais RE:Семейственность в литературе 2 недели Впечатления о книгах
clomeron про Маас: Дом Земли и Крови [litres] (Детективная фантастика, Городское фэнтези, Любовная фантастика)
14 03 Ну это для совсем уж невзыскательных читателей.) Оценка: нечитаемо
clomeron про Пехов: Ветер и искры [сборник : с иллюстрациями ; litres] (Фэнтези)
13 03 Топовое фэнтези. Автор большой молодец. Оценка: отлично!
clomeron про Пехов: Страж [тетралогия] (Фэнтези)
13 03 Это одна из вершин творчества признанного мастера русского фэнтези. Всякие там Мартины и прости Господи Аберкромби нервно курят в углу.))) Оценка: отлично!
clomeron про Аберкромби: Дурацкие задания [The Fool Jobs ru] (Фэнтези)
13 03 Ну и кому вообще нужен этот рассказ? Оценка: нечитаемо
clomeron про Аберкромби: Прежде, чем их повесят [Before They Are Hanged ru] (Фэнтези)
13 03 Трэш средней степени паршивости Оценка: нечитаемо
Олег Макаров. про Сказ: Темный Герой [СИ] (Фэнтези, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
12 03 Увидев гранату, залетающую в окно, спецназовец кричит напарнику: — Тимур, осторожней! а я перестаю читать. Потому что... ну просто потому что нельзя такое читать Оценка: нечитаемо
Олег Макаров. про Костин: Книжный магазин «Альтист» (Фантастика: прочее, Попаданцы, Самиздат, сетевая литература)
12 03 Это автор начитался "Марка и Эзры" что ли? :))))
clomeron про Сандерсон: Память Света [litres] [A Memory of Light ru] (Героическая фантастика, Фэнтези)
12 03 Эпичное завершение самой масштабной фэнтези-саги за всю историю жанра. Читать всем, кто ждал официальное издание. Оценка: отлично!
clomeron про Дяченко: Время нарушать запреты [Рубеж + Пентакль] (Научная фантастика)
11 03 Классная вещь. Но это не для всех.) Оценка: отлично!
clomeron про Дяченко: Украинский цикл [Рубеж + Пентакль] (Боевая фантастика)
11 03 Отличные романы. Но качество файла так себе. Оценка: отлично!
alexk про Блейк: Решающая улика (Классический детектив)
11 03 Ведь на обложке написано - "Николас Блейк". Нахрена писать вместо псевдонима настоящее имя автора? Надеюсь никто не догадается пойти переименовать все книги Горького в Пешкова, а Булычева в Можейко?
alexk про Мор: Классическая утопия [сборник litres] (Социальная фантастика, Классическая проза)
11 03 Можно смело считать переизданием 34 тома БВЛ /b/568449 |
Комментарии
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
По ходу данными скобками заменены знаки препинания (пока нашёл на месте запятых).
Как хотите, но сделаю читабельно.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Запишем Вас в герои Либрусека!

Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
и все-таки они стремненькие))))))))))
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Причина ошибки - троеточия, и одно слово были заключены в треугольные скобки "<>" - документ получался невалидный, и при просмотре в fb2 читалке не открывался полностью.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Я уже не первый раз встречаю эту ошибку - треугольные скобки. Исправить её получается только в Investigator'e: он и открывает, и указывает на ошибку.
Интересно, откуда она берётся?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Диверсанты наверно :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Похоже, где-то что-то не так с кодовыми страницами и некоторыми специальными символами. А угловые скобки -- это испорченные типографские кавычки, аналогично и с многоточием, которое при неправильном конвертировании может превратиться в двоеточие ":".
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Дело в том, что речь, видимо, идет именно о треугольных (угловых) скобках, а не о квадратных.
Так вот, квадратные скобки действительно вылезают из недоделанных файлов, которые были в txt (например, ссылки, пропущенные места и т.п.), а угловые -- тоже криворукость перегонщика, только еще бОльшая. Например, (не надо так делать!) кто-то некорректно конвертировал *.doc в *.txt (пример: antiword -m cp866.txt file.doc > file.txt) или не совсем правильно сохранил текстовый файл (кстати, и fb2 тоже касается) в не совсем "правильном" редакторе, (пример -- редактор от FAR'а), и т.п., более подробно (с примерами) могу описАть...
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг
беру Яна Алексеева Практикум по алхимии http://lib.rus.ec/b/105377 Вычитать, расставить ссылки
запишите меня
Re: Проект по вычитке книг
Done.
Re: Проект по вычитке книг
эта книга оказалась книгой "ученье свет", с серией вместо названия, я ее удалил. можете вычеркнуть.
Re: Проект по вычитке книг
Нет. В удалённой книге - 5 частей, тогда как в "Ученье - свет" только три, они вошли в "Практикум по алхимии". Поэтому, думаю, её стоить восстановить. Может быть, указать, что это - более полный вариант, что в неё вошла книга "Ученье - свет".
Кстати, только что увидела, что "Ученье - свет" присутствует дважды. Не знаете случайно, дубли ли это?
edti: Разобралась. Однозначно дубль. Причём более ранняя версия была залита позже. :-( Я её удалила. Думаю, стоит восстановить "Практикум по алхимии" и написать "полная версия". В неё вошли и первая, и вторая книги цикла и добавлена ещё одна часть. Сделаете?
Re: Проект по вычитке книг
не нашел отличий в размере между версиями с фикшена и той, с либрусека. тогда, если там каким-то образом присутствует вторая книга, как она называется?
Re: Проект по вычитке книг
В удалённой книге - 5 частей:
1. Практикум по алхимии
2. Ученье - свет
3. Полевая практика
4. Светские хроники цвета Сиреневой Лилии
5. Раз, два, три, четыре, пять - вышли Стражи погулять.
Первые три - здесь.
Четвёртая - здесь.
Пятая часть, насколько я поняла, новая.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
У Юрия Никитина висит три книги "Как стать писателем". Две - первое издание (как я понял), третья книга является 2-м изданием. Из первых изданий, у этой http://lib.rus.ec/b/39649 в аннотации "заменить книгу, купив с Литреса", весит 132 кб, у этой http://lib.rus.ec/b/103815 вес 1,4 Мб.
Произвёл замену на 2-ю.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Случайно наткнулся на сайт с детскими книжками: http://www.childhoodbooks.ru/files.htm - сплошь DJVU. Кому нужно, кто может - перелейте, плиз, сюда. А может, кто-то и переберёт в fb2?..
Re: Проект по вычитке книг
вы посотмрите какая здесь фигнотень!! http://lib.rus.ec/b/105629/edit
да кто вообще такое заливает???)
ощущение, что у нас специальные вредители))
Re: Проект по вычитке книг
А что Вас смущает? То, что книга не на русском? :)
Я ее вряд ли прочту, но при беглом просмотре - кому-то, наверное, интересно...
Re: Проект по вычитке книг
Я тоже бегло посмотрела и погуглила немного. ;-)
Автор не указан, текст не сначала. Вот здесь - оригинал: http://www.ukrcenter.com/library/read.asp?id=2020&page=1#text_top
Текст, который расположен на Либрусеке, начинается со второй страницы. Когда будет время, исправлю. А может, кто-нибудь успеет раньше меня. ;-)
Re: Проект по вычитке книг
и что ето?
Re: Проект по вычитке книг
Hagen, это ты мне? Я ничего не поняла. :-(
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Угу, резонное дополнение.
Юникод не подскажете для неразрывного пробела? 0160, или?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Э... Помню, что амперсенд nbsp; а код - ща гляну...
Ага. В 1251 это 0xA0, а в юникоде - ага, кажется, U+00A0, т.е. опять же десятичный 160.
Нестеров готов
правда, вынужден признаться, что делал не я...
Точнее, почти закончив первую книжку, вспомнил что нужно проверить в своей библиотеке... И точно! Все уже было готовое :)
Так что готов взяться за следующего автора
Re: Нестеров готов
Бывает. ;-)
Ну, если Вы так рвётесь в бой, вот Вам списочек.
http://lib.rus.ec/b/102971
http://lib.rus.ec/b/88219
http://lib.rus.ec/b/92869
2 книги здесь - http://lib.rus.ec/a/10459
Хватит пока? ;-)
Re: Нестеров готов
Вполне! Спасибо :)
Андрэ Нортон в списке вычитки (+)
отметьте как обработанную, плз
http://lib.rus.ec/b/105218
Раткевич готова (+)
http://lib.rus.ec/b/106614
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Если просто ставить, то Ctrl+Shift+пробел (в некоторых редакциях предлагают просто Ctrl+пробел). Или нажать пробел на один раз больше, чем надо, а потом вернуть курсор при помощи BackSpace на нужное место (программа сама заменяет более двух пробелов на неразрывные).
А как сделать массовую замену в FBE, я сама интересуюсь. Пока не знаю.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Да, меня именно массовая замена интересует. Править несколько тысяч пробелов вручную я не хочу :)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Вы можете попробовать сделать так:
1. Вызвать меню "заменить".
2. В окне "найти" ввести [пробел-дефис-пробел].
3. В любом месте текста ввести [неразрывный пробел-тире-пробел] и вырезать эти три знака (Ctrl+X).
4. Вставить их в окно "заменить" (Ctrl+V).
5. Нажать "заменить все".
Аналогично с тире в диалогах:
[дефис-пробел] на [тире-неразрывный пробел]
Не очень изящное решение, но работает. Я предполагаю, что можно сделать красивее, но не знаю, как.
Подождём, что скажут специалисты. :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Соболезную. :-((
Желаю как можно скорейшего решения проблем. Сама знаю, как это обидно...
Приглашаю всех желающих создавать fb2-книги.
У нас появился новый фронт работы. Спасибо пользователю ilsatyd , любезно предоставившему исходные материалы.
По мере выкладки буду добавлять ссылки. А пока:
Бабенко. Рассказы. Сканы и rtf-файл (распознавание сохранено, насколько я поняла, как "редактируемая копия"). Брать здесь.
Бабенко. Приблудяне. Невалидный fb2-файл и два txt-файла. Брать здесь.
Два рассказа из сборника "Фата Моргана". В каждом - rtf-файл и сканы. Оба лежат здесь.
Фармер "Конец времен" Сканы и rtf-файл (распознавание такое же, как у Бабенко). Брать здесь и здесь.
Головачев "Реквием машине времени" Сканы, rtf-файл и txt-файл.
Желающие принять участие, отзовитесь.
Re: Приглашаю всех желающих создавать fb2-книги.
Ну нифига ж себе объемчик.. Я бы взялся за Фармера, если б не 100+ Мб выкачивать.
Трафик такие объемы не позволяет :(
А просто rtf отдельно нету? В смысле, без сканов.
Re: Приглашаю всех желающих создавать fb2-книги.
Есть. Только, боюсь, что без оригинала будет очень сложно. :-( Если хотите, могу выслать Вам на мыло. Пишите в личку.
edit:
Только что просмотрела Фармера. Вполне доступно. Если хотите, возьмитесь за него. А если будут проблемы, я Вам помогу сравнить со сканами.
Головачев "Реквием машине времени" Сканы, rtf-файл и txt-файл. Брать здесь и здесь.
Книги на распознавание
Обновился список книг для распознавания.
Сканы пока никуда не выложены. Желающие поучаствовать обращайтесь, пожалуйста, в личку. Договоримся о способе передачи.
Бабенко Земля
Борис Хазанов
Компьютер по имени Джо (сборник)
Крапивин "Мушкетер и фея"
Крапивин "Возвращение клипера 'Кречет'"
Крапивин "Ковер-самолет"
Теодор Томас "Целитель"
Ночь, которая умирает (сборник)
Обратная связь (сборник)
Перпендикулярный мир (сборник)
Продается Япония (сборник)
Книги на распознавание
Фармер уже "пристроен". Кто следующий? :-)
Re: Книги на распознавание
Берусь заменить файлы Пушкина, сделанные rusec-ом, оригиналами, находящимися в свободном доступе.
С небольшой задержкой: хочу восстановить отступы сделанные автором, но уничтоженные при переводе в fb2 (особое отношение Грибого и К0 к отступам). Видны на большинстве читалок, кроме AlReader-а, сохраняются при конвертации в rtf и html.
Re: Книги на распознавание
Я уже заметила Вашу работу по исправлению пушкинских драм. Браво!

Фармер готов
Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ссылку надо бы поправить. ;-)
http://lib.rus.ec/b/107126
Спасибо за Фармера. Белозерова записываю за Вами.
Фармер готов
Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".
Че за глюк?
Что-то у меня куча одинаговых постов ушла. А как лишние удалить?
Re: Че за глюк?
Сам пост удалить не получится, только текст. :-(
Страницы