Проект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.

Форум пока очень неудобный для этого, так что пока будем обсуждать здесь... Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;) я предлагаю "сплочиться" =D просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.) Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет. СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ. FAQ: > Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу. Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =) что хотите то и выбираете) > С каким форматом предстоит работать? с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =) общая информация здесь и тут в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;) 1. общая информация о формате 2. описание тегов и простой пример книги. 3. как сделать книгу 4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только 5. несколько статей и инструкций по fb2 6. Создание электронных книг в формате FictionBook 2.1: практическое руководство > Условия, правила вычитки, форматирования? правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.) [quote]а теперь главное! в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]

Комментарии

спасибо тебе большое.
будем ждать)

Здравствуйте!
Попробовала заменить "Обездоленный" Ле Гуин вычитанным файлом. Не вышло.Выскакивает вот такая штука:
Добавление книги:
inflating: ocr/Tanja45/Le_Guin_Ursula_Obezdolennyj.fb2
Добавленине книги Le_Guin_Ursula_Obezdolennyj_FB2_vichitan..
Наменование: Обездоленный
Версия не лучше: Обездоленный 1.0:1.0
Как это можно сделать? Нельзя ли это как-нибудь доступно мне объяснить?

Tanja45 написал:

Как это можно сделать? Нельзя ли это как-нибудь доступно мне объяснить?

Измените версию документа на 1.1, тогда при заливке не будет проблем.
После заливки будет найдет дубль. Выберите свой и нажмите на линк "оставить эту".

Кстати, в названии не обязательно добавлять "вычитан". ;-))) Вы можете эту информацию добавить в document-info/history.

Спасибо golma1 большое. Я уже догадалась про старшую версию. Вроде бы я как-то это проделала...,ну...или, по крайней мере, мне так кажется

Не прошло и года, как я и сама догадалась, как заменить - добавлена вычитанная версия и анотация.

Точнее делаю сравнение всех версий документов которые попадаються под руку, а потом вычитываю.

спасибо большое.
не забывайте проверять на альдебаране и других библиотеках (сравнивать по версиям) - вдруг там уже некоторые книги вычитаны и обновлены.

у этой книжки что то с кодировкой http://lib.rus.ec/b/102041/edit
исправьте пож-ста.

Там надо исправить кодировку windows-1252 на windows-1251 и перегнать в UTF-8.

ПОхоже глюкнуло в сканере библиотеке. Файл в ANSI, и указано "windows-1251"

Латынина "Нелюдь" Вычитана и добавлена.

Вот спасибо! Очень быстро и качественно...

...Кстати, это, кажется, первая книга "сделано для Либрусека"? :)

Первая книга специально для Либрусека была отсканирована почти год назад, в самом начале.
Успенский, Три холма, охраняющие край света.
Сильно я тогда порадовался.
http://lib.rus.ec/node/5

огромное спасибо!!

Кстати, наткнулся на отсутствие одной главы в Азимовской книге "Выбор катастроф"

Айзек Азимов "Выбор катастроф" 884K
http://lib.rus.ec/b/70898

цитата:
"P.S. В ДАННОМ ФАЙЛЕ ПРОПУЩЕНА 8 ГЛАВА. ОБРАЩАЕМСЯ КО ВСЕМ, У КОГО ЕСТЬ ЭТА КНИГА: ПРОСИМ ПЕРЕДАТЬ ОТСКАНИРОВАННУЮ 8-Ю ГЛАВУ ИЛИ ПОЛНЫЙ ФАЙЛ ВСЕЙ КНИГИ..."

По всему инету (с 2006 года) текст один и тот же, без 8 главы. Или может там просто попутана нумерация глав?

Если у кого есть оригинал - не сочтите за труд, плиз!

Хочеться ругаться матом, причем в голос... Полгода прошло, а СЕРИИ, при добавлении книг, автоматом не проставляются.

напиши Ларину - он тут же сделает!!
раз нужно - будет!))

Еще полгода назад писал, так как и о том, что при поиске дубликатов не отраюатывают некоторые буквы например "р"

http://lib.rus.ec/node/180
http://lib.rus.ec/node/185

Обратите внимание на даты...

"Ночной смотрящий"
Три замены
:s/Лузган/Лузгин/
Версия исправлена на 1.1.
Что за хуйня?!.
Почему попытка в лоб заменить версию провалилась?
Недоработка.
Надо проверять файлы не по размеру, а [хотя бы] по контрольным суммам MD5.
Заменять посредством удаления книги пока не хочу. Может завтра-послезавтра попробую.

"Храбр"
:s/ктот/кто/
:s/обрвали/оборвали/
:s/Ваизантии/Византии/
Версия исправлена на 1.1. Обновил.

"Эпоха великих соблазнов"
:s/лысаая/лысая/
Версия исправлена на 1.1. Обновил.

Даёшь явный журнал исправлений: чтобы было видно кто, на что и почему заменил книгу!
И чтобы можно было относительно дёшево синхронизировать разные ветки исправлений.

я тоже бы этого хотел, Ларину предлагал месяца два назад. он сказал что у него пока другие дела по сайту более срочные нужно сделать ;(

если совсем мало ошибок, то, думаю, на одну десятую версию увеличивать - это чересчур))
может, на одну сотую?))))))

Anarchist написал:
"Ночной смотрящий"
Надо проверять файлы не по размеру, а [хотя бы] по контрольным суммам MD5.

Сколько копий на этом сломано...
Сравнение по размеру - мешают utf-8<->win-1251; табуляции в межтеговом простанстве; переводы строки и т.п.
md5 - тоже самое. А если сначала приводить к одному шаблону - то это нужно большие мощности.

Все таки самое правильное - проставлять версию, заполнять историю и в случае сомнений внимательно сравнивать, причем глазами!!!

Возьмусь за вычитку Убить пересмешника, так что заносите в списки и меня.

По поводу двух версий Убить пересмешника - они одинаковы, разница в размере возникла из-за разных кодировок при создании fb2. Ну и издательства разные (естественно и обложки).

ясно. будем ждать, когда закончите вычитывать =)

Аватар пользователя Грейт

А мои сообщения в личку доходят? Если нет, я писал, что сейчас на половине, потихоньку работаю, сейчас больше времени, так что возможно увеличение темпа.=)

нет, мне ни одно не пришло((
а ты тоже пересмешника что ли вычитываешь?
или что то другое? то, что в таблице?

Аватар пользователя Грейт

Я Гиппопотама еще.:D

Какую именно из двух книг ты вычитываешь? Я вот эту - Убить пересмешника, там встречаются мелкие огрехи OCR - замена "е" и "о" и т. п. Сноски тоже не проставлены.

Вычитываю регулярно, но мало. :) Что именно - уже не помню, только две книги запомнил - Павла Шумила http://lib.rus.ec/b/101466 "Процент соответствия" и http://lib.rus.ec/b/103155 "Краткие полёты Стелси" (эту ещё и ёфицировал! :) ). Так что меня тоже записывайте.

окей =)
насчет ёфикации - ты там не переусердствуй))
нужно ставить только в тех местах где необходимо уточнение а не везде, а то читать трудно((

soshial написал:
насчет ёфикации - ты там не переусердствуй))
нужно ставить только в тех местах где необходимо уточнение а не везде
Э, нет. "Ё" - или её признаём как букву, или нет. Знаком препинания буква "ё" точно никогда не была и не будет. Поэтому - будет всюду, где её законное место.

с этим не согласен ((
по правилам русского языка см. Вики здесь буква „ё“ пишется в следующих случаях::

Цитата:

1. Когда необходимо предупредить неверное чтение и понимание слова, например: узнаём в отличие от узнаем; всё в отличие от все; вёдро в отличие от ведро; совершённый (причастие) в отличие от совершенный (прилагательное) и т. п.
2. Когда надо указать произношение малоизвестного слова, например: река Олёкма.
3. В специальных текстах: букварях, школьных учебниках русского языка, учебниках орфоэпии и т. п., а также в словарях для указания места ударения и правильного произношения

soshial написал:
с этим не согласен ((
по правилам русского языка см. Вики здесь буква „ё“ пишется в следующих случаях::
Ради бога. В далёком 1956-м это прокатывало. Но сейчас, когда даже выпускники-программисты страдают усечением пассивного русского словарного запаса ниже уровня активного запаса школьника 50-60-х годов (а тем более в exSU за пределами РФ), ИМХО будет не лишним всё ж подчёркивать правильное произношение во всех случаях, когда это нужно.

Само собой, я никого не призываю к насильственной ёфикации всего, но буду рад, если многие этому последуют. :)

PS. Из той же статьи Википедии:

Цитата:
[...] Традиционная необязательность употребления привела к ошибочным прочтениям, которые постепенно становились общепринятыми. Они затронули всё — и огромную массу личных имён[15], и множество имён нарицательных.
Изменение написания имён
Так, например, буква „ё“ исчезла из написаний (а затем и произношений) фамилий: кардинала Ришелье (фр. Richelieu)[22], философа и писателя Монтескье (фр. Montesquieu)[23], физика Рентгена (нем. Wilhelm Conrad Röntgen) [24], микробиолога и химика Луи Пастера (фр. Pasteur), художника и философа Н. К. Рериха[25] и др. Иногда произносят неправильно фамилию математика П. Л. Чебышёва (в последнем случае даже с изменением места ударения: Че́бышев вместо правильного Чебышёв)[26].
Исчезла буква „ё“ и из фамилии дворянина Лёвина[27], персонажа романа Л. Н. Толстого „Анна Каренина“, фамилия которого превратилась в „еврейскую“ — „Левин“[28]. Здесь герой разделил судьбу автора: Толстого звали Лёв, а не Лев, о чём свидетельствуют, например, его прижизненные иностранные издания с именем Lyof или Lyoff на обложке [...] [29].

Шумил старается держать у себя на страничке самую вычитанную версию своих книг. Отошли ему вычитанный текст , уважь автора.

bookmist написал:
Шумил [...] Отошли ему вычитанный текст , уважь автора.
О, это идея. Я тоже вычитал парочку его вещей, поделюсь...

сорри, сдублировалось

Аватар пользователя Captain Scarlett

Запишусь-ка и я тоже. Поскольку де-факто все равно уже участвую. :) Делаю правку fb2-книг (форматирование, структура, сноски) и конвертацию других форматов в fb2. Вычитку не делаю (глаза быстро устают).

izaraya написал:
Запишусь-ка и я тоже. Поскольку де-факто все равно уже участвую. :) Делаю правку fb2-книг (форматирование, структура, сноски) и конвертацию других форматов в fb2. Вычитку не делаю (глаза быстро устают).

А Вы и так уже в списке. ;-)
ТЫНЦ

как тебе мой tribute тебе? )))

Аватар пользователя Грейт

Пристом хочу заняться.:(

Грейт написал:
Пристом хочу заняться.:(

В каком смысле? Вычитать?
Давай названия, ссылки. Внесём в список. :-)

P.S. Ой, я случайно на "ты" обратилась. *краснеет* Ничего? ;-)

Аватар пользователя Грейт

Распознаванием. Он там в соответствующем разделе есть. Лотерея называется.:) я ведь правильно понял, что книга уже отсканирована и нужно только разобраться с сырым текстом? / Я и с 50-ти летними людьми иной раз на "ты", так зачем же называть на "вы" семнадцатилетнего дурака?:)

твующем разделе то, что нужно отсканировать;((
если хочешь - могу вручить книжку, если ты в Москве... )

Аватар пользователя Грейт

Я думал, уже отсканировали.:'( От Москвы я далековато буду.:)

Подписываюсь на вычитку фентези. Кидай книги в личку.

hagen написал:
Подписываюсь на вычитку фентези. Кидай книги в личку.

Смотри, ЗДЕСЬ ты можешь выбрать книгу, которую будешь вычитывать (там же есть ссылки), или внести другую, которую надо вычитать.
Список нужен для того, чтобы несколько людей не делали одновременно одну и ту же работу.

А в списке ты уже есть. ;-)

Роджер Желязны, Филип Дик Господь гнева http://lib.rus.ec/b/60806

буду читать, хехе, и вычитывать. Другого названия ненашел, вобщем пиши меня на энту книгу.

хм, орфографических ошибок и серьезного нарушения форматирования я не вижу. только нерасставлены главы, сноски, и тд...... по-моему книгу скопирастили со SCILIB.

сноски не представляю как расставлять, в большинстве своем это переводы фраз с других языков, но все они в конце книги, без оригинального текста, и без вдумчивого чтения расставить их невозможно, увы мне.

Может хто-то хочет их пораставлять? просто мне, если честно, первые две главы не понравились. скоро выложу обновленный вариант.

Страницы

X