скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
monochka RE:Подайте бедному копеечку на книжку с литреса... 3 часа
sem14 RE:Координация сканирования и вычитки 4 дня Моржехрен RE:Помогите найти!.. #2 6 дней babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Isais RE:Мои открытия 1 неделя kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя A5. RE:Не присылает пароль на почту 2 недели babajga RE:Плюмаж 3 недели babajga RE:Блошкинс и Фрю. Опасное путешествие 4 недели alexk RE:Багрепорт - 2 1 месяц babajga RE:Удивленная сова 1 месяц Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц edvud RE:Прошу переформатировать, распознать, etc... 1 месяц monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц Впечатления о книгах
udrees про Михайлов: ПереКРЕСТок одиночества 4. Часть 2 [СИ] (Детективная фантастика, Социальная фантастика, Фантастика: прочее, Самиздат, сетевая литература)
28 04 Отлично, грамотно написанное окончание серии. Автор правильно завершил серию, додумывать можно всякое, но в целом нареканий нет. Книга написана хорошо, в том же спокойном, неторопливом стиле, который к концу ускоряется до ……… Оценка: отлично!
udrees про Вальтер: Я должен её найти (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
28 04 Произведение сильно напоминает миры Артема Каменистого – про STIKS. Только тут просто Город, где не объясняется, почему обновляются припасы. Люди живут в фортах, днем гуляют монстры разных типов. Валютой становятся камни, ……… Оценка: неплохо
mysevra про Беляев: Потапыч (Ужасы, Триллер)
28 04 Очаровательно. Но рассчитано на юную аудиторию. Оценка: хорошо
mysevra про Серрителла: Призраки Гарварда [litres] (Ужасы, Триллер)
28 04 Это не ужасы. Интересным показались лишь подробности быта и учёбы. Концовка вообще скомкана и мелодраматична. Эпилог совсем не к месту, словно кто-то с помощью истории наскоро закрывал личный гештальт. Оценка: неплохо
mysevra про Соболева: Отдел "Т.О.Р." (Детективная фантастика)
28 04 Казалось бы, такая благодатная тема. Результат: чересчур наивное, просто какое-то школьное сочинение "на троечку". Оценка: плохо
monochka про Линч: Небо красно поутру [litres] (Историческая проза, Современная проза, Вестерн)
27 04 Густое, цепкое, щедрое письмо, очень кинематографично, чуть ли не галлюцинаторно в своей проработанной красоте. Персонажи, их черты и мотивации совершенно из средневековых ирландских текстов" - пишет редактор, и оно так и есть.
Олег Макаров. про Шелестов: Смерть Отморозка (Крутой детектив, Детективы: прочее, Современная проза)
27 04 Хорошо написано. Правдиво и реалистично. Смущают немного только пейджеры, с которых братки отправляют друг другу сообщения. Как это могло перепутаться в голове у автора, если он реально активно жил в те времена - непонятно. ……… Оценка: отлично!
Radozenih03 про Хохлов: Экзамен на разумность (Научная литература: прочее, Публицистика)
26 04 Автор поднимает вопросы, актуальные и сейчас... спустя 20 лет после издательства книги. Оценка: хорошо
vig11 про Видум: Настроение – Песец [СИ] (Альтернативная история, Фэнтези, Самиздат, сетевая литература)
25 04 Да, уж. Книга получилась не очень к сожалению. Вместо интересного сюжета фентези сплошная грызня между князями. Оценка: плохо
Саша из Киева про Басовская: Жгучая Испания [Литрес] (Исторические приключения, История, Биографии и Мемуары)
24 04 Книга издана в 2022 году. А написана раньше.
Wild_XC70 про Новиков: Наномашины, сынок! Том 1 [СИ] (Юмористическая фантастика, Самиздат, сетевая литература)
24 04 Прикольно, местами смешно, но одноразово. Оценка: хорошо |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.