Анализатор частоты слов - полезная вещь!

По наводке с блога Н. Горькавого (http://don-beaver.livejournal.com/73655.html): GoogleBooks запустил интересный сервис - Books Ngram Viewer: исследование относительной частоты использования слов в книгах. Для примера - исследование частоты появления пяти любимых читателями категорий персонажей за последние 100 лет:


Сижу и думаю: на гугель-буке русских книг с гулькин хвост, у нас - в десятки раз больше. Может, и нам такой сервис замутить? :-)

Комментарии

А сложно его сделать?
Мне кажется, самое сложное - правильно оценить год издания. Он далеко не для всех книг имеется.

Рыжий Тигра написал:
Может, и нам такой сервис замутить? :-)
За.

Очень интересный сервис

можно еще сделать объединение словоформ?

а то солнце,земля,рука,рукой,дом,домой,женщина

рука рукой показывает разные результаты

toumin написал:
можно еще сделать объединение словоформ?
Это к гуглю, а гугля наши блоги только индексирует, но не читает.
(мечтательно) Эх, кабы знать волшебное ключевое слово, наткнувшись на которое, поисковый робот громко зовёт на помощь человека - оператора или программиста... :-?
X