Posted 30 января 2014,, 20:00

Published 30 января 2014,, 20:00

Modified 8 марта, 04:44

Updated 8 марта, 04:44

Рецепт бестселлера

Рецепт бестселлера

30 января 2014, 20:00
Нью-йоркские исследователи, что называется, «поверили алгеброй гармонию» – загрузили в компьютер классические книги из архива проекта «Гуттенберг» и бестселлеры с торговой площадки Amazon, после чего проанализировали сочинения. Специальный алгоритм сравнивал тип слов, используемых авторами, и выдавал прогноз, насколько

Без особого риска ошибиться можно считать, что, когда Джоан Роулинг писала в эдинбургском кафе свою первую книгу о приключениях Гарри Поттера и его друзей, она не догадывалась, что создает не повесть для детей, а литературный и в определенной мере социальный феномен. До настоящего времени определить, какой книге уготована участь бестселлера, а какая будет пылиться на полках магазинов, было из области гадания на кофейной гуще. Однако сейчас ученые из Нью-Йорка утверждают, что создали алгоритм, помогающий прогнозировать судьбу литературного произведения еще до выхода его в свет.

Суть метода состоит в анализе «кирпичиков», из которых строится любая книга, – слов. Алгоритм для анализа создан в нью-йоркском университете Стоуни-Брук, сообщает Ассоциация компьютерной лингвистики США, опубликовавшая отчет о результатах исследования. Авторы методики взяли за основу статистическую стилометрию – науку на стыке математики и литературы, которая при помощи компьютерных программ анализирует лексику и грамматику литературных произведений.

Несмотря на то что популярность статистическая стилометрия обрела лишь в конце XX века, ее отцом считается выдающийся итальянский филолог XV века Лоренцо Валла. Он же, между прочим, первым при помощи анализа стилистики доказал подложность «Константинова дара» – дарственного акта, якобы выданного Константином Великим римскому папе Сильвестру и служившего главным основанием для притязаний папы на верховную власть в церкви и средневековой Европе.

Создав алгоритм, нью-йоркские ученые проанализировали порядка двух тысяч книг самых разных жанров. Первоисточники брались как из проекта «Гуттенберг», ставящего целью создание электронной универсальной библиотеки, так и из списков бестселлеров крупнейшего онлайнового магазина Amazon. Проанализировав слова выбранных произведений, программа сумела в 84% случаев правильно определить книги, ставшие бестселлерами.

Стилометрический анализ признал очень удачными «Дон Кихота» Сервантеса и «Робинзона Крузо» Дефо, а очень неудачными – «Потерянный символ» Дэна Брауна и, например, «Моя мужская правда» Филипа Рота. Казус с бестселлером «Потерянный символ» американские ученые объясняют тем, что их анализ все же не всеобъемлющий и не принимает во внимание такие немаловажные для успеха у читателей, но нисколько не влияющие на качество литературных произведений субъективные понятия, как интерес, захватывающий сюжет и т.д. Известно, что немалое число бестселлеров и книг, получивших награды, сначала отвергались издателями, которые, несмотря на профессионализм, не могли разглядеть в рукописях скрытый потенциал.

«Прогнозирование успеха литературного произведения всегда было сложной задачей для издателей и начинающих писателей, – сообщил в интервью Daily Mail руководитель группы исследователей из Стоуни-Брука профессор Йежин Чой. – Предыдущие исследования в этой области в своем подавляющем большинстве пытались раскрыть секрет бестселлеров при помощи качественных параметров и основывались на одном-двух десятках книг. Анализировались в основном личности главных положительных и отрицательных героев и сюжет».

Йежин Чой с помощниками выявили ряд закономерностей, составляющих, по их мнению, секрет бестселлера. В успешных книгах встречается больше существительных и прилагательных, чем в менее успешных, и множество кавычек с прямой речью. Еще в них намного больше союзов «и», «но», «что». Еще в бестселлерах преобладают глаголы, связанные с мыслительным процессом, такие, например, как «узнавать», «помнить», «думать». В них также часто встречаются глаголы, сопровождающие прямую речь: «говорить», «сказать» и т.д.

В менее популярных книгах много слов типа «любовь», «желание», «роман», а также слов, несущих негативное («риск», «никогда», «убит») и экстремальное («задыхающийся», «очень», «абсолютно», «безупречный») значение. Стилометрический анализ также выявил, что в плохо продающихся книгах часто употребляются глаголы с эмоциональной окраской, например, «хотеть», «обещать», «плакать», «радоваться». Еще один непременный атрибут неудачных книг – использование названий частей тела.

Критиков у компьютерного рецепта бестселлеров, конечно, хватает. В свое оправдание ученые из университета Стоуни-Брук говорят, что они только доказали то, о чем говорил еще в 2000 году в автобиографии-руководстве для начинающих авторов «Как писать книги» Стивен Кинг, который – тут мало кто сомневается – на бестселлерах съел собаку. Король ужасов написал, в частности, что для успеха нужно как можно реже использовать глаголы, описывающие эмоции.

После раскрытия рецепта бестселлеров напрашивается вопрос: если компьютеры уже научились предсказывать, какую книгу ждет крупный успех, а какую – забвение, то им наверняка по плечу и писать их. Конечно, до создания бестселлеров искусственному интеллекту еще далеко, но книги компьютеры уже действительно пишут. Причем, пишут не единицы книг, а тысячи.

Филип М. Паркер, к примеру, вполне может претендовать на включение в Книгу рекордов Гиннесса в качестве самого плодовитого автора. Перу Паркера принадлежит свыше 100 тыс. книг. Список книг, изданных его компанией, и вовсе превышает 700 тысяч.

Правда, слово «перо» следует заменить на «компьютер», потому что все книги написал не сам Паркер, а созданная им программа. Как нетрудно догадаться, среди этих книг нет художественных и тем более бестселлеров. Но это, уверен он, лишь дело времени.

"