Всю художественную литературу смогли описать тремя графиками
Учёт этих графиков, по мнению исследователей, позволит роботам-писателям создавать полноценные художественные книги.
Учёные из Австралии и США использовали методы работы с "большими данными" для поиска всех возможных эмоциональных линий развития сюжета в художественных произведениях. В результате они обнаружили три "эмоциональные дуги" — линий, по которым следуют чувства персонажа того или иного произведения на протяжении всего художественного действия. Каждая из трёх дуг имела "позитивный" и "негативный" подтипы. Препринт статьи выложен на сайте Корнелльского университета.
Для анализа текстов авторы применили скрипт "Гедонометр", использующий простой алгоритм для определения эмоциональной нагрузки текста. Программа обращается к словарю, в котором каждому слову начислены определённые баллы, отражающие его положительную эмоциональную нагрузку (эпитет "плохой" получает меньше баллов, чем "хороший", и так далее). Затем исследователи разбили 1737 текстов из публичной электронной библиотеки "Проект "Гутенберг" на фрагменты по 10 000 слов. Все фрагменты были "взвешены" "Гедонометром" на предмет эмоционального значения. Приняв эмоциональную нагрузку каждого фрагмента за точку, авторы построили из них графики. Каждый представлял собой так называемую эмоциональную дугу или график эмоционального развития сюжета.
Методами, типичными для работы с "большими данными", учёные отобрали среди графиков наиболее часто встречающиеся. Как выяснилось, базовых вариантов эмоционального развития сюжета всего три, но каждый из них может иметь два подварианта: позитивный и негативный.
Первый вид сценариев описывает почти равномерный эмоциональный подъём персонажа и сюжета в целом на всём его протяжении, и типичной книгой такого рода (в позитивном ключе — постоянное улучшение эмоционального фона) является "Алиса в стране чудес" Льюиса Кэрролла. Негативный вариант первого типа эмоциональной дуги — "Ромео и Джульетта" Уильяма Шекспира (постоянное снижение эмоционального фона, при котором персонажи испытывают ухудшающиеся эмоции).
Второй тип эмоциональной дуги в положительном варианте давал резкий эмоциональный "провал" в середине сюжета с последующим взлётом, как в "Волшебнике страны Оз" Фрэнка Баума. Негативный подтип этой дуги начинал с низкого уровня положительных эмоций, испытываемых персонажами, затем следовали резкий подъём в середине и не менее резкий провал в окончании — например, как в мифе "Икар" с его трагическим концом.
Третий тип эмоциональных дуг чуть сложнее первых двух. Его позитивный подтип начинается на низком уровне положительных эмоций. Затем даёт всплеск, провал и опять всплеск. Типичная история такого рода — сказка "Золушка". Негативный вариант третьего типа лучше всего отражён в "Герое нашего времени" Лермонтова и "Эдипе" Софокла.
Авторы работы полагают, что три найденные ими формы эмоциональной эволюции персонажей являются универсальными и описывают практически все существующие сюжеты. Конечно, в ряде случаев (большой объём, длинная серия книг и так далее) подъёмов и спадов может быть больше, но алгоритмы быстро находят внутри каждого сюжета всё те же три траектории развития эмоций и два их подтипа — позитивный и негативный. Типичный пример — цикл о Гарри Поттере, где весьма длительный сюжет можно разбить на участки, описываемые одной из трёх эмоциональных дуг. По мнению учёных, имеет смысл заложить следование этим дугам во все программы, генерирующие художественные тексты. Это позволит им лучше справляться с созданием художественных произведений, похожих на человеческое творчество.