Как написать идеальный роман: компьютер насчитал шесть базовых сюжетов

Исследование ученых из Университета Вермонта
19/07/2016 - 12:41 (по МСК)

Группа американских и австралийских ученых из университета Вермонта математически описала сюжеты популярных произведений мировой литературы. Как показало исследование, сюжеты в книгах мировой литературе можно свести всего к шести основным моделям и их комбинациям. 

С помощью математических алгоритмов ученые рассчитали эмоциональные перепады текстов и смогли выделить шесть основных графиков, которым соответствуют литературные произведения. Учеными были проанализированы более 1700 текстов (не длиннее 200 тысяч слов) из электронной библиотеки проекта «Гуттенберг», которые были скачаны более 150 раз.

Алгоритм анализа произведений. Изображение: Andrew J. Reagan / ArXiv.org

Идея анализа состояла в том, что все слова имеют положительную или отрицательную эмоциональную окраску. Таким образом слова могут быть показателем настроения текста и того, как оно меняется от момента к моменту. 

Ученые использовали алгоритм Hedonometer, который присваивает каждому слову отрицательное или положительное числовое значение в зависимости от его эмоциональной нагрузки. Затем алгоритм делит текст на отрывки по десять тысяч слов и высчитывает среднее настроение фрагмента. Чередование отрывков с разным настроением на графиках отражено с помощью дуг.

После анализа всех книг было выделено шесть основных типов «эмоциональных дуг». Названия для каждой из них ученые взяли из предыдущих исследований, посвященных мировым литературным сюжетам. Развитие действия в произведении, которое ученые назвали «из грязи в князи» (на графике кривая «растет») встречается, например, в книгах о Гарри Поттере и в «Алисе в стране чудес» Льюиса Кэролла. Примером произведения типа «трагедия» (на графике кривая «падает») может стать «Анна Каренина» Льва Толстого. Третий тип сюжета «человек в яме» (термин придуман Куртом Воннегутом) построен по принципу «падение-взлет». Согласно исследованию, такому графику соответствует сюжет «Волшебника страны Оз» Лаймена Фрэнка Баума. Противоположный тип сюжета — «Икар» («взлет-падение») встречается у Артура Гриффитса в детективе «Римский Экспресс». «Рождественская песнь» Чарльза Диккенса строится по принципу «взлет-падение-взлет», ученые назвали такую модель «Золушка», а «Герой нашего времени» Михаила Лермонтова, согласно алгоритму, принадлежит к типу «Эдип» («падение-взлет-падение»).

Шесть основных графиков, которым соответствуют литературные произведения. Изображение: Andrew J. Reagan / ArXiv.org

Похожее исследование в 2015 году провел Мэтью Джокерс — профессор английской литературы в Университете Небраски, работающий в области цифровых гуманитарных исследований, но он тогда не дал названий получившимся мета-сюжетам. 

Литературоведы ранее говорили о трех, семи, двенадцати, и тридцати шести базовых сюжетных схемах, которым соответствуют все существующие литературные сюжеты.

«Попытки обобщить сюжетные схемы предпринимались с библейских времен. Самая распространенная классификация, известная нам — это новелла Борхеса „Четыре сюжета“, но там их на самом деле перечислено три: странствие, война и самоубийство бога», — говорит писатель и литературный критик Дмитрий Быков. По его словам, классификация ученых из Вермонта, неполная, поскольку она не учитывает некоторые ключевые сюжеты. При этом он согласен с идеей, которая лежит в основе этой типологии: каждый сюжет литературного произведения, как он отмечает, это «история падения и возвышения». 

Первым, кто попытался описать основные типы сюжетов с помощью графиков, был писатель Курт Воннегут. По его мнению, все истории можно классифицировать по графику линии судьбы главного героя произведения, которая колеблется от неудачи к успеху. Он уместил все сюжеты мировой литературы в восемь типов и описал некоторые из них в своей лекции. В основе развития простого сюжета лежит принцип: «человек попадает в яму, человек выбирается из ямы». Другая, описанная им схема: «юноша встречает девушку, юноша теряет девушку, юноша возвращает девушку». Вонненгут считал, что некоторые формы лучше подходят для сюжетов литературных произведений, чем другие. Отчасти, его типология легла в основу исследования ученых из университета Вермонта.

 

Пример построения «эмоциональных дуг» по книге «Гарри Поттер и дары смерти». Изображение: Andrew J. Reagan / ArXiv.org

Обосновывая свое исследование, ученые пишут, что их метод поможет определить, почему какая-то книга популярнее другой, какие сюжеты интереснее читателю. С помощью этих схем в будущем могут появиться электронные системы написания литературных текстов — алгоритмы можно использовать для обучения искусственного интеллекта понятиям эмоциональности. 

Но пока рано говорить о том, что такие алгоритмы могут позволить компьютерам создавать качественную литературу, считают литературоведы.

«Машина может написать среднестатистический женский детектив, она может, пожалуй, написать семейную сагу, — полагает Быков, — двух вещей она не может — она не может добиться эмоционального резонанса, потому что она не чувствует этого, плюс она не может добиться того, чтобы сюжет вышел за пределы схемы. А нам интересен именно выход за пределы схемы: „Гамлет“, например, классическая трагедия мести, она великая потому что герой никак не может отомстить, более того гибнет так и не отомстив». 

Такого мнения придерживается и Андрей Немзер, историк литературы, критик, профессор НИУ ВШЭ. «Нельзя таким способом создать идеальную книгу. Можно что-то сымитировать, это вопрос технический. Компьютерные игры так создавать можно, якобы удовлетворяя наши потребности, но не литературу», — убежден литературовед.

Текст: Аня Боброва

Также по теме