EXPERIENCE OF USE OF THE COMPUTER PROGRAM «HYPERTEXTUAL SEARCH OF WORDS-COMPANIONS IN LITERARY TEXT»

Research article
Issue: № 3 (10), 2013
Published:
08.04.2013
PDF

Романова И.В.1, Двоенко Я.Ю.2

1Доктор филологических наук, доцент, заведующая кафедрой литературы и методики ее преподавания; 2аспирант очной формы обучения, ФГБОУ ВПО «Смоленский государственный университет»

ОПЫТ ПРИМЕНЕНИЯ КОМПЬЮТЕРНОЙ ПРОГРАММЫ «ГИПЕРТЕКСТОВЫЙ ПОИСК СЛОВ-СПУТНИКОВ В ХУДОЖЕСТВЕННОМ ТЕКСТЕ»

Аннотация

В статье описывается поиск устойчивых лексических комбинаций в стихотворениях при помощи оригинального программного комплекса «Гипертекстовый поиск слов-спутников в художественном тексте». Материалом исследования послужила книга стихов И. Бродского «Новые стансы к Августе», в ней было выявлено 17 трехчленных лексических комбинаций. Изучение семантических связей между членами комбинаций позволило поставить вопрос о некоторых скрытых индивидуальных механизмах порождения текста.

Ключевые слова: лирика, лексические комбинации, слова-спутники, семантические связи, идиостиль, программный комплекс.

Romanov IV1, Dvoenko YU

1Doctor of philology, Associate Professor, Head of Department of literature and methods of teaching, 2graduate full-time students, FGBOU VPO "Smolensk State University"

EXPERIENCE OF USE OF THE COMPUTER PROGRAM «HYPERTEXTUAL SEARCH OF WORDS-COMPANIONS IN LITERARY TEXT»

Annotation

The article describes the search of constant lexical combinations in poems by means of the original program complex “Hypertextual search of words-companions in literary text”. As material of the research the book of poems “New Stanzas to Augusta” by J. Brodsky was used, it was revealed 17 three-term lexical combinations. The study of semantic connections between the members of combinations allowed to raise a question about some of the hidden individual mechanisms of generation of text.

Keywords: lyrics, lexical combinations, words-companions, semantic connections, individual style, program complex.

В отличие от эпоса, в котором в основе композиции лежит мотив, движущий фабулу, в лирике проблема композиции до сих пор до конца не решена, не выявлены основные композиционные модели. Под композицией, вслед за В.М. Жирмунским, мы понимаем «те художественные принципы, которыми определяется в произведении искусства его внешнее построение, распределение или расположение в нем художественного материала». Поскольку материалом поэзии является язык, основная задача исследователя сводится к выявлению тех фактов языка, «в которых прежде всего осуществляется композиционное задание»[3, с.3].

Именно формальной школе, к которой был близок академик В.М. Жирмунский, удалось существенно продвинуться на этом пути.

О некоторых языковых механизмах, осуществляющих «языковое задание», писали разные представители формальной школы. Например, Ю.Н. Тынянов показал, как теснота стихового ряда усиливает взаимодействие соседних, близко расположенных слов, особенно «по вертикали», диктуя сам лексический подбор и раскрывая дополнительные семантические оттенки:          «<…> ввиду тесноты ритмического ряда в слове могут возникнуть и колеблющиеся признаки значения, по тесной связи со словами данного ряда; так, со словом “темный” может вступить в связь, обусловливаемую звуками, слово “шумит”» [5, с. 70]. Р.О. Якобсон, характеризуя языковые особенности, которые составляют индивидуальный стиль поэта, указывал на наличие неких доминант, сохраняющихся в разных произведениях на протяжении всего творчества. Задачу ученого Якобсон видел в том, чтобы «извлечь эти постоянные компоненты, или константы, непосредственно из текста поэтического произведения путем его внутреннего, имманентного анализа, а если речь идет о варьирующих компонентах, установить, что является закономерным и устойчивым в этом диалектическом движении, найти основу (субстрат) вариаций» [7, с. 145].  При этом он подчеркивал необходимость изучения каждого «символа» не изолированно, а в тесном взаимодействии «с другими символами и со всей единой системой произведений поэта» [7, с. 146].

Похожее явление описал американский структуралист Роберт Бэлнеп, объяснив его как одно из свойств внутритекстовых связей, правда, уже в повествовательном тексте. Внутритекстовые отношения охватывают устойчивые образы, сходные ситуации, сходных персонажей и т.п. Персонажи, место действия, вещи, мысли, эмоции в произведении легко связываются между собой по принципу уподобления, когда они могут быть названы одними и теми же словами. В пределах внутритекстовой структуры всегда выделяется ряд явлений, персонажей, имеющих устойчивые признаки. Например, карамазовщину составляют такие признаки, как сладострастие,  подлость, юродство  и жажда жизни.  Каждая из этих характеристик в тексте может не называться прямо, на нее будут намекать определенные, только с ней связанные слова, темы: ноги у Достоевского связаны со сладострастной распущенностью, насекомые – со сладострастной порочностью, кровь – со сладострастным насилием [1, с. 36, 40-42]. 

 Кроме того, было замечено, что в творчестве символистов, в частности, Вячеслава Иванова имеют место повторы лексических комбинаций. В произведениях разных лет, входящих в состав разных поэтических книг, некоторые слова устойчиво соседствуют друг с другом: «Стоит в тексте появиться одному слову из этой компании, как рядом или чуть подальше непременно возникают его верные спутники. Например, увидев слова, образованные от корня “блед-” (бледный, бледность, бледнеть и т.д.), будьте уверенны, что в этом же тексте появятся тень, луна, жизнь, венец, звезда, туман, дева, зыбкий, луч, тусклый, призрачность, лен, гроб, чело и т.д. Необязательно все сразу, но некоторые из этих слов – обязательно» [4, с. 244 – 245]. 

Возникает вопрос, насколько это явление характерно для поэтического языка вообще и для идиостиля отдельных авторов, в частности. Для решения этой задачи была организована исследовательская группа кафедры литературы и методики ее преподавания при содействии кафедры информатики. Ею в рамках госсадания Минобрнауки для СмолГУ на 2012 г. был создан программный комплекс «Гипертекстовый поиск слов-спутников в художественном тексте» (авторы: Л.В. Павлова, И.В. Романова, Т.А. Самойлова). На данный момент программа находится на стадии регистрации.

Назначение разработанной системы поиска – автоматизация обработки художественных авторских текстов с целью выявления слов-спутников, сопровождающих друг друга в одном или нескольких произведениях автора. Компьютеризация данного процесса позволяет литературоведам решить трудоемкие в случае больших авторских текстов задачи:

  • создать словарь исходного авторского текста с указателями- гиперссылками на соответствующие словоформы текста;
  • используя созданный словарь, выполнить в исходном тексте поиск слов-спутников, расположенных в заданном интервале близости.
  • используя слова-спутники, найти в исследуемом материале лексические комбинации.

Исходный авторский текст разбивался на блоки объемом 50 слов. Такой размер блоков был выбран произвольно из расчета, что 50 слов входят в поле единовременного читательского внимания, в пределах которого читатель в состоянии уловить и зафиксировать различные авторские приемы построения текста, включая лексические комбинации. В рамках эксперимента размер блока может варьироваться. Из лексических комбинаций мы исключали слова, не имеющие полноценного лексического значения и выступающие во вспомогательных функциях (например, глагол-связка быть, местоимения, служебные части речи и междометия). Таких комбинаций программа выявила 21 %, например: бег-буду-есть, большой-есть-нет, жизнь-твое-тебе, мне-быть-семь. Еще одним условием работы программы является ввод в матрицу программного комплекса 100-120 корней  самых частотных лексем из составленного на первом этапе частотного словаря,  что облегчает компьютеру поиск и распознавание слов.

 Приведем пример текстового блока с маркированными компьютерной программой словами-спутниками (рука-оставлять-свет), которые обнаружились в близком соседстве в нескольких таких блоках в разных частях гипертекста:

я чувствовал вину свою, и руки,

ощупывая с радостью живот

на практике нашаривали брюки

и выключатель. И бредя к окну,

я знал, что оставлял тебя одну

там, в темноте, во сне, где терпеливо

ждала ты, и не ставила в вину,

когда я возвращался, перерыва

умышленного. Ибо в темноте –

там длится то, что сорвалось при свете.

Таким образом, разработанный программный комплекс позволяет автоматизировать обработку авторских произведений с целью поиска слов-спутников, сопровождающих друг друга. В настоящее время исследуются методы прикладной математической статистики, которые позволят выполнить количественную оценку степени близости таких слов.

В качестве апробации программного комплекса «Гипертекстовый поиск слов-спутников в художественном тексте» мы выявили лексические комбинации в книге Иосифа Бродского «Новые стансы к Августе» [2].

Мы рассмотрели семантические связи между комбинациями, полученными на материале книги стихов «Новые стансы к Августе»,  и выявили следующие закономерности.

Мы выявили 17 трехчленных лексических комбинаций (состоящих из трех слов), которые встречаются в книге от 3до 5 раз. Для поэтического языка Бродского лексические комбинации оказались менее характерны, чем для языка, например, Вячеслава Иванова или Юрия Верховского (изучением творчества которых занимаются другие участники группы). Отчасти это объясняется богатым лексическим запасом Бродского (это отличает его от Верховского), отчасти тем, что для символа в языке символистов характерно закрепление за ним определенного контекста, который и создают слова из его окружения. Большинство комбинаций у Бродского (86%) состоят из знаменательных слов, выполняющих номинативную функцию: вид-смерть-свет, время-пространство-тьма, даль-любви-разлук и т.д.

Расположение слов-спутников в текстовом блоке может быть разным, но это не мешает говорить о семантической связи слов-спутников в разных текстах.

Среди лексических троек встречаются модели, ставшие классическими для творчества поэта, тематическая близость которых отмечалась исследователями ранее.

Например, темы времени и пространства (Полухина, Крепс, Ахапкин) всегда находились в непосредственной близости в текстах поэта. Программный комплекс выявил несколько моделей, отражающих соседство времени  и пространства: время-тьма-пространство, время-даль-зима, день-вода-окно и т.д.

<…> над улыбкой прошедшего времени,

так в ночной темноте,

обнажая надежды беззубие,

по версте, по версте

отступает любовь от безумия.

И разинутый рот

до ушей раздвигая беспамятством,

как садок для щедрот

временным и пространственным пьяницам <…>

                       

(«Как тюремный засов разрешается звоном от бремени»)

 

Он шел по пространству, лишенному тверди,

он слышал, что время утратило звук.

И образ младенца с сияньем вокруг

пушистого темени смертной тропою

душа Cимеона несла пред собою,

как некий светильник, в ту черную тьму,

в которой дотоле еще никому

дорогу себе озарять не случалось.

Светильник светил, и тропа расширялась.

                                             («Сретенье»)

 

Большое количество полученных комбинаций невозможно было прогнозировать заранее. К таким непрогнозируемым комбинациям можно отнести, например, следующие: слов-старость-темнота, день-рук-лицо, белая-глаз-тьма, бог-дела-один, взгляд-скажу-сила и др.

Рассмотрим лексическую комбинацию день-рук-лицо. В стихотворениях Бродского члены этой комбинации в большинстве случаев находятся в маркированных позициях – в конце стиха. При этом слова день и рука образуют единый образ, не относящийся к характеристике субъекта речи, а третий член комбинации – лексема лицо- в какой-то степени отличает субъекта от других персонажей или обстоятельств. Например, в стихотворении «Ночной полет» лирический субъект бежит от «судьбы, распластанных дней, от рук», которые характеризуют обстоятельства прошлого:

Я бежал от судьбы, из-под низких небес,

от распластанных дней,

из квартир, где я умер и где я воскрес

из чужих простыней;

от сжимавших рассудок махровым венцом

откровений, от рук,

припадал я к которым и выпал лицом

из которых на юг.

Очевидно направление движения лирического героя – он «бежит от судьбы» с севера на юг, т.е. оставляет прошлое в северной части света.

был далек от меня мой родной Ленинград,

и все ближе – пески.

В стихотворении «Келломяки» лексемы рука и день входят в состав сложной метафоры, которая обозначает чаек (чайки → замусоленные ничьей рукой углы белого дня; белый день → пустая бумага). Этих птиц лирический герой в прошлом видел, находясь на «пустынном пляже» в Келломяках  (дачном поселке недалеко от Ленинграда). Третий член комбинации – лексема лицо- отличает лирического героя – жителя большого города – от людей «маленьких городков»:

А то возникали чайки из снежной мглы,

как замусоленные ничьей рукой углы

белого, как пустая бумага, дня;

и подолгу никто не зажигал огня.

В маленьких городках узнаешь людей

не в лицо, но по спинам длинных очередей;

и населенье в субботу выстраивалось гуськом,

как караван в пустыне за сах. песком

или сеткой салаки, пробивавшей в бюджете брешь.

Стихотворение построено как воспоминание о прошлом, которое, как и в первом тексте, связано с ленинградским севером, что в контексте поэтического мира Бродского означает свое, родное пространство. Ученые и раньше отмечали близость этих двух текстов, Барри Шерр объединяет «Келломяки» и «Ночной полет» как гиперстрофические [1, с. 269]. Но связь на уровне сходных лексических моделей не отмечалась, поскольку комбинация день-рук-лицо среди текстов книги не являлась очевидной.

По нашим наблюдениям, выделяемые программой лексические комбинации помогают обнажить некоторые механизмы построения поэтического текста. В ряде случаев лексемы в комбинации оказываются связаны между собой весьма сложными семантическими связями. Тогда они, как правило, входят в состав образа или создают общий контекст, который потом может автором сознательно или не вполне сознательно повторяться и в других текстах: комбинация  ночь-окно-море связана с темой сна («Загадка ангелу», «Песни счастливой зимы»), в комбинации ночь-море-говорить образ моря связан с образом речи («Письмо в бутылке»).

Встретились в нашем материале и случаи, когда между лексемами в комбинации в пределах текстового блока нет очевидных семантических связей (как и фонетических, и ритмико-синтаксических). Эти случаи представляют не меньший интерес для исследователей и дают богатый материал для размышлений. Скорее всего такие комбинации автором не сознаются, но – повторяясь – свидетельствуют о некоторых мыслительных и речевых клише, составляющих особенность индивидуального стиля. Для «Новых стансов к Августе» Бродского это, в частности, комбинации: день-ночь-бог, конец-волна-смотреть, взгляд-скажу-сила.

Литература

1. Бэлнеп Р.Л. Структура «Братьев Карамазовых». СПб.: Академический проект, 1997.

2. Бродский 1983: Бродский И.А. Новые стансы к Августе: (Стихи к М.Б., 1962-1982). Ann Arbor (Mich.).:Ардис,1983.

3. Жирмунский В.М. Композиция лирических стихотворений. Петербург: Издательство «ОПОЯЗ», 1921.

4. Павлова Л.В. Очевидные и неочевидные повторы в лирике Вячеслава Иванова // Повтор в художественном тексте. Povtorzenie w tekscie artystycznym. Bydgoszcz, 2012.

5. Тынянов Ю.Н. Проблема стихотворного языка. Изд. 4-е, стереотипное. — М.: Дом Книга, 2007.

6. Шерр Б. Строфика Бродского: новый взгляд. Барри Шерр // Как работает стихотворение Бродского. Из исследований славистов на Западе : [сб. ст.] / ред.-сост. Л.В. Лосев, Валентина П. Полухина . – М. : Новое литературное обозрение, 2002 .

7. Якобсон Р. Работы по поэтике. М.: Прогресс, 1987.

References