ТЕМПОРАЛЬНАЯ ОРГАНИЗАЦИЯ УСТНОПОРОЖДАЕМОГО МОНОЛОГИЧЕСКОГО ВЫСКАЗЫВАНИЯ: СООТНОШЕНИЕ ДЛИТЕЛЬНОСТИ ФОНАЦИИ И ПАУЗЫ

Научная статья
DOI:
https://doi.org/10.23670/IRJ.2017.61.074
Выпуск: № 7 (61), 2017
Опубликована:
2017/07/19
PDF

Ратникова Е.И.

Доцент кафедры французского языка для факультета иностранных языков и регионоведения,  кандидат филологических наук, Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный университет имени М.В.Ломоносова»

ТЕМПОРАЛЬНАЯ ОРГАНИЗАЦИЯ УСТНОПОРОЖДАЕМОГО МОНОЛОГИЧЕСКОГО ВЫСКАЗЫВАНИЯ: СООТНОШЕНИЕ ДЛИТЕЛЬНОСТИ ФОНАЦИИ И ПАУЗЫ

Аннотация

Статья посвящена изучению темпоральной организации устнопорождаемого монологического высказывания. В ходе экспериментального исследования соотношения длительности фонации и пауз в устнопорождаемом высказывании на материале русского, английского и французского языков установлено, что в речевых продукциях изучаемых в работе трех типов коммуникативных ситуаций (интервью, свободной беседы, устного ответа на экзамене по иностранному языку) пропорция фонации и пауз составляет 80% к 20%, соответственно. Данное соотношение является устойчивым и не зависит от ситуации порождения, языка, индивидуальных особенностей говорящих, тематики высказывания и других вариативных параметров речепорождения. Полученные результаты согласуются с данными ранее проведенного нами эксперимента, показавшего, что распределение длительности фонационных отрезков и пауз в том же корпусе речевых продукций подчиняется логнормальной модели. Очевидно, устойчивое распределение речевых сегментов является отражением действия некоего временного механизма, осуществляющего автоматическую компенсаторику и подстройку их длительности в процессе порождения устного монологического высказывания.  

Ключевые слова: устнопорождаемое высказывание, устная речь, темпоральная организация, логнормальная модель, фонация, пауза.

Ratnikova E.I.

Associate Professor of the Department of French Language for the Faculty of Foreign Languages and Regional Studies, PhD in Philology, Federal State Budget Educational Institution of Higher Education “Lomonosov Moscow State University.”

TEMPORAL ORGANIZATION OF THE ORAL MONOLOGICAL UTTERANCE: RELATION BETWEEN DURATION OF THE VOICE SET AND PAUSE

Abstract

The article deals with the study of temporal organization of an oral monological utterance. In the course of an experimental study of the correlation between the duration of the voice set and pauses in an oral utterance on the material of the Russian, English and French languages, it was established that there are three types of communicative situations in speech (interview, free discussion, oral response at the foreign language test) and the proportion of voice sets and pauses is 80% to 20%, respectively. This ratio is stable and does not depend on the situation, language, individual characteristics of speakers, the subject matter of the utterance, and other variation parameters of repetition. Obtained results correlate with the data of our previous experiment, which showed that the distribution of the duration of the voice set segments and pauses in the same type of speech production is subject to the lognormal model. Obviously, stable distribution of speech segments is a reflection of the effect of a certain temporary mechanism that automatically compensates and adjusts their duration in the process of generating an oral monological utterance.

Keywords: oral utterance, oral speech, temporal organization, lognormal model, background, pause.

  1. Введение

Статья является продолжением исследования, посвященного выявлению закономерностей развертывания устного монологического высказывания. Одной из фундаментальных характеристик монологического высказывания является его темпоральная организация,  традиционно рассматриваемая в лингвистике как результат взаимодействия артикуляторных жестов, участвующих в создании сложной моторной программы [1, С. 9-20], [2], [3, С. 640-647]. В рамках этой тематики активно ведутся исследования по обнаружению закономерностей распределения длительности гласных и согласных [4, С. 1102-1104], [5, С. 411-426], заполненных и незаполненных пауз [6, С. 469-486], [7], синтагм [8, С. 53-56] и др. речевых сегментов. Изучение темпоральных параметров является актуальным при разработке и развитии систем автоматического распознавания речи, создании компьютерных алгоритмов, квантитативных и статистических моделей [9], [10, С. 9-12], [11, С. 265-292].

Исследования на материале озвученной письменной речи (чтение) показывают, что среди факторов, оказывающих влияние на длительность речевых сегментов, можно выделить позицию сегмента в речевом континууме, его акцентно-ритмический контур, темп произнесения (изохрония), интонационное оформление и коммуникативную значимость [12], [13].  В отличие от читаемого текста в устнопорождаемой речи в силу ее специфики (синтаксической неплавности, вариативности интонационного оформления, наличия самоисправлений, ошибок и т.п.) выделение темпоральных констант оказывается более сложной задачей. Однако наблюдения за развертыванием устнопорождаемого высказывания показывают, что именно темпоральная структура является одним из важнейших условий организации его акустических параметров.

Ранее проведенное нами исследование фонационных отрезков и пауз на материале французского, русского и английского языков в устнопорождаемом монологическом высказывании показало, что распределение их длительности может быть описано логнормальной моделью и обусловлено не столько коммуникативной направленностью высказывания (одинаковое распределение отрезков по длительности обнаружено для высказываний трех типов коммуникативных ситуаций — беседы, интервью на родном языке, устного ответа на экзамене по иностранному языку), сколько действием некой временной программы, организующей отрезки по длительности внутри отдельно взятого высказывания. Причем действие этой программы слабо связано с индивидуальными особенностями говорящего или языком, на котором осуществляется порождение, и вероятно задается особенностями когнитивной задачи — продуцированием монологического высказывания [14, С. 46-49].

 Целью исследования, описанного в данной статье, является углубление представлений о работе временного механизма и его роли в акустической организации спонтанного монологического высказывания. Задача исследования — изучение соотношения времени фонации к времени паузации и теоретическое осмысление этой пропорции в свете полученной нами на предыдущем этапе логнормальной модели.

  1. Материал

Исследование выполнено на корпусе устных текстов, записанных в трех ситуациях речевого общения: 1) интервью, 2) свободной беседы, 3) устного ответа на экзамене по иностранному языку. Всего в качестве материала было отобрано 100 спонтанных монологических продукций (в соответствии с общепринятыми требованиями к размеру выборки для статистического анализа) длительностью около 4-х мин. каждое; общая длительность звучания корпуса составляет 6.5ч. Таким образом, исходя из целей анализа, отобранный материал был разделен на 3 группы, каждая из которых соответствует рассматриваемой коммуникативной ситуации:

  1. Ответы в ходе интревью

1.1. 15 устных ответов носителей французского языка в ходе видео-интервью различной тематики (спорт, кино, компьютерные игры, литература), записанные на французском телевидении. Возраст интервьюируемых от 25 до 60 лет.

1.2. 15 устных ответов на русском языке (тематика интервью — музыка, литература), записанного на российском телевидении. Возраст интервьюируемых от 28 до 54 лет.

Особенностью данной группы является тот факт, что респондентам заранее известна тема интервью, однако полностью они не готовят ответы на вопросы и отвечают без письменной опоры.

  1. Ответы в ходе свободной беседы

15 устных ответов на русском языке в ходе свободной беседы на спонтанно поставленный экспериментатором вопрос. Возраст испытуемых от 30 до 50 лет. Единственное условие поставленное испытуемым - говорить не менее 4-х минут. Отличие данной группы от групп1 и 3 в том, что говорящему заранее неизвестна тема беседы, фактически полностью отсутствует этап подготовки и продумывания высказывания.

  1. Ответы русскоговорящих испытуемых на устных экзаменах и конкурсах по иностранному языку

3.1. 15 устных ответов конкурсантов на французском языке, записанных во время проведения устного конкурса Всероссийской олимпиады школьников по французскому языку. Уровень владения языком испытуемых данной группы В1, возраст от 15 до 17 лет.

3.2. 15 устных ответов студентов 3-го курса факультета иностранных языков и регионоведения МГУ имени М.В.Ломоносова, изучающих французский как второй иностранный. Ответы записаны в ходе семестрового экзамена по французскому языку. Уровень владения B1, возраст от 19 до 20 лет.

3.3. 15 устных ответов на английском языке взрослых носителей русского языка. Уровень владения С2, возраст от 30 до 50 лет. Ответы записаны в ходе постановочного эксперимента, имитирующего ситуацию экзамена. Испытуемым было предложено такое же задание, как и подгруппе 3.1.

3.4. Для дополнительной верификации записаны 10 устных ответов русскоговорящих на родном языке. Испытуемым было предложено олимпиадное задание, как и в подгруппах 3.1 и 3.3. Возраст испытуемых от 30 до 50 лет.

Необходимо отметить, что задание для всех подгрупп 3-й группы было схожим. Конкурсантам и экзаменуемым нужно было за 20 минут подготовить монологическое высказывание на заданную тему (всего 6 разных тем), соответствующее критериям связности и логичности построения. Во время подготовки им разрешалось делать записи и продумывать план высказывания. Однако, во время ответа записями конкурсанты не пользовались.

  1. Методы

Для подсчета общего времени пауз и фонации в каждой из анализируемых речевых продукций корпуса была выполнена акустическая сегментация речевого сигнала на фонационные отрезки и паузы с помощью программы «PRAAT». За критерий сегментации принималась длительность паузы, которую мы определяем как полный перерыв фонации длительностью 200мсек и более [16, С. 215-220]. Необходимо отметить, что так называемые в лингвистике «заполненные, нетемпоральные» паузы рассматриваются нами как фонация. Представляется, что такой подход является наиболее перспективным, поскольку он исключает множественность интерпретаций перцептивно-слухового анализа, позволяя максимально формализовать выделение анализируемых единиц и рассматривать фонацию как единое целое, строящееся с учетом всех составляющих ее элементов (хезитации, речевые сбои и т.п.).

Далее с помощью программы «Minitab» осуществлялся количественный анализ с целью устанавления пропорции фонации и пауз в каждой речевой продукции трех изучаемых групп. В начале была посчитана общая продолжительность акустических пауз путем суммирования временной длительности полученных в ходе сегментации отрезков. Подобным образом расчитывалось и общее время фонации. Затем абсолютные значения в миллисекундах были переведены в проценты по отношению к общей продолжительности высказывания. Таким образом, была получена пропорция общей длительности пауз и фонации в высказываниях каждой группы.

После чего в этой же программе проводился сравнительный статистический анализ речевых продукций трех изучаемых групп. Для наглядной репрезентации данных были построены диаграммы размаха. Эти диаграммы позволяют оценить разброс данных и центральную тенденцию распределения, что важно при первичной оценке единиц корпуса большого объема. С помощью данного типа анализа можно расчитать медиану выборки, дисперсию данных, а также выявить крайние значения (выбросы).

Построение выполнялось программой автоматически по так называемому «квартильному» методу, который заключается в том, что совокупность выборки делится на четыре равные части — «квартили» (отображаемые на графике в виде прямоугольника или «ящика»). В первый или нижний квартиль (Q1) попадают значения равные или не превышающие 25% от общего количества совокупности (25-й процентиль), во второй Q2 (медиану) — значения выборки, количество которых составляет от 25% до 50%, третий (Q3) — от 50% до 75%. Четвертый квартиль называемый «интерквартильным размахом» (IQRange) и представляет собой разность между 3-м и 1-м квартилями (Q3-Q1). Наряду с этим важность имеют и края выборки, поскольку разброс изучаемых величин является важным показателем робастности полученной дисперсии.

С помощью описанного выше метода были построены групповые диаграммы размаха, отражающие долю фонации и долю общей длительности пауз в монологических высказывания трех анализируемых нами групп.

  1. Результаты

Основные результаты графического анализа представлены на рис.1, 2, 3 и в таб.1.

28-07-2017 11-58-35

Рис. 1 – Доля фонации от общей длительности монологического высказывания в ситуации интервью

28-07-2017 11-59-56

Рис. 2 – Доля фонации от общей длительности монологического высказывания в ситуации свободной беседы

28-07-2017 12-01-24

Рис. 3 – Доля фонации от общей длительности монологического высказывания в ситуации устного ответа на экзамене по иностранному языку

 

Таблица 1 — Сводная таблица данных «Доля фонации в высказываниях трех групп корпуса»

Сравн. признак 1 группа (интервью) 2 группа (свободная беседа) 3 группа (устный ответ на экзамене)
1-ый квартиль Q1 79 77 81
Медиана Q2 81 79 82
3-й квартиль Q3 83 81 86
Интерквартильный размах 4 3 5
Min, max значение выборки 77 - 86 76 - 82 78 - 88
Кол-во выбросов 0 0 0
 

Как видно из приведенных графиков и таблицы, соотношение общего времени фонации и пауз в изучаемом корпусе устных речевых продукций составляет приблизительно 80% к 20%. Наибольшая дисперсия значений (интерквартильный размах) обнаружена для высказываний 3-й группы, т.е. высказываний, порождаемых в ситуации экзамена на иностранном языке, что, вероятно, объясняется повышенной сложностью когнитивной задачи для говорящих, а также, очевидно, связана с разной степенью владения иностранном языком (уровни B1-C2). Для проверки данной гипотезы необходим качественный анализ высказываний 3-ей группы. Однако, важно отметить, что данные внутригрупповые отличия незначительны (отклонение от медианы составляет всего 2-3%) и, следовательно, не нарушают общей пропорции фонации и пауз: так же как и в двух других группах это соотношение составляет 80% к 20%, соответственно. Зафиксированная пропорция может быть охарактеризована как устойчивая и слабо зависящая от вариативных параметров (языка, коммуникативной ситуации, экстралингвистических факторов). О робастности наблюдаемого распределения свидетельствует и отсутствие внутригрупповых выбросов.

Полученные результаты согласуются с данными других исследований, проводившихся на материале русского, английского, итальянского и армянского языков, и показавших, что соотношение фонации и пауз в устнопорождаемом монологическом высказывании составляет 70% к 30% [16, С. 21], [17, С. 55]. Небольшое расхождение с нашими данными, по-видимому, объясняется тем, что мы рассматриваем «заполненные паузы» как фонацию. В целом же, результаты настоящего исследования подтверждают, что пропорция 80% к 20% является типичной для монологического устнопорождаемого высказывания.

  1. Выводы

Устойчивость выявленного соотношения коррелирует с обнаруженной нами на предыдущем этапе логнормальной моделью распределения длительности фонационных отрезков и пауз в тех же трех изучаемых ситуациях речевого общения. Из этого, вероятно, следует тот факт, что темпоральная структура высказывания задается не столько условиями коммуникации в конкретный момент времени или его общей длительностью (устойчивое соотношение проявляется в высказываниях разной длительности), сколько типом когнитивной задачи — продуцированием монологического высказывания, т.е. порождением на «длинную дистанцию». Обнаруженная пропорция слабо связана с тематикой высказывания, языковой наполняемостью и даже темпом речи. Любые неплавности, речевые сбои, характерные для устной речи, компенсируются, «выравниваются» в процессе речепорождения, вследствие чего возникает устойчивое соотношение фонации и пауз в изучаемых высказываниях.

В этой связи можно провести параллель между развертыванием монологического высказывания и работой сложной нелинейной системы, описанной во многих трудах по синергетике и теории систем. Для  подстройки различных элементов во времени необходимо, чтобы система по одним направлениям «сжималась», а по другим «растягивалась», т.е. для корректного функционирования системы ее элементы в разный момент времени должны иметь разную временную протяженность, причем степень сжатия в среднем должна обязательно превалировать над степенью расширения [18, С. 66]. Похожие процессы мы наблюдаем и в устнопорождаемом высказывании, в котором темпоральное структурирование осуществляется за счет разной длительности фонационных отрезков и пауз. Несмотря на то, что в любой речевой продукции присутствуют короткие, средние и длинные фонационные отрезки и паузы, в количественном отношении короткие отрезки всегда превалируют над длинными, а распределение всех отрезков высказывания по длительности может быть описано логнормальной моделью. Соотношение общей протяженности фонации и пауз, как было показано в ходе описанного выше эксперимента, устойчиво.

Таким образом, пропорция 80% к 20%, очевидно, есть результат подстройки сложной системы, которой и является процесс речепорождения устного монологического высказывания. Наблюдаемая автоматическая компенсаторика отрезков по длительности, по-видимому, может достигаться только наличием некоего механизма, который сознательно не контролируется говорящим, однако подчиняет все высказывание действию ограничительных процессов, обеспечивающих стабильность порождения монологического высказывания.

Представляется, что устойчивость полученной пропорции, количественно соотносимой со знаменитым законом «Парето», характеризующим многие «естественные» процессы в различных отраслях человеческого знания, является проявлением действия универсального темпорального механизма речепорождения.  Нам неизвестно, что конкретно обусловливает появление этой пропорции в речи, но очевидно, что она отражает фундаментальные закономерности процесса порождения устного монологического высказывания.

Список литературы / References

  1. Bell-Berti F., Harris K.S. A temporal model of speech production. // Phonetica. 1981. №38 (1-3).
  2. Потапова Р.К., Блохина Л. П. Средства фонетического членения речевого потока в немецком и русском языках. Москва, 1986.
  3. Ostry D.J., Munhall K.G. Control of rate and duration of speech movements. // J. Acoust. Soc. Am., vol.77. 1985. № 2.
  4. Klatt D. Interaction between two factors that influence vowel duration. // JASA, vol.54. 1973.
  5. Kristin M. R. Analysis of speech segment duration with the lognormal distribution: A basis for unification and comparison. // Journal of Phonetics, vol. 33. 2005. №4.
  6. Rosen K.M., Kent R.D., Duffy J.R. Lognormal distribution of pause length in ataxic dysarthria. // Clinical Linguistic Phonetics. 2003. №17(6).
  7. Christodoulides G., Avanzi M. Phonetic and Prosodic Characteristics of Disfluencies in French Spontaneous Speech // Poster presented at the 14th Conference on Laboratory Phonology 2014, Tokyo, Japan.
  8. Кривнова О.Ф. Временные характеристики русских гласных в слитной речи (количественная модель). // Нижний Новгород, 2007.
  9. Кривнова О.Ф., Чардин И.С. Паузирование при автоматическом синтезе речи // Теория и практика речевых исследований (АРСО-99). Москва, 1999.
  10. Mertens P. Automatic segmentation of speech into syllables. // Proc. European Conference on Speech Technology, Edinburgh, 1987.
  11. Ramus F., Nespor M., Mehler J. Correlates of linguistic rhythm in the speech signal. // Cognition. 1999. №73(3).
  12. Златоустова Л.В., Фролова И.Г. и др. Исследование длительности неударных гласных в зависимости от фразовых условий  // Семантические и фонологические проблемы прикладной лингвистики. Москва, 1968.
  13. Светозарова Н.Д. Интонационная система русского языка. Ленинград, 1983.
  14. Ратникова Е.И. Towards a log-normal model of phonation units lengths distribution in the oral utterances. // Международный научно-исследовательский журнал, том 2. Екатеринбург, 2017. № 3(57).
  15. Boomer D.S., Dittmann A.T. Hesitation pauses and juncture pauses in speech. // Language and Speech, 1962. №5.
  16. Хуршудян В.Г. Средства выражения хезитации в устном армянском дискурсе в типологической перспективе: Дис. ... канд. филол. наук. Москва, 2006.
  17. Кибрик А.А., Подлесская В.И. Рассказы о сновидениях. Корпусное исследование устного русского дискурса. // М.: Языки славянских культур, 2009.
  18. Анищенко В.С. Знакомство с нелинейной динамикой. // М.: Издательство ЛКИ, 2008.

Список литературы на английском языке / References in English

  1. Bell-Berti F., Harris K.S. A temporal model of speech production. // Phonetica. 1981. №38 (1-3).
  2. Blokhina L.P., Potapova R.K. Pertseptivnaya kategorizatsiya pauzal'noi segmentatsii slitnoi rechi [Perceptual Categorization of Pause Segmentation of Continuous Speech] Publishing House of Moscow M.Toreza Pedagogical State University, no.265, pp.247-415. 1986. [In Russian]
  3. Ostry D.J., Munhall K.G. Control of rate and duration of speech movements. // J. Acoust. Soc. Am., vol.77. 1985. № 2.
  4. Klatt D. Interaction between two factors that influence vowel duration. // JASA, vol.54. 1973.
  5. Kristin M. R. Analysis of speech segment duration with the lognormal distribution: A basis for unification and comparison. // Journal of Phonetics, vol. 33. 2005. №4.
  6. Rosen K.M., Kent R.D., Duffy J.R. Lognormal distribution of pause length in ataxic dysarthria. // Clinical Linguistic Phonetics. 2003. №17(6).
  7. Christodoulides G., Avanzi M. Phonetic and Prosodic Characteristics of Disfluencies in French Spontaneous Speech // Poster presented at the 14th Conference on Laboratory Phonology 2014, Tokyo, Japan.
  8. Krivnova O.F. Vremennye harakteristiki russkih glasnyh v slitnoj rechi (kolichestvennaja model') [Temporal Characteristics of Russian Vowels in Continuous Speech (quantitative model)] // Nizhnij Novgorod, 2007. [In Russian]
  9. Krivnova O.F., Chardin I.S. Pauzirovanie pri avtomaticheskom sinteze rechi [Pauses in the Synthesized Speech] // Teorija i praktika rechevyh issledovanij [Theory and Practice of Speech Studies] (ARSO-99). Moscow, 1999. [In Russian]
  10. Mertens P. Automatic segmentation of speech into syllables. // Proc. European Conference on Speech Technology, Edinburgh, 1987.
  11. Ramus F., Nespor M., Mehler J. Correlates of linguistic rhythm in the speech signal. // Cognition. 1999. №73(3).
  12. Zlatoustova L.V., Frolova I.G. i dr. Issledovanie dlitel'nosti neudarnyh glasnyh v zavisimosti ot frazovyh uslovij [Study of the length of the vowels’ unstressed syllables in connection to the phrase context]  // Semanticheskie i fonologicheskie problemy prikladnoj lingvistiki [Semantic and Phonological Problems of Applied Linguistics]. Moscow, 1968. [In Russian]
  13. Svetozarova N.D. Intonacionnaja sistema russkogo jazyka [Intonation of the Russian Language]. Leningrad, 1983. [In Russian]
  14. Ratnikova E.I. Towards a log-normal model of phonation units lengths distribution in the oral utterances. // Mezhdunarodnyj nauchno-issledovatel'skij zhurnal [International Research Journal], vol. 2. Ekaterinburg, 2017. № 3(57).
  15. Boomer D.S., Dittmann A.T. Hesitation pauses and juncture pauses in speech. // Language and Speech, 1962. №5.
  16. Hurshudjan V.G. Sredstva vyrazhenija hezitacii v ustnom armjanskom diskurse v tipologicheskoj perspektive [Means of Hesitation in the Oral Armenian Discourse from Typological Perspective] dis. … of PhD in Philology. Moscow, 2006. [In Russian]
  17. Kibrik A.A., Podlesskaja V.I. Rasskazy o snovidenijah. Korpusnoe issledovanie ustnogo russkogo diskursa [Dream Tales. Corpus Study of the Oral Russian Discourse] // M.: Jazyki slavjanskih kul'tur, 2009. [In Russian]
  18. Anishhenko V.S. Znakomstvo s nelinejnoj dinamikoj [Introduction to the Nonlinear Dynamics] // M.: Izdatel'stvo LKI, 2008. [In Russian]