Фонетическое членение текстов как средство распознавания слитной речи в немецкоязычных регионах

Таньков Н.Н.; Гордеева Т.А.

doi:10.60797/IRJ.2024.147.85

Фонетическое членение текстов как средство распознавания слитной речи в немецкоязычных регионах

Научная статья

DOI:

https://doi.org/10.60797/IRJ.2024.147.85

Выпуск: № 9 (147), 2024

Предложена:

01.08.2024

Принята:

20.08.2024

Опубликована:

17.09.2024

259

4

XML

PDF

Аннотация

Фонетическое членение текстов рассматривается в статье с позиций комплексной разработки прикладных систем с привлечением лингвистической составляющей, рассмотренной применительно к различным немецкоговорящим регионам. Обосновывается значимость и необходимость таких исследований для совершенствования систем автоматического распознавания речи, а также правильного построения высказывания в акте коммуникации. Исследование проводится в сопоставительном ключе с учетом различных факторов, в том числе синтагматических, позиционных и территориальных. Сравниваются результаты, полученные в двух группах информантов – носителей современного немецкого языка из четырех немецкоязычных регионов и русских информантов – опытных преподавателей-филологов. Делается вывод о влиянии фонологической базы испытуемых на процесс восприятия и декодирования речевого сообщения.

Ключевые слова:

фонетическое членение, сегментация, звучащая речь, речевой поток, микросегментация, макросегментация, речевые технологии.

1. Введение

Изучение различных аспектов слуховой сегментации речевого сообщения относится к числу наиболее перспективных исследований как в области построения теории звучащего текста, так и в сопоставительном ключе с учетом различных факторов, в том числе и региональных. Стремительное развитие речевых технологий предопределяет совершенствование лингвистических процессов в автоматизированных системах обработки семантической информации, что в значительной степени повышает надежность распознавания слитной речи.

Комплексная разработка технологий прикладных систем различного вида невозможна без учета лингвистических данных, полученных в результате изучения различных аспектов звучащего речевого объекта и в первую очередь особенностей его слуховой сегментации на дискретные единицы. При проведении подобного рода исследований следует также учитывать тот факт, что сами границы между сегментами и их варьирование в рамках внутри- и межъязыковых различий являются определяющим критерием сегментации речевого потока. Вслед за Р.К. Потаповой

мы условно различаем микро- и макросегментацию, что связано со спецификой выделяемых речевых сегментов. К микросементам относятся интразвуковые (переходные процессы), звуковые и слоговые. В данной области имеются многочисленные исследования отечественных , , , и зарубежных , , , ученых. Основным аспектом нашего исследования явилась наименее разработанная сфера изучения речевого сигнала, а именно его макросегментация. В качестве основных объектов макросегментации звукового потока мы рассматриваем ритмические группы (фонетические слова), синтагмы, фразы и фоноабзацы. Фоноабзац, по определению Р.К. Потаповой, – «это иерархически предельная и семантико-просодическая единица устного текста, способная адекватно представлять, за исключением некоторых закономерностей-универсалий, модель просодической структуры определенного типа текста в целом» .

Основной целью нашего исследования явилось выявление специфики слуховой макросегментации звучащих аутентичных немецких текстов в их региональных вариантах в Германии, Австрии и Швейцарии и установление зависимости их распознавания от ряда факторов, таких как синтагматические, контекстуальные и территориальные, а также от особенностей фонологической базы испытуемых.

2. Описание методики и результатов экспериментального исследования

В экспериментах по изучению особенностей слуховой сегментации звучащих текстов, проводимых в Германии, приняли участие аудиторы из четырех немецкоязычных регионов, таких как Австрия, Швейцария, Западная Германия и Восточная Германия (территория Бывшей ГДР) общим количеством 12, а также информанты из России (n=5) для выявления специфических различий в восприятии и декодировании речевого сообщения на немецком языке.

В соответствии с условиями проведения слухового эксперимента его участники из обеих групп вычленяли в звучащих текстах соответствующие фрагменты: фоноабзацы, фразы, синтагмы и фонетические слова. По определению О.С. Ахмановой, фонетическое слово – это «Самостоятельное слово вместе с примыкающими к нему безударными служебными словами и частицами»

.

Далее будут представлены результаты экспериментов. На этапе рассмотрения результатов фонетического членения немецких текстов на фоноабзацы было установлено наличие двух вариантов слуховой сегментации прослушанных текстов на максимальные единицы членения. Первую группу образуют данные западногерманского и австрийского регионов, вторую – восточногерманского и швейцарского региональных вариантов. При более детальном рассмотрении можно выявить общую тенденцию к преобладанию совпадающих случаев во всех регионах. Следующую позицию занимают случаи невыделения и далее – случаи несовпадения при слуховой сегментации звучащих текстов на фоноабзацы.

На следующем этапе слухового анализа рассматривалась специфика выделения фраз на перцептивном уровне. Как оказалось, западногерманские и австрийские аудиторы одинаково не выделяют фразы на слуховом уровне (соответственно: 6,5% и 6,7%). В восточногерманском варианте эти параметры не представлены. В данных по Швейцарии они имеют следующую процентную выраженность: несовпадения – 3,3%; совпадения – 11,7%.

Дифференцированное рассмотрение по региональным вариантам не выявило общих тенденций и совпадений. Данные в отношении всех регионов образуют единую зону разнообразных реализаций. Так, в регионах Западной Германии совпадающие случаи составляют наибольший процент – 93,5%, несовпадающие случаи выделения фраз отсутствуют, а наименьший процент составляют нулевые случаи – 6,6%. В Восточной Германии наблюдается полное совпадение фонетического членения текстов на фразы. В швейцарском региональном варианте следующие значения: совпадения – 84,9%; несовпадения – 3,3%; нулевые случаи – 11,7%. Австрийский региональный вариант: совпадения – 79,8%; несовпадения – 13,6%; нулевые случаи – 6,7%.

Таким образом, результаты анализа слухового членения текстов на фразы показывают, что преобладающими во всех региональных вариантах являются случаи совпадений. Случаи несовпадений и нулевые представлены специфически без каких-либо закономерностей.

Далее обрабатывались результаты слухового анализа особенностей синтагматического членения текстов. В данном случае наибольшую выраженность имеет везде процент совпадений. На втором месте – несовпадения и на третьем – нулевые случаи.

Итак, рассмотрим данные по регионам. Западногерманский, швейцарский, австрийский (соответственно): совпадения – 76,4%; 70,0% и 63,3%; несовпадения – 16,2%; 15,4% и 17,7%; нулевые случаи – 7,4%; 14,6% и 19,0%. Данные по восточногерманскому ареалу имеют следующую процентную выраженность: совпадения – 90,3%; несовпадения – 6,4% и нулевые случаи – 3,3%.

Таким образом, при синтагматическом членении текстов во всех рассматриваемых региональных вариантах наибольший процент имеют случаи совпадений. Данные информантов из Восточной Германии отличаются собственной спецификой.

На завершающем этапе работы с иностранными аудиторами анализировались их результаты по вычленению фонетических слов. Была выявлена довольно ровная картина значений во всех регионах. Нулевые случаи представлены только в результатах относительно Западной Германии – 1,1%.

Дальнейшее описание результатов проведенных слуховых экспериментов базируется на данных группы русских преподавателей.

При членении немецких текстов на фоноабзацы русскими аудиторами были выявлены некоторые общие тенденции. Наибольший процент по всем региональным вариантам имеют совпадающие случаи, далее – несовпадающие и нулевые случаи имеют место только в австрийском варианте. В целом австрийский вариант имеет некоторую специфику.

Общая картина выражается следующим образом: совпадения – 88,7%; 88,9% и 77,7%; несовпадения – 11,3%; 11,1% и 22,3%. Нулевые случаи в этих регионах отсутствуют. Данные по Австрии: совпадения – 61,1%; несовпадения – 1,7%; нулевые случаи – 22,2%.

Таким образом, при слуховом членении текстов на фоноабзацы русскими аудиторами выявляются следующие тенденции. Наиболее выражен процент случаев совпадения. На втором месте – несовпадения. Нулевые случаи представлены только в данных по Австрии. Западногерманский, восточногерманский и швейцарский региональные варианты имеют общую зону сходных реализаций. Австрия имеет свою специфику. Эти данные не соответствуют данным группы иностранных аудиторов.

Далее рассматривались показатели вычленения фраз русскими аудиторами, что позволило сделать заключение о том, что данные анализа русских аудиторов в отношении наличия общих тенденций при слуховом вычленении фраз в немецких текстах в целом близки результатам, полученным в группе немецких, швейцарских и австрийских информантов. Однако имеется некоторая специфика в членении одних и тех же текстов аудиторами – русскими и иностранными аудиторами.

Результаты дальнейшей обработки полученных данных показали, что синтагматическое членение немецких текстов русскими аудиторами осуществляется с более ровной процентной выраженностью, чем в случае анализа того же материала аудиторами – носителями немецкого языка. Во всех региональных вариантах доминируют случаи совпадения членения, на втором месте – несовпадения и на третьем – нулевые случаи. Данные всех ареалов входят в общую зону близких значений.

Данные по региональным вариантам следующие. Западногерманский вариант: совпадения – 68,5%, несовпадения – 20,4%, нулевые случаи – 11,1%; восточногерманский – 70,9%; 21,6% и 6,9%; швейцарский – 57,4%; 30,6% и 11,9%; австрийский – 54,3%; 14,8% и 21,1%.

Таким образом, выделение синтагм русскими аудиторами в немецких текстах осуществляется с преимуществом несовпадающих случаев. Во всех региональных вариантах наблюдается сходная картина, которая совпадает с данными в группе иностранных аудиторов. Отличие заключается лишь в том, что данные русских информантов имеют более ровные процентные значения.

На завершающем этапе сравнения данных слухового анализа рассматривалась специфика сегментации немецких текстов на фонетические слова русскими аудиторами. Было установлено, что в немецких текстах русские аудиторы выделяют фонетические слова довольно специфично. Лидирует процентная выраженность случаев совпадения, причем в данных по Западной Германии и Восточной Германии она составляет 100%, в швейцарском и австрийском региональных вариантах процент несколько меньше. Данные по несовпадениям и нулевым случаям полностью отличаются от результатов, полученных иностранными аудиторами.

Рассмотрение данных дифференцированно по региональным вариантам позволяет выделить наличие двух зон близких реализаций, то есть западногерманский и восточногерманский региональные варианты, с одной стороны, и швейцарский и австрийский, с другой. В первой зоне представлен полный процент совпадений (100%) вычленения фонетических слов русскими аудиторами. Вторая зона представляет собой следующую картину. Совпадения: швейцарский региональный вариант – 72,3%; австрийский – 75,7%. Несовпадения – 75,7% и 20,5%. Нулевые случаи отмечены только в данных по Австрии – 3,7%. Данные результаты совпадают с полученными нами ранее данными в отношении специфики временной организации немецких текстов в их региональных вариантах

.

Таким образом, русские аудиторы вычленяют фонетические слова довольно специфично, что не совпадает с данными иностранных информантов.

3. Заключение

Как показали результаты проведенных слуховых экспериментов по фонетическому членению немецких текстов в двух группах испытуемых – русских и иностранных информантов – данные совпадают только при выделении синтагм. Единую зону близких значений образовали показатели во всех регионах. Как показали данные по результатам эксперимента в группе носителей немецкого языка, при сегментации текстов на фонетические слова и фразы перцептивная выраженность их границ позволяет сделать вывод о единой зоне сходных реализаций. Что касается результатов, полученных в группе русских информантов, то в данном случае единая зона идентичных реализаций наблюдалась только при сегментации на фоноабзацы. Только при сегментации немецких текстов на фразы и фонетические слова были выделены две зоны одинаковых значений, это австрийский, швейцарский регионы и территории Западной и Восточной Германии.

Полученные результаты подтвердили полученные нами ранее выводы об определяющем значении фонологической базы испытуемых для процесса восприятия и декодирования речевого сообщения

, .

В заключение следует указать на значимость и перспективность дальнейшей разработки исследуемой проблемы, подчеркнуть необходимость дальнейших изысканий в данном направлении. Изложенные результаты наших слуховых экспериментов по сегментации речевого потока могут быть использованы для совершенствования базы данных фонологических маркеров границ лингвистических единиц, разработки соответствующих алгоритмов распознавания немецкой речи с учетом различных факторов, в том числе и территориальных. Полученные данные окажутся полезными в процессе обучения иностранному языку, они помогут обучающимся правильно сформулировать свое высказывание в акте коммуникации.

Дополнительные материалы

Не указаны

Финансирование

Авторы не получали финансовой поддержки для проведения исследования, написания и публикации статьи

Благодарности

Не указаны

Конфликт интересов

Не указаны

Список литературы

Ахманова О.С. Словарь лингвистических терминов / О.С. Ахманова — Москва: УРСС, 2004. — 569 с.
Гордеева Т.А. Модификации мелодического признака фонетического членения текстов в региональных вариантах современного немецкого языка / Т.А. Гордеева // Известия ВГПУ. — 2020. — № 3 (146). — С. 167–172.
Гордеева Т.А. Специфика временной организации немецких текстов в региональных вариантах современного немецкого языка / Т.А. Гордеева, А.О. Булатова // Международный научно-исследовательский журнал. — 2023. — № 7 (133).
Гордеева Т.А. Фонологические критерии микросегментации речевого потока / Т.А. Гордеева, Е.А. Гладкова // Университетское образование (МКУО-2015): сб. ст. XIX Междунар. науч.-метод. конф., посвящ. 70-летию Победы в Великой Отечественной Войне (г. Пенза, 09–10 апреля 2015 г.) / Под ред. А.Д. Гуляков, Р.М. Печерская — Пенза: ПГУ, 2015. — Т. 2. — С. 42–43.
Златоустова Л.В. Общая и прикладная фонетика: учебное пособие для филологических специальностей вузов / Л.В. Златоустова, Р.К. Потапова, В.Н. Трунин-Донской — Москва: МГУ им. М.В. Ломоносова, 1986. — 304 с.
Потапова Р.К. Восприятие мультимодальной моно- и полиэтнической коммуникации: монография / Р.К. Потапова, В.В. Потапов, Л.Р. Комалова — Москва: ИНИОН РАН, 2020. — 207 с.
Потапова Р.К. Параметрическая микро- и макросегментация слитной речи / Р.К. Потапова // Проблемы фонетики и фонологии. — Москва: ИЯЗ, 1986. — С. 5–11.
Потапова Р.К. Речевая коммуникация в информационном пространстве / Р.К. Потапова [и др.]; отв. ред. Р.К. Потапова. — М.: ЛЕНАНД, 2017. — 112 с.
Речевая коммуникация в сетевых структурах: между глобальным и локальным: Сб. науч. трудов / Отв. ред. В.В. Потапов, Е.А. Казак. — М.: ИНИОН РАН, 2022. — 280 с.
Berend N. Regionale Gebrauchsstandards – Gibt es sie und wie kann man sie beschreiben? / N. Berend // Standardvariation. Wie viel Variation verträgt die deutsche Sprache? / Hrsg. L.M. Eichinger, W. Kallmeyer. — Berlin; New York: De Gruyter, 2005. — S. 143–170.
Fieler R. Eigenschaften gesprochener Sprache / R. Fieler, B. Barden, M. Elstermann [et al.]. — Tübingen: Gunter Narr Verlag, 2004. — 538 s.
Kipp A. Automatische Segmentierung und Etikettierung von Spontansprache / A. Kipp. — Aachen: Shaker Verlag, 1999. — 185 s.
Peters P. Multiple Cues for Phonetic Phrase Boundaries in German Spontaneous Speech / P. Peters; ed. by M.J. Solé, D. Recasens, and J. Romero. — Barcelona: Causal Productions Pty Ltd, 2003. — p. 1795–1798.

Рецензия

Рецензент:Сообщество рецензентов Международного научно-исследовательского журнала

1 раунд рецензирования

Текст рецензии

DOI:10.60797/IRJ.2024.147.85.1

1. Краткое описание проблемы, которой посвящена статья.

Статья выполнена в русле экспериментальной фонетики и затрагивает проблематику слуховой сегментации речевого сообщения. Автор обращается к наименее разработанной сфере изучения речевого сигнала – его макросегментации. Исследование выполнено на сопоставительном материале, полученном в ходе экспериментов с участием аудиторов из Западной и Восточной Германии, Австрии, Швейцарии, а также русских информантов – опытных преподавателей-филологов.

2. Степень актуальности предоставляемой статьи.

Рецензируемая работа имеет особую актуальность для тех областей компьютерной лингвистики, которые занимаются разработкой систем автоматического распознавания речи. Так, результаты исследования сами по себе являются пополнением базы данных фонологических маркеров границ лингвистических единиц и могут быть использованы для разработки соответствующих алгоритмов распознавания речи. Значимым является также обращение к сопоставительному материалу региональных вариантов немецкого языка и варианта «профессиональных коммуникантов», для которых немецкий не является родным языком.

3. Наиболее важные аспекты, раскрытые автором в статье.

Автор задается целью выявить специфику слуховой макросегментации звучащих аутентичных немецких текстов в указанных вариантах немецкого языка и установить зависимость их распознавания от синтагматических, контекстуальных и территориальных факторов, а также от особенностей фонологической базы испытуемых. В слуховом эксперименте по фонетическому членению речевого потока приняли участие 12 немецких и 5 русских аудиторов. Фрагментами для макросегментации были фоноабзацы, фразы, синтагмы и фонетические слова. Автор приводит процентные показатели совпадений / несовпадений / нулевых случаев по всем региональным группам, проводит их сопоставительный анализ и интерпретацию. По результатам анализа делается вывод об определяющем значении фонологической базы испытуемых для процесса восприятия и декодирования речевого сообщения.

4. Изложение конкретных положительных и отрицательных сторон работы, а также предложения по доработке и дополнению статьи.

Положительными сторонами работы являются стройность и логичность изложения, насыщенность экспериментальных данных, убедительность их анализа. В качестве пожелания для улучшения восприятия материала читателем можно было бы порекомендовать визуализацию этих данных в виде таблиц и / или диаграмм, что, однако, не является обязательным требованием доработки статьи.

5. Вынесение вердикта о возможности публикации статьи, возможности публикации с внесением указанных доработок, невозможности публикации статьи в «Международном научно-исследовательском журнале».

Статья может быть опубликована в «Международном научно-исследовательском журнале».

Информация об авторах

АффилиацияПензенский государственный университет, Пенза, Российская Федерация

Роль:Автор, Методология, Написание, проверка и редактирование, Написание черновика статьи и её подготовка, Анализ данных исследования, Исследование

ORCID:0000-0003-0927-3403

ELIBRARY AUTHOR ID:668055

RESEARCHER ID:GRR-3018-2022

АффилиацияПензенский государственный университет, Пенза, Российская Федерация

Роль:Автор

ORCID:0000-0003-3218-3027

ELIBRARY AUTHOR ID:637377

RESEARCHER ID:GRR-2897-2022

Метрика статьи

Скачиваний:4

ПросмотрыСкачивания

Просмотры

Всего: