Phonetic division of texts as a means of continuous speech recognition in German-speaking regions
Phonetic division of texts as a means of continuous speech recognition in German-speaking regions
Abstract
The article examines the phonetic division of texts from the standpoint of complex development of applied systems, involving linguistic components analyzed in relation to various German-speaking regions. We prove that such studies are significant and necessary to improve automatic speech recognition systems and to construct correct utterances in the act of communication. The study is conducted in a comparative manner, taking into account various factors, including syntagmatic, positional and territorial ones. We compare the findings obtained in two groups of informants: native speakers of modern German from four German-speaking regions and experienced language teachers from Russia. Finally, we conclude that the subjects’ phonological base influences how a speech message is perceived and decoded.
1. Введение
Изучение различных аспектов слуховой сегментации речевого сообщения относится к числу наиболее перспективных исследований как в области построения теории звучащего текста, так и в сопоставительном ключе с учетом различных факторов, в том числе и региональных. Стремительное развитие речевых технологий предопределяет совершенствование лингвистических процессов в автоматизированных системах обработки семантической информации, что в значительной степени повышает надежность распознавания слитной речи.
Комплексная разработка технологий прикладных систем различного вида невозможна без учета лингвистических данных, полученных в результате изучения различных аспектов звучащего речевого объекта и в первую очередь особенностей его слуховой сегментации на дискретные единицы. При проведении подобного рода исследований следует также учитывать тот факт, что сами границы между сегментами и их варьирование в рамках внутри- и межъязыковых различий являются определяющим критерием сегментации речевого потока. Вслед за Р.К. Потаповой
мы условно различаем микро- и макросегментацию, что связано со спецификой выделяемых речевых сегментов. К микросементам относятся интразвуковые (переходные процессы), звуковые и слоговые. В данной области имеются многочисленные исследования отечественных , , , и зарубежных , , , ученых. Основным аспектом нашего исследования явилась наименее разработанная сфера изучения речевого сигнала, а именно его макросегментация. В качестве основных объектов макросегментации звукового потока мы рассматриваем ритмические группы (фонетические слова), синтагмы, фразы и фоноабзацы. Фоноабзац, по определению Р.К. Потаповой, – «это иерархически предельная и семантико-просодическая единица устного текста, способная адекватно представлять, за исключением некоторых закономерностей-универсалий, модель просодической структуры определенного типа текста в целом» .Основной целью нашего исследования явилось выявление специфики слуховой макросегментации звучащих аутентичных немецких текстов в их региональных вариантах в Германии, Австрии и Швейцарии и установление зависимости их распознавания от ряда факторов, таких как синтагматические, контекстуальные и территориальные, а также от особенностей фонологической базы испытуемых.
2. Описание методики и результатов экспериментального исследования
В экспериментах по изучению особенностей слуховой сегментации звучащих текстов, проводимых в Германии, приняли участие аудиторы из четырех немецкоязычных регионов, таких как Австрия, Швейцария, Западная Германия и Восточная Германия (территория Бывшей ГДР) общим количеством 12, а также информанты из России (n=5) для выявления специфических различий в восприятии и декодировании речевого сообщения на немецком языке.
В соответствии с условиями проведения слухового эксперимента его участники из обеих групп вычленяли в звучащих текстах соответствующие фрагменты: фоноабзацы, фразы, синтагмы и фонетические слова. По определению О.С. Ахмановой, фонетическое слово – это «Самостоятельное слово вместе с примыкающими к нему безударными служебными словами и частицами»
.Далее будут представлены результаты экспериментов. На этапе рассмотрения результатов фонетического членения немецких текстов на фоноабзацы было установлено наличие двух вариантов слуховой сегментации прослушанных текстов на максимальные единицы членения. Первую группу образуют данные западногерманского и австрийского регионов, вторую – восточногерманского и швейцарского региональных вариантов. При более детальном рассмотрении можно выявить общую тенденцию к преобладанию совпадающих случаев во всех регионах. Следующую позицию занимают случаи невыделения и далее – случаи несовпадения при слуховой сегментации звучащих текстов на фоноабзацы.
На следующем этапе слухового анализа рассматривалась специфика выделения фраз на перцептивном уровне. Как оказалось, западногерманские и австрийские аудиторы одинаково не выделяют фразы на слуховом уровне (соответственно: 6,5% и 6,7%). В восточногерманском варианте эти параметры не представлены. В данных по Швейцарии они имеют следующую процентную выраженность: несовпадения – 3,3%; совпадения – 11,7%.
Дифференцированное рассмотрение по региональным вариантам не выявило общих тенденций и совпадений. Данные в отношении всех регионов образуют единую зону разнообразных реализаций. Так, в регионах Западной Германии совпадающие случаи составляют наибольший процент – 93,5%, несовпадающие случаи выделения фраз отсутствуют, а наименьший процент составляют нулевые случаи – 6,6%. В Восточной Германии наблюдается полное совпадение фонетического членения текстов на фразы. В швейцарском региональном варианте следующие значения: совпадения – 84,9%; несовпадения – 3,3%; нулевые случаи – 11,7%. Австрийский региональный вариант: совпадения – 79,8%; несовпадения – 13,6%; нулевые случаи – 6,7%.
Таким образом, результаты анализа слухового членения текстов на фразы показывают, что преобладающими во всех региональных вариантах являются случаи совпадений. Случаи несовпадений и нулевые представлены специфически без каких-либо закономерностей.
Далее обрабатывались результаты слухового анализа особенностей синтагматического членения текстов. В данном случае наибольшую выраженность имеет везде процент совпадений. На втором месте – несовпадения и на третьем – нулевые случаи.
Итак, рассмотрим данные по регионам. Западногерманский, швейцарский, австрийский (соответственно): совпадения – 76,4%; 70,0% и 63,3%; несовпадения – 16,2%; 15,4% и 17,7%; нулевые случаи – 7,4%; 14,6% и 19,0%. Данные по восточногерманскому ареалу имеют следующую процентную выраженность: совпадения – 90,3%; несовпадения – 6,4% и нулевые случаи – 3,3%.
Таким образом, при синтагматическом членении текстов во всех рассматриваемых региональных вариантах наибольший процент имеют случаи совпадений. Данные информантов из Восточной Германии отличаются собственной спецификой.
На завершающем этапе работы с иностранными аудиторами анализировались их результаты по вычленению фонетических слов. Была выявлена довольно ровная картина значений во всех регионах. Нулевые случаи представлены только в результатах относительно Западной Германии – 1,1%.
Дальнейшее описание результатов проведенных слуховых экспериментов базируется на данных группы русских преподавателей.
При членении немецких текстов на фоноабзацы русскими аудиторами были выявлены некоторые общие тенденции. Наибольший процент по всем региональным вариантам имеют совпадающие случаи, далее – несовпадающие и нулевые случаи имеют место только в австрийском варианте. В целом австрийский вариант имеет некоторую специфику.
Общая картина выражается следующим образом: совпадения – 88,7%; 88,9% и 77,7%; несовпадения – 11,3%; 11,1% и 22,3%. Нулевые случаи в этих регионах отсутствуют. Данные по Австрии: совпадения – 61,1%; несовпадения – 1,7%; нулевые случаи – 22,2%.
Таким образом, при слуховом членении текстов на фоноабзацы русскими аудиторами выявляются следующие тенденции. Наиболее выражен процент случаев совпадения. На втором месте – несовпадения. Нулевые случаи представлены только в данных по Австрии. Западногерманский, восточногерманский и швейцарский региональные варианты имеют общую зону сходных реализаций. Австрия имеет свою специфику. Эти данные не соответствуют данным группы иностранных аудиторов.
Далее рассматривались показатели вычленения фраз русскими аудиторами, что позволило сделать заключение о том, что данные анализа русских аудиторов в отношении наличия общих тенденций при слуховом вычленении фраз в немецких текстах в целом близки результатам, полученным в группе немецких, швейцарских и австрийских информантов. Однако имеется некоторая специфика в членении одних и тех же текстов аудиторами – русскими и иностранными аудиторами.
Результаты дальнейшей обработки полученных данных показали, что синтагматическое членение немецких текстов русскими аудиторами осуществляется с более ровной процентной выраженностью, чем в случае анализа того же материала аудиторами – носителями немецкого языка. Во всех региональных вариантах доминируют случаи совпадения членения, на втором месте – несовпадения и на третьем – нулевые случаи. Данные всех ареалов входят в общую зону близких значений.
Данные по региональным вариантам следующие. Западногерманский вариант: совпадения – 68,5%, несовпадения – 20,4%, нулевые случаи – 11,1%; восточногерманский – 70,9%; 21,6% и 6,9%; швейцарский – 57,4%; 30,6% и 11,9%; австрийский – 54,3%; 14,8% и 21,1%.
Таким образом, выделение синтагм русскими аудиторами в немецких текстах осуществляется с преимуществом несовпадающих случаев. Во всех региональных вариантах наблюдается сходная картина, которая совпадает с данными в группе иностранных аудиторов. Отличие заключается лишь в том, что данные русских информантов имеют более ровные процентные значения.
На завершающем этапе сравнения данных слухового анализа рассматривалась специфика сегментации немецких текстов на фонетические слова русскими аудиторами. Было установлено, что в немецких текстах русские аудиторы выделяют фонетические слова довольно специфично. Лидирует процентная выраженность случаев совпадения, причем в данных по Западной Германии и Восточной Германии она составляет 100%, в швейцарском и австрийском региональных вариантах процент несколько меньше. Данные по несовпадениям и нулевым случаям полностью отличаются от результатов, полученных иностранными аудиторами.
Рассмотрение данных дифференцированно по региональным вариантам позволяет выделить наличие двух зон близких реализаций, то есть западногерманский и восточногерманский региональные варианты, с одной стороны, и швейцарский и австрийский, с другой. В первой зоне представлен полный процент совпадений (100%) вычленения фонетических слов русскими аудиторами. Вторая зона представляет собой следующую картину. Совпадения: швейцарский региональный вариант – 72,3%; австрийский – 75,7%. Несовпадения – 75,7% и 20,5%. Нулевые случаи отмечены только в данных по Австрии – 3,7%. Данные результаты совпадают с полученными нами ранее данными в отношении специфики временной организации немецких текстов в их региональных вариантах
.Таким образом, русские аудиторы вычленяют фонетические слова довольно специфично, что не совпадает с данными иностранных информантов.
3. Заключение
Как показали результаты проведенных слуховых экспериментов по фонетическому членению немецких текстов в двух группах испытуемых – русских и иностранных информантов – данные совпадают только при выделении синтагм. Единую зону близких значений образовали показатели во всех регионах. Как показали данные по результатам эксперимента в группе носителей немецкого языка, при сегментации текстов на фонетические слова и фразы перцептивная выраженность их границ позволяет сделать вывод о единой зоне сходных реализаций. Что касается результатов, полученных в группе русских информантов, то в данном случае единая зона идентичных реализаций наблюдалась только при сегментации на фоноабзацы. Только при сегментации немецких текстов на фразы и фонетические слова были выделены две зоны одинаковых значений, это австрийский, швейцарский регионы и территории Западной и Восточной Германии.
Полученные результаты подтвердили полученные нами ранее выводы об определяющем значении фонологической базы испытуемых для процесса восприятия и декодирования речевого сообщения
, .В заключение следует указать на значимость и перспективность дальнейшей разработки исследуемой проблемы, подчеркнуть необходимость дальнейших изысканий в данном направлении. Изложенные результаты наших слуховых экспериментов по сегментации речевого потока могут быть использованы для совершенствования базы данных фонологических маркеров границ лингвистических единиц, разработки соответствующих алгоритмов распознавания немецкой речи с учетом различных факторов, в том числе и территориальных. Полученные данные окажутся полезными в процессе обучения иностранному языку, они помогут обучающимся правильно сформулировать свое высказывание в акте коммуникации.