USING NON-NUMERIC STATISTICS METHODS FOR THE ANALYSIS OF QUALITATIVE CHARACTERISTICS OF LINGUISTIC OBJECTS

Research article
DOI:
https://doi.org/10.23670/IRJ.2021.106.4.110
Issue: № 4 (106), 2021
Published:
2021/04/19
PDF

ИСПОЛЬЗОВАНИЕ МЕТОДОВ НЕЧИСЛОВОЙ СТАТИСТИКИ ДЛЯ АНАЛИЗА КАЧЕСТВЕННЫХ ПРИЗНАКОВ ЛИНГВИСТИЧЕСКИХ ОБЪЕКТОВ

Научная статья

Матюшина И.В.1, *, Брылева Е.В.2

1 ORCID: 0000-0001-5419-3109;

2 ORCID: 0000-0002-5217-0357;

1, 2 Брянский государственный технический университет, Брянск, Россия

* Корреспондирующий автор (irina_bryansk[at]mail.ru)

Аннотация

Одним из направлений прикладной лингвистики является квантитативная лингвистика, которая предлагает методы решения практических задач, связанных с изучением и использованием языка. Применение статистических и/или количественных методик, в том, числе, методов нечисловой статистики, позволяет работать не только с количественными, но и с качественными признаками языковых объектов на разных уровнях языка. Математические процедуры (корреляционный анализ, кластерный анализ, дискриминантный анализ и др.), специально модифицированные для работы с качественными признаками, позволяют решать сложные задачи таксономического анализа, формулируя законы функционирования языка. В данной статье делается попытка анализа применения вышеназванных процедур в некоторых областях лингвистического исследования.

Ключевые слова: квантитативная лингвистика, качественные признаки, корреляционный анализ, многомерный дискриминантный анализ.

USING NON-NUMERIC STATISTICS METHODS FOR THE ANALYSIS OF QUALITATIVE CHARACTERISTICS OF LINGUISTIC OBJECTS

Research article

Matyushina I.V.1, *, Bryleva E.V.2

1 ORCID: 0000-0001-5419-3109;

2 ORCID: 0000-0002-5217-0357;

1, 2 Bryansk State Technical University, Bryansk, Russia

* Corresponding author (irina_bryansk[at]mail.ru)

Abstract

One of the areas of applied linguistics is quantitative linguistics, which offers methods for solving practical problems related to the study and use of language. The use of statistical and/or quantitative methods, including methods of non-numerical statistics, allows for working not only with quantitative but also with qualitative features of language objects at different levels of the language. Mathematical procedures (correlation analysis, cluster analysis, discriminant analysis, etc.), which are specially modified for working with qualitative features, allow for solving complex problems of taxonomic analysis and formulating the laws of language functioning. The current article attempts to analyze the application of the above-mentioned procedures in some areas of linguistic research.

Keywords: quantitative linguistics, qualitative features, correlation analysis, multivariate discriminant analysis.

Введение

Применение формальных методов для описания языковых явлений практикуется в отечественной и зарубежной лингвистике достаточно давно. Там, где традиционные методы оказываются не в силах объяснить общие механизмы взаимодействия сложных для таксономического анализа языковых и речевых элементов или решить проблемы их классификации, используются прикладные лингвистические исследования и, прежде всего, квантитативная лингвистика, которая занимается поиском статистических закономерностей на разных уровнях языка и пытается дать объяснение этим закономерностям.

В настоящее время количественные методы получили широкое распространение в конкретных исследованиях, имеющих дело с боль­шим эмпирическим материалом в рамках задач таксономии. Как известно, математическая статистика располагает большим набором методов анализа эмпирических данных, целый ряд которых используется в лингвистических исследованиях. Лингвостатистические исследования последних лет в значительной части направлены на описание и оценивание таких количественных характеристик. Вместе с тем для лингвистики, как и других индуктивных наук, основные представления и теории которых носят качественный характер, весьма существенное значение имеет анализ качес­твенных данных [9].

Качественные признаки, в отличие от количественных, не поддаются измерению. Исследователь отмечает только наличие или отсутствие данного признака у членов выборки, т.е. подсчитывает, какое число членов обладает или не обладает этим признаком.

Методы анализа и обработки качественных признаков развиваются в специальном направлении математической статистики – статистике объектов нечисловой природы (нечисловой информации). Анализ нечисловой информации развивается под воздействием запросов конкретных исследований индуктивных наук (в первую очередь социологии, биологии, психологии и др.). Он включает математические процедуры (корреляционный анализ, кластерный анализ, дискриминантный анализ и др.), специально модифицированные для работы с качественными признаками.

Под признаком понимается любое различие между исследуемыми объектами, т.е. любая дистинктивная черта, отличающая какую-либо одну языковую единицу от другой. Таким образом, термин "признак" используется как обобщенное понятие переменной.

Наиболее широкое применение в лингвистике получил метод корреляционного анализа для пар качественных признаков. Методологической особенностью подхода является формирование списка признаков, относящихся к разным лингвистическим уровням, разной степени обобщенности и описание материала в пространстве всех этих признаков. В качестве математического аппарата в основном используется коэффициент корреляции Пирсона либо (в модифицированном виде) Коула, который позволяет эксплицировать наличие или отсутствие статистически значимой зависимости между исследуемыми признаками [13].

Коэффициент Коула изменяется в пределах от +1 до -1. При значениях коэффициента больших нуля говорят о положительной зависимости признаков, в случаях, когда значения коэффициента меньше нуля, зависимость является отрицательной. Если коэффициент корреляции равен нулю, связь отсутствует.

Выявление действительных причинно-следственных соотношений признаков должно проводиться на основании содержательной интерпретации полученных корреляционных зависимостей.

Свое развитие корреляционный анализ получает в применении таких методик, как коэффициент сходства и методы группировки признаков (построение корреляционных плеяд и кластерный анализ) [10].

За последние годы было проведено немало исследований, в которых использование многоуровнего подхода и метода корреляционного анализа позволило получить новые данные относительно тех явлений, существенная информация о которых осталась за рамками исследований теоретической лингвистики. В частности, анализ сложных в плане определения статуса синтаксических позиций в английском языке [8], участков английской словообразовательной системы, не менее сложных в структурном, семантическом, этимологическом и хронологическом отношениях [5], [11], [3], выделение интегральных и дифференциальных черт естественного языка и метаязыка [10].

Авторы подробно рассмотрели корреляционные картины разноуровневых признаков исследуемых объектов и пришли к выводам, существенно модифицирующим представление о языковой системе и возможностях ее функционирования.

Не менее часто для анализа лингвистических данных, наряду с традиционными методами исследования, используются многомерные статистические процедуры в рамках дискриминантного анализа [6]. Дискриминантный анализ традиционно используется для принятия решения о том, какие переменные различают (дискриминируют) две или более совокупности (группы). Успешный опыт применения процедур этого вида анализа на языковом и текстовом материале имеет место в целом ряде работ, в том числе и тех, где описано применение многомерного дискриминантного анализа для работы с поэтическими текстами. В ходе изучения поэтических образов этот метод позволяет выявить признаки, различающие периоды развития образной системы одного поэта, оценить дискриминантную силу каждого из них, установить направление изменений в системе образов, выделить ядро и периферию классов текстов, характеризующих различные этапы творчества [7].

С помощью дискриминантного анализа выявляется механизм взаимодействия разноуровневых характеристик как в рамках отдельных элементов модели, так и всей модели в целом; устанавливаются признаки, оказывающие наибольшее влияние на сочетаемостные возможности лексических единиц в рамках модели; определяется сходство и различие левых и правых элементов образных моделей.

Трудно переоценить значение этого метода и для стилеметрии - одного из ведущих направлений в области изучения особенностей творческой манеры авторов, классификации текстов, определения авторства, выявления жанровой характеристики текстов. Основной целью стилеметрического анализа является нахождение признаков, отображающих как сходство стиля разных авторов, так и имеющиеся в них различия. Указанная задача решается на материале как прозаических текстов, так и стихотвор ных.

К анализу привлекаются признаки, отражающие фонетический, морфологический, синтаксический, ритмометрический аспекты и другие уровни. В результате применения дискриминантного анализа авторами устанавливается, какие из привлекаемых ими к анализу признаки оказались релевантными для дискриминации текстов различных авторов. Эти признаки формируют модель, определяющую признаковое пространство для дальнейшего исследования [4], [2].

В результате использования дискриминантного анализа были получены эксплицитные данные об основных тенденциях и закономерностях динамики развития стилистических особенностей авторов художественных текстов и решения вопросов классификации языкового и речевого материала.

Заключение

Даже небольшое количество приведенных здесь примеров использования методов нечисловой статистики для анализа качественных признаков лингвистических объектов позволяет судить о том, что это направление продолжает оставаться перспективным. Исследования, проводимые с помощью квантитативных методов, позволяют в конечном итоге выявлять тенденции развития языковой системы и на основе этого формулировать гипотезы о будущем состоянии языка.

Конфликт интересов Не указан. Conflict of Interest None declared.

Список литературы / References

  1. Аделева О.П. Факторы, обусловливающие образование вторичных значений у производных аффиксальных существительных в английском языке: на материале имен действия с суффиксами -ment, -ing,-age :дис. ... канд. филол. наук:10.02.04: защищена 18.02.11 / Аделева Ольга Павловна. – Смоленск, 2011. – 215 с.
  2. Андреев В.С. Языковая модель развития индивидуального стиля: на материале стихотворных текстов американских поэтов-романтиков : дис. ... докт. филол. наук :10.02.04: защищена 20.04.12 / Андреев Вадим Сергеевич. – Смоленск, 2012. – 391 с.
  3. Грахольская М. И. Структурно-семантические особенности высокочастотных глаголов и существительных современного английского языка : дис. ...канд. филол. наук :10.02.04 : защищена 19.06.15 / Грахольская Марина Ивановна. – Смоленск, 2015. – 158 с.
  4. Ермолаева Ю.Е. Классификация стихотворных текстов методом дискриминантного анализа / Ю.Н.Ермолаева // Вестник Тамбовского государственного университета. Серия: Гуманитарные науки. – 2009. – № 7 (75). – С. 292-296.
  5. Жоголев Е.А. Факторы, определяющие аффиксальную сочетаемость существительных в современном английском языке. : дис ….канд. филол. наук:10.02.04: защищена 29.09.06 / Жоголев Евгений Александрович. – Смоленск, 2006. – 147 с.
  6. Клекка У.Р. Дискриминантный анализ / У.Р.Клекка // Факторный, дискриминантный и кластерный анализ. – М., 1989. – С. 78-138.
  7. Кучер И. Н. Структурно-семантические признаки именных образных моделей в английском языке (на материале образной системы А. Теннисона) : дис. …канд. филол. наук: 10.02.04 : защищена 08.12.06 / Кучер Ирина Николаевна. – Смоленск, 2006. – 157 с.
  8. Матюшина И.В. Структурно-семантические признаки глагольно-именной конструкции с локативными предлогами в современном английском языке: дис. ... канд. филол. наук: 10.02.04: защищена 26.10.05 / Матюшина Ирина Викторовна. – Смоленск, 2005. – 151 с.
  9. Миркин Б.Г. Модели качественного анализа социально-экономической информации / Б.Г.Миркин // Математика в социологии. – М., 1977. – С.339-352.
  10. Никифорова Н.А. Структурные особенности английского семантического метаязыка (на материале глагольной лексики дефиниций словаря „Macmillan English Dictionary“): дис. ... канд. филол. наук: 10.02.04: защищена 14.10.11 / Никифорова Наталья Александровна. – Смоленск, 2011. – 157 с.
  11. Савочкина Е.В. Межуровневые соотношения характеристик деадъективных существительных современного английского языка: дис. ... канд. филол. наук: 10.02.04: защищена 24.04.13 / Савочкина Елена Валерьевна. – Смоленск, 2013. – 195 с.
  12. Солодовникова Н.В. Формальное и семантическое взаимодействие прилагательного с деадъективными знаменательными частями речи в современном английском языке: дис. ... канд. филол. наук: 10.02.04: защищена 11.05.07 / Солодовникова Наталья Викторовна. – Смоленск, 2007. – 145 с.
  13. Тулдава Ю.А. Об измерении связи качественных признаков в лингвистике: Сопряженность альтернативных признаков / Ю.А.Тулдава // Квантитативная лингвистика и автоматический анализ текстов: Ученые записки Тартусского университета. – Тарту, 1988. – Вып.827. – С.146-162.

Список литературы на английском языке / References in English

  1. Adeleva O. P. Faktory, obuslovlivajushhie obrazovanie vtorichnyh znachenij u proizvodnyh affiksal'nyh sushhestvitel'nyh v anglijskom jazyke: na materiale imen dejstvija s suffiksami -ment, -ing,-age [Factors determining the formation of secondary meanings in derivatives of affixal nouns in the English language: on the material of action names with suffixes -ment, - ing, - age] : dis. ... PhD in Philology:10.02.04: defense of the thesis 18.02.11 / Adeleva Olga Pavlovna.- Smolensk, 2011. - 215 p. [in Russian]
  2. Andreev V. S. Jazykovaja model' razvitija individual'nogo stilja: na materiale stihotvornyh tekstov amerikanskih pojetov-romantikov [Linguistic model of individual style development: on the material of poetic texts of American Romantic poets] : dis. ... PhD in Philology :10.02.04: defense of the thesis 20.04.12 / Vadim Andreev. - Smolensk, 2012. - 391 p. [in Russian]
  3. Grakholskaya M. I. Strukturno-semanticheskie osobennosti vysokochastotnyh glagolov i sushhestvitel'nyh sovremennogo anglijskogo jazyka [Structural and semantic features of high-frequency verbs and nouns of modern English] : dis. ... PhD in Philology:10.02.04: defense of the thesis 19.06.15 / Graholskaya Marina Ivanovna. - Smolensk, 2015. -158 p. [in Russian]
  4. Yermolaeva Yu. E. Klassifikacija stihotvornyh tekstov metodom diskriminantnogo analiza [Classification of poetic texts by means of discriminant analysis method] / Yu.N. Yermolaeva // Vestnik Tambovskogo gosudarstvennogo universiteta. Serija: Gumanitarnye nauki [Bulletin of Tambov State University. Series: Humanities]. – 2009. – № 7 (75). – P. 292-296. [in Russian]
  5. Zhogolev E. A. Faktory, opredeljajushhie affiksal'nuju sochetaemost' sushhestvitel'nyh v sovremennom anglijskom jazyke [Factors determining the affixal compatibility of nouns in modern English] : dis. ... PhD in Philology:10.02.04: defense of the thesis 29.09.06 / Zhogolev Evgeny Aleksandrovich . - Smolensk, 2006. - 147 p. [in Russian]
  6. Klecka U. R. Diskriminantnyj analiz [Discriminant analysis] / U. R. Klecka // Faktornyj, diskriminantnyj i klasternyj analiz [Factor, discriminant and cluster analysis]. - M., 1989. - P. 78-138. [in Russian]
  7. Kucher I. N. Strukturno-semanticheskie priznaki imennyh obraznyh modelej v anglijskom jazyke (na materiale obraznoj sistemy A. Tennisona) [Structural and semantic features of nominal figurative models in the English language (based on the the figurative system of A. Tennyson)] : dis. ... PhD in Philology: 10.02.04: defense of the thesis 08.12.06 / Kucher Irina Nikolaevna. - Smolensk, 2006. -157 p. [in Russian]
  8. Matyushina I. V. Strukturno-semanticheskie priznaki glagol'no-imennoj konstrukcii s lokativnymi predlogami v sovremennom anglijskom jazyke [Structural and semantic features of the verb-nominal construction with locative prepositions in modern English] : dis. ... PhD in Philology: 10.02.04: defense of the thesis 26.10.05 / Matyushina Irina Viktorovna. - Smolensk, 2005. - 151 p. [in Russian]
  9. Mirkin B. G. Modeli kachestvennogo analiza social'no-jekonomicheskoj informacii [Models of qualitative analysis of socio-economic information] / B. G. Mirkin // Matematika v sociologii [Mathematics in sociology]. - M., 1977. -P. 339-352. [in Russian]
  10. Nikiforova N. A. Strukturnye osobennosti anglijskogo semanticheskogo metajazyka (na materiale glagol'noj leksiki definicij slovarja „Macmillan English Dictionary“) [Structural features of the English semantic metalanguage (based on the verbal vocabulary of the definitions in the dictionary "Macmillan English Dictionary")] : dis. ... PhD in Philology: 10.02.04: defense of the thesis 14.10.11 / Nikiforova Natalia Aleksandrovna .- Smolensk, 2011. - 157 p. [in Russian]
  11. Savochkina E. V. Mezhurovnevye sootnoshenija harakteristik dead#ektivnyh sushhestvitel'nyh sovremennogo anglijskogo jazyka [Inter-level relations of characteristics of deadjective nouns in modern English] : dis. ... PhD in Philology: 10.02.04: defense of the thesis 24.04.13 / Savochkina Elena Valeryevna. - Smolensk, 2013. - 195 p. [in Russian]
  12. Solodovnikova N. V. Formal'noe i semanticheskoe vzaimodejstvie prilagatel'nogo s dead#ektivnymi znamenatel'nymi chastjami rechi v sovremennom anglijskom jazyke [Formal and semantic interaction of an adjective with deadjective significant parts of speech in modern English] : dis. ... PhD in Philology : 10.02.04: defense of the thesis 11.05.07 / Solodovnikova Natalia Viktorovna. - Smolensk, 2007. - 145 p. [in Russian]
  13. Tuldava Yu. A. Ob izmerenii svjazi kachestvennyh priznakov v lingvistike: Soprjazhennost' al'ternativnyh priznakov [On measuring the relationship of qualitative features in linguistics: Conjugacy of alternative signs] / Yu. A. Tuldava // Kvantitativnaja lingvistika i avtomaticheskij analiz tekstov: Uchenye zapiski Tartusskogo universiteta [Quantitative linguistics and Automatic Text Analysis: Scientific Notes of the University of Tartus]. - Tartu, 1988. - Issue 827. - P. 146-162. [in Russian]