THE PROBLEM OF TRANSMITTED TEXT MESSAGES SEMANTIC POTENTIAL

Research article
DOI:
https://doi.org/10.18454/IRJ.2016.50.003
Issue: № 8 (50), 2016
Published:
2016/08/18
PDF

Самойлова С.П.

Кандидат филологических наук, доцент-исследователь, Российский университет дружбы народов

К ПРОБЛЕМЕ СМЫСЛОВОГО ПОТЕНЦИАЛА ПЕРЕДАВАЕМЫХ СООБЩЕНИЙ ТЕКСТА

Аннотация

Статья посвящена исследованию равновесных двуязычных текстов и определению смыслового потенциала передаваемых сообщений. Смысловой потенциал передаваемых сообщений возникает в процессе взаимодействия индивидов и моделируется на примере переводов текстов, эквивалентных по содержанию. Эквивалентные тексты исследуются как единицы общения, как источник порождаемой и интерпретируемой смысловой информации. Излагаются принципы и методика информативно-целевого анализа двуязычных текстов. Инструментом исследования явился разработанный «метаалфавит», состоящий из бесконечного набора символов.

Ключевые слова: взаимодействие, информационный аспект, энтропия, метаязык, текст.

Samoilova S.P.

PhD, Associate professor researcher, Peoples' Friendship University of Russia

THE PROBLEM OF TRANSMITTED TEXT MESSAGES SEMANTIC POTENTIAL

Abstract

The paper investigates the equilibrium bilingual texts and the definition of the semantic potential of the transmitted messages. Semantic potential of transmitted messages occurs by reacting the interaction between individuals, and modelling by the example of translations of texts that are equivalent to the content. Equivalent texts are studied as a communication unit, as the source of generated and interpretable semantic information. The principles and methods of informative-target analysis of bilingual texts are presented in this paper. The instrument of the study is developed "meta-alphabet", which consists of an infinite set of symbols.

Keywords: interaction, information aspect, the entropy, meta-language, text.

Введение.

Человеческую природу взаимодействия можно исследовать множеством способов. В нашей работе представлена описательная модель взаимодействия индивидов в психолингвистическом и информационном аспектах. Метод описания, также, как и средства анализа исследуемого объекта, могут подбираться двояко – либо это метод и/ или средства теории, задающей цель описания (в нашем случае это анализ взаимодействия индивидов в рамках теории информации и теории деятельности), либо это привнесенные методы и/или средства, разработанные в других аналитических системах. В последнем случае названные средства выступают в качестве метаязыка описания, или той моделирующей систем, в рамках и на уровне которой будут осмысливаться единицы анализа объекта, подлежащего изучению. Предлагаемый подход связан с пониманием взаимоотношения между языком, мышлением и культурой. Существуют различные мнения, одно из которых представлено тем, что все языки похожи, и поэтому не придают значения их многообразию. Другое, тем, что между языками существуют принципиальные различия, и поэтому их носители не способны по-настоящему понять друг друга.

Методология исследования.

В статье описаны прикладные возможности объединения результатов нескольких дисциплин, таких как социальная семиотика, психолингвистика и информатика. Предлагаемая нами модель описания базируется на параметрических данных, которые подлежат сопоставлению и является обоснованием применимости методов математической статистики к информационно -  трансформационной деятельности индивида, направленной на восприятие языковой информации. Впервые было показано, что человеческие языки имеют сходство, основанное не на общей культуре и истории, а на общих особенностях человеческого познания и коммуникации [1].  Основу описательной модели составляют положения о том, что языки различаются по типовым признакам и введение параметрических данных дает возможность сгруппировать некоторые различия в сравнительно устойчивые парадигмы, которые не возникают случайно под влиянием конкретной истории или культуры [1]. В статье представлены закономерности взаимодействия живых систем (индивидов), базирующиеся на минимальной энтропии, необходимой для трансформации информации в процессе коммуникации. Организация живых систем обусловлена генетически, заложенные генетические детерминанты едины для всех живых систем. Принцип организации живых систем аналогичен принципу кодирования ДНК [4]. Психолингвистический аспект взаимодействия живых систем (индивидов) рассматривается на уровне интеллектуальных структур между:

– отправителем, создателем и инициатором целевого сообщения и

– получателем, декодирующим сообщение в соответствии с целью отправителя.

Взаимодействие индивидов будет считаться состоявшимся при выполнении основных принципов взаимодействия и составляющих аспектов понятия информации.  Эта задача решается путем моделирования соединения действий индивида, связанных с осмыслением и переработкой информации при использовании результата осмысления и переработки информации индивидом- переводчиком в процессе перевода с языка на язык.

Текстуальные отношения – это прежде всего иерархические семантико –смысловые отношения, поэтому в качестве критерия, определяющего место того или иного элемента в системе отношений, должен быть критерий осмысленности воспринимаемого сообщения [5].

В статье описан процесс взаимодействия живых систем, который был искусственно сгенерирован на примере переводов текстов, эквивалентных по содержанию. Принцип организации текстов, их кодирование детерминировано и присуще всем языкам [6]. Непосредственно составляющие текста – лексические единицы, являются носителями смысла по Г. Фреге [7]. В текст заложена цель создателя (автора), обусловленная смыслом. Процесс перевода, в нашем случае, представляет собой взаимодействие живых систем – отношения между отправителем и получателем и направлен на достижение цели: получение смысла. Инструментом исследования явился разработанный «метаалфавит», состоящий из бесконечного набора символов, включающий всевозможные алфавиты в качестве подмножества и введенная «контемпорарная» энтропия. В результате исследования были получены количественные данные, на основании которых делается предположение, что уменьшение энтропии является необходимым условием для осуществления процесса взаимодействия живых систем.

Психолингвистический аспект взаимодействия индивидов базируется на трех основных принципах, а именно:

  1. Принцип пяти уровней: Цель взаимодействия живых систем - достижение плоскости семантики при передаче информации от отправителя к получателю, т.е. точное определение сферы, для которой понятие информации будет иметь силу. Для полной характеристики понятия информации рассматриваются и объединяются пять аспектов: статистика-синтаксис-семантика-прагматика-апобетика, [8] являющиеся основным условием взаимодействия живых систем (в дальнейшем, как для отправителя, так и для получателя).
  2. Принцип кодирования: Информация представляется (формулируется, посылается, накапливается) посредством соответствующего кодирования. Из отдельных знаков условной системы, например, алфавита, составляются слова – код. Из этих слов, за которыми, по договоренности, закреплен смысл, согласно установленным правилам грамматики, составляются предложения (синтаксис), являющиеся носителями семантической информации.
  3. Принцип заместительной функции: Характерным свойством информации в смысле нашего определения является функция замещения. Информация сама по себе не является предметом или событием, для этого имеются закодированные знаки, выполняющие замещение [8].

В статье кратко интерпретируются вышеназванные аспекты, описываемые при помощи разработанной модели и рассматривается процесс создания сообщения – текста. В психолингвистическом смысле формированию текста предшествует внутренняя речь, являющаяся важным и универсальным механизмом умственной деятельности и сознания индивида. Внутренняя речь – начальный момент порождения речевого высказывания, его «внутреннее программирование», с помощью которой происходит логическая переработка сенсорных данных, их осознание и понимание в определенной системе понятий [3]. Восприятие живой системы базируется на способности психики к определенным видам деятельности, актуализируемой в ситуациях, вплетенных в определенный контекст лингвистической и нелингвистической практики [2].

Материалом исследования послужили переводы текстов на русском и немецком языках, являющихся эквивалентными по своему содержанию. (Процесс перевода текстов с одного языка приближен к процессу взаимодействия живых систем, что в некотором смысле облегчило исследование). Структура языка анализируется на основе вычисления относительных частот появления знаков на примере коротких и длинных фрагментов переводов текстов русского и немецкого языков. На основании информации, заложенной в исследуемых текстах, вычисляется энтропия сообщений. Энтропия – это числовое выражение упорядоченности структуры. При этом крайне удобно, что результатом расчета является одно числовое значение, которое больше нуля. Таким образом мы производили элементарные логические операции (сравнения) над результатами. Кроме того, как следует из информатики, энтропия очень хорошо характеризует информационную нагрузку сообщения, т.е. чем плотнее поток информации, тем ближе он к «хаотическому», случайному набору битов. Таким образом, мы оценивали информационную нагрузку сообщения, находя его энтропию. Отметим далее, что в качестве единицы информации были использованы также отдельные буквы, буквосочетания и слоги. Такой анализ дал количественную оценку хорошо известных и повсеместно принятых методов, основанных на наблюдении ограниченности в выборе следующего слова во фразе, например, после слов «я читаю» может следовать только вполне определенное слово, например, «вывеску», «книгу», но никак не «воздух». Анализ энтропии с формальной точки зрения позволил характеризовать информационную нагрузку текста. Например, если мы составим текст из одного, постоянно повторяющегося слова, например, «мать», то его энтропия будет сильно отличаться от энтропии среднего текста, т.е. она будет близка к нулю, т.к. никакая информация таким текстом не передается. Кроме того, анализ энтропии букв, выявил глобальные изменения в статистике употребляемых букв, что имело большое значение для определения категории текста. Отсутствие буквы в тексте может влиять на его энтропию. Следующим критерием высокой информационной «нагруженности» явилось использование иностранных, заимствованных слов в тексте, как например, в текстах  различного функционального стиля – в медицинском тексте, где использование «специфических» слов и терминов нарушило естественный для языка звуковой процесс, который влияет на статистику использования букв, где более редкие буквы языка , например, «з» из-за подобного смешения начинают употребляться чаще, что приближает их вероятностную картину  к «хаотической», а, следовательно, увеличивают энтропию. Далее, мы проводили анализ информационно-трансформационных процессов, а именно рассматривали поверхностную и глубинную структуры. Поверхностная структура- это специфический для данного языка (немецкого и русского языков) вероятностный паттерн в употреблении букв. Действительно, языки тяготеют к использованию устоявшихся буквосочетаний: для русского языка это приставки, суффиксы и окончания, для немецкого – это артикли, предлоги и суффиксы. В связи с этим, нами был установлен «специфический» для данного языка паттерн, который мы рассматривали при анализе псевдослучайных последовательностей слов. При рассмотрении глубинной структуры, т.е. при изменении ее вероятностного паттерна при использовании более обширного словаря, в нашем случае, научный стиль медицины, или наоборот, ограниченного, разговорного словаря, было установлено, что глубинная структура намного «тоньше» поверхностной и незначительно влияет на вероятностную картину употребления букв. Анализ и сравнение переводов немецкого и русского языков проводился на основе избыточности кодирования сообщений, т.е. разностью между максимальной энтропией и энтропией сообщения для конкретного языка, где было установлено, что немецкий и русский языки значительно отличаются друг от друга по параметрам относительной энтропии, однако, энтропии для текстов различной сложности слабо зависели от сложности текстов. Энтропия немецкого оригинального текста составила: -243,64, а его перевод на русский язык: -221,85, в коротких сообщениях: -249,20, русский язык: - 220,84, перевод реакций с немецкого языка: -249,60, перевод реакций с русского языка: -217, 85. В разных языках отличие по энтропиям составило 1,1 раза. Таким образом, для немецкого языка была обнаружена слабая зависимость энтропии от сложности текста, которая исчезала в русских эквивалентах. Это зависело, как и предполагалось, от более высокой избыточности кодирования немецкого языка по сравнению с русским языком. Анализируя эти результаты, делается предположение, что существует глубинная количественная характеристика культурных текстов, показывающая их информационную «нагруженность». Так как из текстов была убрана вся понятийная информация (предложения, слова), вычисляемая информация явилась скрытой и непосредственно не воспринимаемой. Было установлено, что эта информация устойчиво повторяется по всему разнообразию культурных текстов, в основе которого при осмыслении информации заложено перераспределение энтропии, происходящее на разных уровнях восприятия. «Понимание» отдельного элемента информации соответствует также уменьшению энтропии для сообщения, содержащего эту информацию, запоминание также соответствует уменьшению энтропии, но уже на межэлементном уровне мозг пытается выявить логические связи между новой и запомненной информацией. На следующем уровне взаимодействия трансформационная обработка информации тоже направлена на уменьшение энтропии. Действительно, информация обрабатывается путем трансформации сложных языковых конструкций в атомарные. Существует несколько видов сложных конструкций, тогда, как атомарные, имеют вполне определенный и устойчивый вид. Таким образом, из нескольких допустимых конструкций, каждая из которых встречается в языке с некой отличной от нуля вероятностью, создается унифицированная конструкция, т.е. на конструктивном уровне энтропия уменьшается до нуля [6].

Вывод.

Приведенные данные показывают общую тенденцию в сравниваемых переводах, т.е. разностью между энтропиями множества знаков, представленных на длинных отрезках текстов и одним знаком можно передать смысл всего предложения. Использованный метод анализа через энтропию с формальной точки зрения позволил характеризовать информационную нагрузку текста. Анализ энтропии формально соотнесенных знаков в двух языках выявил изменения в статистике употребляемых знаков, что имело большое значение для определения категории текстов. Вопрос об определении качества потерь при передаче смысла и возможности их минимизации остается открытым.

Моделируя текст как образ коммуникативно-познавательной деятельности и избирая в качестве заменяемой единицы знак, мы рассматривали в качестве единицы информации «вес» знака в семантико-смысловой структуре текста.

Заключение.

Взаимодействие живых систем на уровне языка, в частности, на уровне знаков, отражает в мире смысловых мегабайтов процесс самоусложнения организма и обретения новых качеств. Несомненно, все формы живой природы в процессе взаимодействия друг с другом стремятся не только к уменьшению хаоса своих информационных систем, но и к уменьшению хаоса окружающей среды, индикатором которого является энтропия. Проведенное исследование и сформулированная на основе полученных статистических данных интерпретация подтвердили гипотезу о самоорганизующемся характере языка как системы. На основании сравнения системных параметров и избыточности немецкого и русского языков, сделано предположении об «истинности» передачи смысловой информации с одного языка на другой словами или понятиями через распределение энтропии, которое происходит на разных уровнях мышления и сознания и связано с коммуникацией, усвоением и передачей информации в процессе взаимодействия индивидов.

Литература

  1. Бейкер М. Атомы языка: Грамматика в темном поле сознания. Пер. с англ./Под ред. О.В. Митрениной, О.А. Митрофановой.- М.: Издательство ЛКИ, - 272 с. С.37.
  2. Витгенштейн Л. Заметки о «Золотой ветви Фрэзера» //Историко-философский ежегодник. М., 1989 b, С.31.
  3. Выготский Л.С. Собр. соч.: В 6 т. М.: Педагогика, 1982-1984. С.54.
  4. Гаряев П.П. Волновой генетический код. М., 1997.- 108с.: ил. С.12.
  5. Дридзе Т.М. Язык и социальная психология: Учебное пособие / Под ред. и с предисл. А.А. Леонтьева. Вступ. ст. Е.М. Акимкина. Изд. 2-е, доп. – М.: Книжный дом «ЛИБРОКОМ», 2009. – С.57.
  6. Самойлова С.П. Принципы взаимодействия между автором и интерпретатором. Вестник Тверского Государственного Университета. Серия «Филология». Выпуск 11, 2007. С. 215-218.
  7. Фреге Г. «Логика и логическая семантика: Сборник трудов/Пер. с нем. Б.В.Бирюкова под ред. З.А.Кузичевой: Учебное пособие для студентов вузов» — М.: Аспект Пресс, 2000. — 512 с.
  8. Gitt W. Ordnung und Information in der Technik und Natur. In: Am Anfang war die Information. Gräfeling (Resch KG) 1982, S. 171-211

References

  1. Bejker M. Atomy jazyka: Grammatika v temnom pole soznanija. s angl./Pod red. O.V. Mitreninoj, O.A. Mitrofanovoj.- M.: Izdatel'stvo LKI, - 272 s. S.37.
  2. Vitgenshtejn L. Zametki o «Zolotoj vetvi Frjezera» //Istoriko-filosofskij ezhegodnik. M., 1989 b, S.31.
  3. Vygotskij L.S. Sobr. soch.: V 6 t. M.: Pedagogika, 1982-1984. S.54.
  4. Garjaev P.P. Volnovoj geneticheskij kod. M., 1997.- 108s.: il. S.12.
  5. Dridze T.M. Jazyk i social'naja psihologija: Uchebnoe posobie / Pod red. i s predisl. A.A. Leont'eva. Vstup. st. E.M. Akimkina. Izd. 2-e, dop. – M.: Knizhnyj dom «LIBROKOM», 2009. – S.57.
  6. Samojlova S.P. Principy vzaimodejstvija mezhdu avtorom i interpretatorom. Vestnik Tverskogo Gosudarstvennogo Universiteta. Serija «Filologija». Vypusk 11, 2007. S. 215-218.
  7. Frege G. «Logika i logicheskaja semantika: Sbornik trudov/Per. s nem. B.V.Birjukova pod red. Z.A.Kuzichevoj: Uchebnoe posobie dlja studentov vuzov» — M.: Aspekt Press, 2000. — 512 s.
  8. Gitt W. Ordnung und Information in der Technik und Natur. In: Am Anfang war die Information. Gräfeling (Resch KG) 1982, S. 171-211