SEARCH CAUSAL RELATIONS USING TIME SERIES

Research article
DOI:
https://doi.org/10.18454/IRJ.2016.48.187
Issue: № 6 (48), 2016
Published:
2016/06/17
PDF

Юсов А.Б.1, Касаткина А.А.2

1ORCID: 0000-0002-6699-0217, Кандидат экономических наук, 2Ведущий программист департамента компьютерной техники, Российская академия народного хозяйства и государственной службы при Президенте РФ

ПОИСК ПРИЧИННО-СЛЕДСТВЕННЫХ ОТНОШЕНИЙ С ПОМОЩЬЮ ВРЕМЕННЫХ РЯДОВ

Аннотация

Для построения моделей социально-экономических процессов необходимо определить причинно-следственные отношения между факторами. Обычно это определяется с помощью экспертной оценки. Но экспертная оценка является чисто субъективным мнением. Альтернативой экспертной оценки может быть корреляционный анализ. При определении связи между показателями используется коэффициент парной корреляции. Но этот коэффициент дает информацию о наличии связи, однако он не дает судить, что на что влияет. Алгоритм, который выясняет какой показатель является причиной, а какой – следствием, и описывается в данной работе.

Ключевые слова: временные ряды, социально-экономические модели, статистика, эконометрика, причинно-следственные отношения.

Yusov A.B.1, Kasatkina A.A.2.

1ORCID: 0000-0002-6699-0217, Associate professor, 2Leading programmer of the department of computer technology, Russian Academy of national economy and state service under the President of the Russian Federation

SEARCH CAUSAL RELATIONS USING TIME SERIES

Abstract

To build models of socio-economic processes necessary to determine the causal relationships between factors. This is usually determined by expert judgment. But peer review is a purely subjective opinion. The alternative to expert assessment can be correlation analysis. When you define a relationship between the figures is the correlation coefficient. But this ratio gives information about the connection, but he does not judge what it affects. The algorithm that figures out which indicator is the cause and which the consequence, and is described in this paper.

Keywords: time series of socio-economic models, statistics, econometrics, cause-effect relationships.

Построение модели социально-экономических процессов строится по следующему алгоритму. Сначала необходимо определить факторы, существенно влияющие на этот процесс. Эти факторы необходимо измерить каким-либо переменными, а затем определить причинно-следственные отношений между этими переменными. В научных и практических работах по построению моделей социально-экономических процессов такие отношения определяются только посредством экспертной оценки, которая является ни чем иным, как субъективное мнение эксперта. Например, в моделях на основе статистических закономерностей, называемых регрессионными моделями, разделение на переменные объясняющие, то есть причины, и на результирующую то есть следствие, строится на основе экспертных оценок.

Недостатками экспертных оценок является их субъективизм. А также надёжность и точность. Чтобы повысить надёжность экспертных оценок необходимо привлекать побольше специалистов, но при этом может быть потеряна точность, так как разные эксперты могут дать разные причинно-следственные связи.

Авторы предлагают в качестве альтернативы экспертной оценке корреляционный анализ. При корреляционном анализе вычисляется коэффициент парной корреляции. Значение этого  коэффициента показывает насколько близки графики изменения двух рядов. При близости этого коэффициента к 1 графики рядов очень похожи. При близости этого коэффициента к -1 графики двух рядов зеркально отражаются. Если этот коэффициент близок 0, графики двух рядов полностью не совпадают. Примеры, подтверждающие данные высказывания приведены на рисунках 1-3.

09-06-2016 16-06-08

Рис.1 - Графики показателей «Общая площадь жилых помещений» и «Объем средств, затраченных на предоставление гражданам социальной поддержки»

 

Коэффициент парной корреляции между приведенными на рисунке 1 показателями равен 0,94.  Из этого рисунка  видно, что траектории этих показателей, как бы повторяют друг друга.

09-06-2016 16-07-02

Рис.2 - Графики показателей «Объем средств, затраченных на предоставление гражданам социальной поддержки, млрд. руб.» и «Индексы потребительские цен на товары и услуги»

 

Коэффициент парной корреляции между приведенными на рисунке 2 показателями равен 0,75.  Из этого рисунка видно, что траектории этих показателей, как бы зеркально расходятся.

09-06-2016 16-10-18

Рис.3 - Графики показателей «Цены в гос. ВУЗах (за семестр)» и «Зарегистрировано преступлений»

 

Коэффициент парной корреляции между приведенными на рисунке 3 показателями равен 0,22.  Из этого рисунка  видно, что  у траекторий этих показателей нет ни какой схожести.

В реальных процессах причина всегда наступает раньше, чем следствие. А свойство схожести графиков временных рядов при близких к 1 по модулю коэффициентов парной корреляции говорит о том, что изменения этих двух временных рядов тесно связаны друг с другом. Следовательно, если мы определим временные отрезки, на которых у временных рядов либо повторяются графики изменений, либо зеркально отражаются, то тот временной ряд, который меняется раньше должен быть причиной, а второй ряд должен быть следствием.

Таким образом, можно разработать алгоритм нахождения непосредственных причинно-следственных связей между переменными используя корреляционный анализ.

  1. По отношению друг к другу последовательно сдвигая значения двух временных рядов, вычисляем коэффициенты парных корреляций.
  2. Далее находим в каждой паре максимальный по модулю коэффициент.
  3. В паре с максимальным коэффициентом парной корреляции по абсолютной величине тот временной ряд, у которого значения соответствуют более раннему периоду изменений, и будет причиной, а второй следствием. То есть, первый показатель непосредственно влияет на второй, но не наоборот.

Рассмотрим использование данного алгоритма для нахождения факторов, непосредственно влияющих на продолжительность жизни.

От чего может зависеть долголетие населения. По мнению авторов, достаточное долголетие населения свидетельствует о развитой и благоприятной среде жизнедеятельности, на которую влияет и развитие социально-трудовой сферы (более подробно см. [1]), и социальная ответственность бизнеса (более подробно см. [2]), и государственная социальная политика (более подробно см [3]). В среду жизнедеятельности входят: успешное развития экономики, высокое развитии здравоохранения, высокий уровне жизни населения, благоприятное состоянии экологии, низкий уровень криминогенной составляющей жизни общества.

Каждый из этих аспектов жизнедеятельности может быть измерим какими-то показателями. Для использования коэффициентов парной корреляции необходимо измерить данные аспекты жизнедеятельности временными рядами.

Измерим экономическую составляющую временными рядами: «Валовой внутренний продукт в текущих ценах» и «Уровень занятости».

Измерим уровень жизни временными рядами: «Средний размер назначенных пенсий», «Общая площадь жилых помещений, приходящаяся в среднем на одного жителя» и «Среднедушевые доходы».

Измерим экологическую составляющую временным рядом «Текущие затраты на охрану окружающей среды».

Измерим уровень развития здравоохранения временными рядами «Заболеваемость на 1000 человек населения» и «Расходы бюджета на здравоохранение».

Измерим уровень криминогенности временным рядом «Зарегистрировано преступлений».

Вычислим коэффициенты парной корреляции каждой пары временных рядов «Продолжительность жизни» и остальных, сдвигая последовательно ряды по отношению друг к другу. При этом при всех смещениях число значений в рядах не будем уменьшать меньше 10. Полученные результаты приведены в таблице 1.

 

Таблица 1 - Максимальные значения по абсолютной величине коэффициентов парной корреляции между показателем «Продолжительность жизни» и остальными

Наименование показателя Временной интервал Продолжительности жизни Временной интервал второго показателя Максимальное значение коэффициента парной корреляции (по абсолютной величине)
Валовой внутренний продукт в рыночных ценах 2004-2013 2005-2014 0,96900794
Уровень занятости 2005-2014 2000-2009 0,93295608
Средний размер назначенных пенсий 2002-2011 2005-2014 0,98988327
Общая площадь жилых помещений, приходящаяся в среднем на одного жителя 2004-2013 2005-2014 0,98973676
Среднедушевые доходы 2004-2013 2005-2014 0,9898841
Текущие затраты на охрану окружающей среды 2005-2014 2001-2010 0,98253371
Заболеваемость на 1000 человек 2005-2014 2005-2014 0,9603275
Расходы бюджета на здравоохранение 2004-2013 2005-2014 0,98888635
Зарегистрировано преступлений 2003-2012 2005-2014 -0,972942
 

Что можно сказать, анализируя данную таблицу. На продолжительность жизни в РФ непосредственно влияет уровень занятости и текущие затраты на охрану окружающей среды.

Кроме этого, можно сказать, что продолжительность жизни является причиной для изменения таких показателей, как «валовой внутренний продукт», как «средний размер назначенных пенсий», как «общая площадь жилых помещений, приходящаяся в среднем на одного жителя», как «среднедушевые доходы», как «расходы бюджета на здравоохранение» и как «число зарегистрированных преступлений».

Значение коэффициента парной корреляции между показателями «Продолжительность жизни» и «Зарегистрировано преступлений» отрицательное. Это говорит об обратно-пропорциональном влиянии продолжительности на число зарегистрированных преступлений, то есть при увеличении продолжительности жизни число преступлений регистрируется меньше.

Все остальные коэффициенты парной корреляции положительны. Следовательно, во всех остальных случаях наблюдается прямо-пропорциональное влияние, то есть увеличение причины ведет к увеличению следствия.

В отношении пары показателей «Продолжительность жизни» и «Заболеваемость на 1000 человек населения» можно сделать вывод, что они испытывают непосредственное одинаковое влияние со стороны какого-то другого фактора, то есть они оба являются следствием одного и того же фактора, сами друг на друга не влияют.

В качестве резюме можно сделать следующий вывод. Многие выводы, основанные на корреляционном анализе, могут противоречить взглядам ряда экспертов. Поэтому авторы не призывают полностью отказаться от экспертной оценке. Однако корреляционный анализ может существенно повысить объективность экспертной оценки.

Литература

  1. Юсов А.Б. Социально-трудовая сфера: тенденции развития и методы мониторинга и прогнозирования. Монография. М. РАГС. 2010, 160 с.
  2. Сморчкова В., Сулимова Т., Ноева Л. Основные направления корпоративной социальной ответственности бизнеса в Северном регионе. //Социальная политика и социальное партнерство. 2014. №7. С. 13-29.
  3. Государственная и муниципальная социальная политика. Курс лекций: учебное пособие / коллектив авторов; под общ.ред. Н.А.Волгина. – М.: КНОРУС. 2011.-1016 с.

Referenses

  1. Yusov A. B. Socio-labor sphere: trends of development and methods of monitoring and forecasting. Monograph. M. rags. 2010, 160 p.
  2. Smorchkova V., Sulimova T., L. Noah's Main areas of corporate social responsibility of business in the Northern region. //Social policy and social partnership. 2014. No. 7. P. 13-29.
  3. State and municipal social policy. A course of lectures: textbook / group of authors; under the General editorship of N. A.Volgin. – M.: KNORUS. 2011.-1016 S.