РАЗРАБОТКА МЕТОДА ПРОГНОЗА ВСКРЫТИЯ РЕК НА ОСНОВЕ ПРЕЦЕДЕНТОВ
DOI: https://doi.org/10.23670/IRJ.2018.74.8.015
РАЗРАБОТКА МЕТОДА ПРОГНОЗА ВСКРЫТИЯ РЕК НА ОСНОВЕ ПРЕЦЕДЕНТОВ
Научная статья
Шаночкин С.В.1, Гайдукова Е.В.2, *
1 ORCID: 0000-0003-4939-7080;
2 ORCID: 0000-0002-3547-5538,
1, 2 Российский государственный гидрометеорологический университет (РГГМУ), Санкт-Петербург, Россия
* Корреспондирующий автор (oderiut[at]mail.ru)
Аннотация
В статье рассматривается метод прогноза сроков вскрытия на основе прецедентов (аналогов) на примере водосбора р. Печора. Метод основан на возможности использования метрики сходства гидрометеорологических полей, базирующейся на результатах компонентного анализа. Получено, что для прогнозирования вскрытия информативными являются такие признаки как максимальные снегозапасы, уровни воды на начало половодья, даты начала и сумма температур воздуха за первые 5 суток половодья. В результате инверсной верификации метода прогноза вскрытия р. Печоры на основе прецедентов оправдываемость составила порядка 80 %.
Ключевые слова: гидрология, ледостав, вскрытие рек, прогнозирование, метод.
DEVELOPMENT OF THE METHOD OF PREDICTION OF THE OPENING OF RIVERS from ice BASED ON PRECEDENTS
Research article
Shanochkin S.V.1, Gaidukova E.V.2, *
1 ORCID: 0000-0003-4939-7080;
2 ORCID: 0000-0002-3547-5538,
1, 2 Russian State Hydrometeorological University (RSHU), Saint-Petersburg, Russia
* Corresponding author (oderiut[at]mail.ru)
Abstract
The method of forecasting the timing of the opening of river from ice on the basis of precedents (analogs) considers in the article using the example of the watershed of the river Pechora. The method is based on the possibility of using the similarity metric of hydrometeorological fields, based on the results of component analysis. It is received that maximum snow reserves, water levels at the beginning of high water, the dates of the beginning of high water, the sum of air temperatures for the first 5 days of high water are informative for prediction of opening of river from ice. As a result of the inverse verification of the prediction method of the opening of river Pechora from ice the accuracy was about 80%.
Keywords: hydrology, freezing, river opening, forecasting, method.
Введение
В синоптических методах долгосрочных прогнозов погоды давно и достаточно успешно используются принципы аналогии (см., например [1]). В гидрологических прогнозах на основании прецедентов, как правило, делаются лишь качественные оценки, допускающие значительный субъективизм [2]. В статье будет предложен метод позволяющий избежать субъективного принятия решения, т. е. опирающийся на математический аппарат.
Количественные результаты могут быть получены при использовании обычно применяемой конструкции – уравнения регрессии. Однако надо заметить, что известным недостатком регрессионной модели является плохая ее «работа» при предсказании экстремальных значений прогнозируемой характеристики. В этом плане формулировка результата на основе прецедентов, выглядит предпочтительнее. Большинство прогностических схем, даже если в их основу положены логико-математические модели, предполагают, хотя бы на финальной стадии, участие эксперта (см., например, [3], [4], [5]). В частности, это имеет место в процедуре адаптации принятого решения. Последнее является задачей плохо формализованной и сильно зависящей от предметной области.
В нашем случае предметная область – это фоновые знания о причинно-следственных связях характеризующих процесс вскрытия реки.
Основы разрабатываемой методики
Существуют разные способы получения информации о предметной области, к ним можно отнести и конструирование признакового пространства, описывающего состав прецедентов и методику поиска ассоциаций [6], [7]. Крайне полезным является введение в базу прецедентов отношений эквивалентности, выражающих принадлежность их к определенным классам. В принципе классы могут выражаться в шкале наименований без числовых атрибутов (1, 2). В данном исследовании предварительная кластеризация не выполнялась, и выявление «претендентов» на роль аналогов осуществлялось из общей базы данных. Прогностическая рекомендация на основе прецедентов – это метод принятия решений, в котором используются архивные знания о предыдущих гидрометеорологических ситуациях (прецедентах).
При рассмотрении текущего случая отыскивается похожий прецедент в качестве аналога.
В основе всех подходов к отбору прецедентов лежит тот или иной способ измерения степени близости архивной гидрометеорологической ситуации (прецедента) и текущей. При таких измерениях вычисляется количественное значение некоторой меры, определяющей состав прецедентов, которые нужно привлечь для достижения прогноза. На качественное решение прогностической задачи существенно влияет как определенный произвол при выборе меры близости, так и конструкция самих прецедентов с назначенными весами их атрибутов. Кроме того, прогнозирование на основе прецедентов корректно только тогда, когда аналоги в базе действительно существуют. Если аналог не обнаружен, то новая ситуация должна пополнить существующую базу прецедентов.
На рис. 1 представлена функциональная схема алгоритма метода прогноза.
Рис. 1 – Функциональная схема алгоритма метода прогноза
При формировании базы данных преследовались три цели: разведочная, дескриптивная (описательная) и казуальная.
Последняя – была направлена на выявление причинно-следственных связей и обоснования гипотезы о том, что складывающаяся к началу половодья гидрометеорологическая ситуация, в значительной мере определяет условия вскрытия р. Печоры у п. Усть-Цильма (площадь водосбора F = 24800 км2).
Методика прогноза и результаты апробации
Было отобрано 9 гидрологических постов на реке р. Печоры [8]. Гидрометеорологическая ситуация по каждому из них характеризуется рядом признаков, главными из которых являются:
- максимальные снегозапасы;
- дата начала половодья;
- дата перехода температуры воздуха через 0° С;
- максимальная толщина льда;
- толщина льда (последняя измеренная);
- изменения уровня воды за первые 5 суток половодья;
- уровень воды на начало половодья;
- суммы температур воздуха за 5 суток от начала половодья.
Всего была собрана и проанализирована информация за 56-летний период (с 1955 по 2010 гг.)
Для проверки релевантности информации, включенной в описание прецедентов и их структуры, использовалась вся база исходных данных.
Очевидно, что не все 8 признаков оказались одинаково информативными. Их список в основном формировался на базе эвристических соображений, и некоторые из них оказались лишними.
В итоговом протоколе оказалось 4 признака:
- максимальные снегозапасы (Smах);
- уровни воды на начало половодья (Нн.п. );
- даты начала половодья (Dн.п.);
- сумма температур воздуха за первые 5 суток половодья.
Для статистического изучения сходства полей (гидрометеорологических ситуаций) можно использовать целый ряд критериев. Условно их можно разделить на две группы. К первой относятся способы, в которых сравнение полей производится посредством параметров, характеризующих качественную сторону явления или геометрические особенности поля. Ко второй группе – способы, когда поля или элементы их разложения сопоставляются по знаку и величине. Каждый из способов применяется там, где он дает наилучший эффект. В последние годы отмечается тенденция использования многопараметрических показателей. В данном исследовании использован критерий, основанный на результатах ортогональных подобий гидрометеорологических полей [9]. Разложение полей по собственным векторам обладает быстрой сходимостью и позволяет выделить главную информацию о сравниваемых состояниях и процессах.
В результате большая часть изменчивости исследуемых полей оказывается сосредоточенной в первых коэффициентах разложения, которые часто называют главными компонентами. С ростом номера компонента убывает и их вклад в описание суммарной дисперсии.
Метод главных компонент (см., например, [10]) применялся для обработки всего объема исходных данных. Анализ показал, что уже первые три коэффициента разложения (h) содержат значительную часть дисперсии (D) многомерных переменных. В среднем первые три главных компонента описывают 70–95 % суммарной дисперсии (см., рис. 2, 3). Далее уже рассматривались не сами поля, а параметры их аналитического представления.
Рис. 2 – Гистограмма распределения общей дисперсии разложения полей дат начала половодья
Рис. 3 – Гистограмма распределения обшей дисперсии разложения полей уровней воды на момент начала половодья
За критерий аналогичности был принят показатель, вычисляемый по формуле:
где Tt – временной коэффициент разложения соответствующего гидрометеорологического поля по собственным функциям (для двух сравниваемых полей t1 и t2); h – число членов разложения (в нашем случае h = 3); σh – среднее квадратичное отклонение Тh.
Такие критерии аналогичности рассчитывались по каждому признаку. Было бы неправомерно делать окончательные выводы о сходстве, ограничиваясь рассмотрением одного из признаков в отдельности. Представляется, что целесообразно ввести метрику на пространстве всех признаков, и, в этом пространстве определить точку, соответствующую текущей гидрометеорологической ситуации, и в рамках этой метрики находить ближайшую к ней точку из точек, представляющих прецеденты.
Каждому признаку был назначен вес, учитывающий его относительную прогностическую ценность. Полностью степень близости прецедента по всем признакам вычислялась по предложенной обобщенной формуле:
где Wj – вес j-го признака; z0 – функция подобия (метрика); хij и xij – значения признака xj для текущего случая и прецедента соответственно.
После вычисления степеней близости все прецеденты ранжировались. Если не удавалось обнаружить прецедент, свойства которого точно совпадают с текущей гидрометеорологической ситуацией, то окончательная прогностическая рекомендация вырабатывалась на основе синтеза информации, с учетом рейтинга прецедентов.
В результате инверсной верификации метода прогноза вскрытия р. Печоры на основе прецедентов оправдываемость составила порядка 80 %.
Выводы
В результате проведенного исследования разработан метод прогноза сроков вскрытия равнинной реки на основе прецедентов (аналогов), который основан на использовании метрики сходства гидрометеорологических полей, базирующейся на результатах компонентного анализа. Для прогнозирования вскрытия информативными являются такие признаки как максимальные снегозапасы, даты начала и уровни воды на начало половодья, сумма температур воздуха за первые 5 суток половодья. Последний вывод требует дальнейшего подтверждения путем апробации метода на различных, по генезису процесса вскрытия, водных объектах.
В заключении надо сказать, что данная прогностическая схема может быть усовершенствована за счет предварительной кластеризации базы прецедентов. Что касается адаптации решения, то необходимы способы, позволяющие сделать эту проблему более формализуемой.
Конфликт интересов Не указан. | Conflict of Interest None declared. |
Список литературы / References
- Угрюмов А. И. Долгосрочные метеорологические прогнозы. Учебное пособие / А. И. Угрюмов. – СПб.: изд-во РГГМУ, 2006. – 83 с.
- Георгиевский Ю. М. Гидрологические прогнозы. Учебник / Ю. М. Георгиевский, С. В. Шаночкин. – СПб.: изд. РГГМУ, 2007. – 436 с.
- Руководство по гидрологической практике. Том I. Гидрология: от измерений до гидрологической информации. Шестое издание. – Всемирная Метеорологическая Организация, 2011. – 314 с.
- Руководство по гидрологической практике. Том II. Управление водными ресурсами и практика применения гидрологических методов. Шестое издание. – Всемирная Метеорологическая Организация, 2012. – 324 с.
- Коваленко В. В. Прогнозирование изменений фрактальной размерности многолетнего речного стока / В.В. Коваленко, Е. В. Гайдукова, К. Б. Г. Арман // География и природные ресурсы, № 4, 2008. – С. 136–143.
- Лбов Г. С. Методы обработки разнотипных экспериментальных данных / Г. С. Лбов. – Новосибирск: Наука, 1981. – 160 с.
- Загоруйко Н. Г. Прикладные методы анализа данных и знаний / Н. Г. Загоруйко. – Новосибирск: изд-во Института математики, 1999. – 270 с.
- Многолетние данные о режиме и ресурсах поверхностных вод суши. Том 1. РСФСР. Выпуск 09. Бассейн Печоры. – Л.: Гидрометеоиздат, 1985. – 149 с.
- Гандин Л. С. Объективный анализ гидрометеорологических полей / Л. С. Гандин. – Л.: Гидрометеоиздат, 1983. – 288 с.
- Иберла К. Факторный анализ. Пер. с нем. В. М. Ивановой. / К. Иберла. – М.: Статистика, 1980. – 398 с.
Список литературы на английском языке / References in English
- Ugryumov A. I. Dolgosrochnyye meteorologicheskiye prognozy. [Long-term meteorological forecasts] Textbook / A. I. Ugryumov. – St. Petersburg: ed. RSHU, 2006. – 83 p. [in Russian]
- Georgievsky Yu. M. Gidrologicheskiye prognozy. [Hydrological forecasts] Textbook / Yu. M. Georgievsky, S. V. Shanochkin. – St. Petersburg: ed. RSHU, 2007. – 436 p. [in Russian]
- Rukovodstvo po gidrologicheskoy praktike. Tom I. Gidrologiya: ot izmereniy do gidrologicheskoy informatsii. [Guide to hydrological practice. Hydrology: from measurements to hydrological information.] Sixth edition. – Vsemirnaya Meteorologicheskaya Organizatsiya [World Meteorological Organization], 2011. – 314 p.
- Rukovodstvo po gidrologicheskoy praktike. Tom II. Upravleniye vodnymi resursami i praktika primeneniya gidrologicheskikh metodov. [Guide to hydrological practice. Water management and application of hydrological methods.] Sixth edition. – Vsemirnaya Meteorologicheskaya Organizatsiya [World Meteorological Organization], 2012. – 324 p.
- Kovalenko V. V. Prognozirovaniye izmeneniy fraktal'noy razmernosti mnogoletnego rechnogo stoka. [Forecasting changes in the fractal dimension of a multi-year river runoff.] / V. V. Kovalenko, E. V. Gaidukova, K. B. G. Arman // Geografiya i prirodnyye resursy [Geography and Natural Resources], № 4, 2008. – P. 136–143. [in Russian]
- Lbov G. S. Metody obrabotki raznotipnykh eksperimental'nykh dannykh [Methods of processing diverse types of experimental data.] / G. S. Lbov. – Novosibirsk: Science, 1981. – 160 p. [in Russian]
- Zagoruyko N. G. Prikladnyye metody analiza dannykh i znaniy. [Applied methods of data and knowledge analysis.] / N. G. Zagoruyko. – Novosibirsk: izd-vo institutov matematiki, 1999. – 270 p. [in Russian]
- Mnogoletniye dannyye o rezhime i resursakh poverkhnostnykh vod sushi. Tom 1. RSFSR. Issue 09. The Pechora Basin. [Long-term data on the regime and resources of surface waters of the land.] – L.: Gidrometeoizdat, 1985. – 149 p. [in Russian]
- Gandin L. S. Ob"yektivnyy analiz gidrometeorologicheskikh poley. [Objective analysis of hydrometeorological fields.] / L. S. Gandin. – L.: Gidrometeoizdat, 1983. – 288 p. [in Russian]
- Iberla K. Factor analysis. / K. Iberla. – M.: Statistics, 1980. – 398 p.