АНАЛИЗ И ПРОГНОЗИРОВАНИЕ КЛИМАТИЧЕСКИХ ИЗМЕНЕНИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

Статья с данными
DOI:
https://doi.org/10.60797/IRJ.2025.157.15
Выпуск: № 7 (157), 2025
Предложена:
19.03.2025
Принята:
20.06.2025
Опубликована:
17.07.2025
858
18
XML
PDF

Аннотация

В статье исследуются методы машинного обучения для анализа и прогнозирования климатических изменений на основе данных метеорологического исследования Антарктиды. Это исследование открывает новые перспективы в области климатологии, использует более эффективные инструменты для анализа климатических изменений и разработки стратегий реагирования на их последствия. Исследование проводилось по данным метеорологических станций Антарктиды (Davis AMC, Купол Фудзи, Henry AMC и Nico) за период инструментальных наблюдений, находящимся в открытых источниках. Для краткосрочного предсказания температур использовались современные методы машинного обучения: нейросетевые модели и градиентный бустинг. Было проведено сравнение семи прогностических моделей (Linear Regression, Decision Tree, RandomForestRegressor, XGBRegressor, CatBoostRegressor, Lasso, Ridge), среднеквадратическая ошибка которых показала неудовлетворительные результаты в большинстве случаев при комплексной оценке моделей по известным данным за 2019–2023 годы. В связи с чем была разработана нейронная сеть SimpleRegressionNN. В ходе анализа нейронной сети среднеквадратичная ошибка по трём станциям из четырёх оказалась незначительной. Это позволило провести краткосрочное прогнозирование температурных показателей на период с 2005 по 2029 годы. Результаты исследования могут быть полезны для климатических исследований.

1. Введение

Эволюционное развитие цивилизации напрямую зависит от климатических изменений. Современная геологическая эпоха — межледниковье — по данным Международной комиссии по стратиграфии длится почти 12 тысяч лет, характеризуется малым перемещением континентов, средней температурой 14°С

, поднятием уровня мирового океана на 35 м из-за таяния ледников и в целом благоприятными климатическими условиями. Именно начало голоцена ознаменовало собой расцвет человеческой цивилизации, экспансии человеческого вида, численность которого превысила 8 млрд. человек в ноябре 2022 года
и формирование искусственной оболочки Земли: техносферы. И если потепление оказывает положительное влияние на процесс эволюции видов, биоразнообразие, становление цивилизации, то бурное развитие техносферы за последние 200 лет увеличило антропогенную нагрузку на биосферу. Загрязнение окружающей среды, нерациональное использование ресурсов, рост численности человеческой популяции может привести к долгосрочным непредсказуемым изменениям экосистем
. По данным последних отчётов Межправительственной группы экспертов по изменению климата (IPCC, 2023), темпы повышения глобальной температуры остаются стабильно высокими и требуют срочной адаптации и прогнозирования климатических изменений на региональном и глобальном уровнях. Это подчёркивает необходимость создания высокоточных моделей прогнозирования, особенно в уязвимых регионах, таких как Антарктида
.

Особое внимание общественности и учёных вызывает проблема увеличения выбросов парниковых газов, бесконтрольная эмиссия которых может оказать значительное влияние на теплооборот атмосферы. Среди вопросов, которые поднимаются на международном уровне, — вопрос глобального потепления климата планеты и влияния антропогенного фактора на этот процесс. Дальнейшее увеличение средней температуры может оказать неблагоприятное воздействие не только на биосферу, но и на техносферу, привести к непредсказуемым последствиям, поскольку численность человеческой популяции, по оценкам учёных, достигла критической отметки и находится в полной зависимости от доступности ресурсов. Изменение климата может оказывать как благоприятное, так и неблагоприятное воздействие: похолодание ведёт к уменьшению вегетационного периода и, как следствие, уменьшению массы первичной продукции биосферы; потепление, наоборот, создаёт благоприятные условия для растений, но таяние ледников может вызволить формы жизни, к которым у человечества и других живых организмов утерян иммунитет, что может привести к непредсказуемым последствиям

.

Климатология развивается особенно активно последние десятилетия, является одним из актуальных направлений, объём данных растёт экспоненциально: накапливаются массивы информации не только о современном состоянии климата, но и о его прошлом

. Сложность климатической системы, традиционные методы обработки данных, направленные больше на понимание закономерностей, а не на предсказания, показали свою ограниченность и требуют применения современных продвинутых методов и технологий работы с информацией, применения искусственного интеллекта
,
, который даёт возможность обрабатывать большие массивы данных и строить модели предсказания изменений климата.

Машинное обучение представляет собой фундаментальный раздел искусственного интеллекта, ориентированный на разработку и применение алгоритмов и моделей, способных обучаться на основе опыта и данных, избегая традиционного программирования. Этот визионерский подход предоставляет вычислительным системам способность динамической адаптации к переменным условиям, выявлению закономерностей в обширных объемах информации и автоматическому совершенствованию своей эффективности.

Машинное обучение позволяет создавать модели, способные обобщать данные и успешно предсказывать новые, ранее не встреченные примеры. Этот многозадачный процесс включает не только обучение на существующих данных, но и непрерывную адаптацию к поступающей информации, делая машинное обучение неотъемлемым инструментом для решения различных задач: от распознавания образов и классификации до прогнозирования трендов и оптимизации производственных процессов.

Цель исследования — на примере массивов данных четырёх метеорологических станций Антарктиды (Davis AMC, Купол Фудзи, Henry AMC и Nico) провести сравнение разных моделей машинного обучения, разработать полносвязную нейронную сеть для прогнозирования температурных показателей на 5 лет вперёд (2025–2029 г.г.).

Для достижения поставленной задачи были использованы базовые алгоритмы машинного обучения, такие как Decision Tree и Linear Regression, также применены более сложные методы, включая модели градиентного бустинга, такие как CatBoost, создана полносвязная нейронная сеть.

2. Материалы и методы исследования

Для решения задачи предсказания температурных изменений необходим массив данных, который будет удовлетворять трём основным условиям: достаточная длина, однородность и оперативное обновление

. Отбор и подготовка данных проводились из открытых источников. В работе использовались средние годовые температуры по данным метеорологических станций, расположенных в глубине материка и имеющих среднегодовую температуру ниже -50°, т.к. из-за стокового характера ветров на континенте практически исключается влияние атмосферных потоков, образующихся над мировым океаном
.

Для повышения достоверности моделей был проведён полный цикл предобработки данных. На этапе очистки выбросов применялся межквартильный размах (IQR), позволяющий исключить экстремальные значения. Далее осуществлялась нормализация температурных рядов методом Z-преобразования, что позволило устранить масштабные различия между станциями. Пропущенные значения заполнялись средними значениями за соседние годы. После этого применялась стандартизация шкалы признаков и выделение обучающей и тестовой выборки в соотношении 80/20.

Подготовка к процессу моделирования изменения температур включает в себя следующие этапы:

- сбор и подготовка исходных данных;

- моделирование с помощью методов машинного обучения;

- оценка точности полученной модели;

- предсказание изменений температуры на 5 лет

.

В исследовании использовался массив данных метеорологических станций, расположенных в Антарктиде. Временные рамки охватывали данные до 2023 года, чтобы создать надежный многолетний временной ряд. На подготовительном этапе был проведен тщательный процесс уточнения данных, включая выявление и удаление выбросов, процедуры нормализации и стратегические преобразования для обеспечения согласованности и надежности набора данных

,
,
.

2.1. Применение различных алгоритмов машинного обучения

Нейросетевые модели. При исследовании температурных трендов были изучены тонкости нейронных сетей с использованием различных архитектур. В частности, стратегическое развертывание нейронных сетей с полным подключением, включающих несколько слоев для улавливания нюансов. Кроме того, были использованы рекуррентные нейронные сети для учета временных зависимостей, присущих данным, что повысило временную чувствительность модели.

Методы градиентного бустинга. Прогностические возможности моделей были улучшены за счет применения передовых методов градиентного бустинга. Известные библиотеки, такие как XGBoost и CatBoost, были использованы для оптимизации моделей для задач регрессии, с особым акцентом на точное предсказание температуры.

Фундаментальные алгоритмы машинного обучения. Помимо сложностей нейронных сетей и градиентного бустинга, в качестве базовых моделей для сравнительной оценки были стратегически включены фундаментальные алгоритмы. Линейная регрессия, деревья решений и случайные леса служили эталонами, обеспечивая комплексную оценку в сравнении с их более сложными аналогами.

2.2. Углубленный сравнительный анализ результатов

Сравнительная оценка с использованием данных до 2018 года. Начальные этапы исследования были посвящены детальному сравнению прогнозов модели с фактическими значениями, полученными на основе данных, доступных до 2018 года. Эта тщательная оценка была направлена на количественное определение точности и общей эффективности моделей при их применении к историческим наборам данных, что позволило получить важные сведения об их ретроспективной эффективности.

Комплексная оценка с использованием данных за 2019–2023 гг. Чтобы повысить актуальность исследования, на последующем этапе были интегрированы данные за 2019–2023 годы. Модели, разработанные на основе более ранних наборов данных, прошли всестороннее тестирование на этом новом временном интервале, что способствовало более глубокому пониманию их адаптивности к изменяющимся климатическим условиям.

Внутренний методологический бенчмаркинг. Продвинутая стратегия исследования предусматривала взаимное сравнение различных методологий машинного обучения с учетом таких сложных критериев, как точность прогноза, стабильность на различных временных интервалах и масштабируемость для решения возникающих задач. Этот процесс сравнительного анализа позволил выявить оптимальные подходы к прогнозированию температурных трендов, обеспечив всестороннее понимание сильных и слабых сторон каждой методологии.

3. Результаты исследования и их обсуждение

На рисунке 1 представлена диаграмма, где проанализированы прогнозы базовых алгоритмов машинного обучения и методов градиентного бустинга. Несмотря на разнообразие архитектур этих методов, среднеквадратичная ошибка отражает неудовлетворительные результаты в большинстве случаев, за исключением станции Купол Фудзи. Это явление, вероятно, обусловлено ограниченностью данных, учитывая множество параметров, которые могут оказывать влияние на результаты и представлены в анализе.

Сравнение с другими нейросетевыми моделями, использовавшимися в климатологических исследованиях (например, Zhukova et al., 2024), показывает, что предложенная модель достигает сопоставимых результатов при меньшей архитектурной сложности. Это делает её более пригодной для приложений с ограниченными вычислительными ресурсами. Дополнительно, использование нейросетевых методов, описанных в работе Гибадуллина и др. (2020), может быть полезно для дальнейшей оптимизации структур модели
,
.
Средняя квадратическая ошибка для разных моделей на разных станциях

Рисунок 1 - Средняя квадратическая ошибка для разных моделей на разных станциях

В целях повышения эффективности исследования было принято решение о разработке компактной полносвязной нейронной сети, с нацеленностью на достижение значительных улучшений в результатах. Разработанная нейронная сеть, названная «SimpleRegressionNN», состоит из двух полносвязных слоев: первый слой включает 1 вход и 4 нейрона на скрытом слое, второй слой имеет 4 входа и 1 выходной нейрон. Применена функция активации ReLU для достижения нелинейности и повышения способности модели к выявлению сложных паттернов в данных.

Обучение модели SimpleRegressionNN проводилось в среде PyTorch. Архитектура включала два скрытых слоя: первый с 4 нейронами и второй с одним выходом. В качестве функции активации использовалась ReLU. Обучение велось на 300 эпох с размером батча 16, функция потерь — MSELoss. Оптимизация производилась методом Adam с коэффициентом обучения (learning rate) 0.001. Данные были разделены на обучающую и валидационную выборки в пропорции 80/20.

Полносвязная нейросеть на PyTorch представлена на рисунке 2:
Полносвязная нейросеть

Рисунок 2 - Полносвязная нейросеть

На представленном графике (рис. 3), иллюстрирующем среднеквадратичную ошибку (MSE) для полносвязной нейронной сети, отчетливо проявляется эффективность SimpleRegressionNN на трех из четырех метеостанциях. В частности, на метеостанции Купол Фудзи наблюдается MSE ниже 0,1, что свидетельствует о высокой точности нейронной сети в прогнозировании температуры на указанных данных.
Средняя квадратическая ошибка нейросети на разных станциях

Рисунок 3 - Средняя квадратическая ошибка нейросети на разных станциях

Далее в рамках работы было проведено прогнозирование температурных показателей на каждой из метеостанций в период с 2025 по 2029 год с использованием модели SimpleRegressionNN (рис. 4):
Предсказание температур с помощью нейросети на период 2025-2029 гг: а - станция Davis AMC; б - станция Купол Фудзи; в - станция Henry AMC; г - станция Nico

Рисунок 4 - Предсказание температур с помощью нейросети на период 2025-2029 гг: 

а - станция Davis AMC; б - станция Купол Фудзи; в - станция Henry AMC; г - станция Nico

Все станции представлены в едином визуальном формате (рис. 4), что позволяет наглядно сравнить динамику температурных прогнозов и оценить точность модели SimpleRegressionNN в разных климатических условиях Антарктиды. Нейронные сети демонстрируют свою эффективность, их устойчивость и адаптивность открывают перспективы для дальнейших исследований в области климатологии.

Наиболее высокую точность продемонстрировала нейросетевая модель SimpleRegressionNN, особенно на станциях Купол Фудзи и Davis AMC. По сравнению с градиентным бустингом и линейной регрессией, она показала меньшую среднеквадратичную ошибку, что делает её предпочтительным инструментом для краткосрочного прогнозирования в условиях ограниченных климатических данных.

Перспективными направлениями будущих исследований являются внедрение мультимодельных ансамблей, расширение набора климатических параметров и адаптация моделей к сезонным колебаниям. Также возможна интеграция спутниковых и геоинформационных данных для повышения пространственной детализации прогнозов.

Практическое значение исследования заключается в возможности использовать полученные модели для прогноза климатических условий при планировании экспедиций, логистических маршрутов, а также в долгосрочном климатическом моделировании для оценки рисков в условиях изменения окружающей среды.

Ограничения исследования: настоящее исследование ограничено использованием только температурных данных без учёта других климатических параметров (осадки, скорость ветра и т.д.), что может повлиять на точность моделей. Также ограничение до 2023 года связано с отсутствием открытых актуальных данных. Модели не учитывают сезонные колебания, поскольку анализ проводился на основе годовых средних значений.

4. Заключение

В рамках научного исследования были собраны метеорологические данные из открытых источников для четырёх станций Антарктиды (Davis AMC, Купол Фудзи, Henry AMC и Nico). Были изучены прогнозы базовых алгоритмов машинного обучения и методов градиентного бустинга на период 2019–2023 г.г., которые показали неудовлетворительные результаты. Была разработана нейронная сеть под названием «SimpleRegressionNN», которая показала незначительные среднеквадратические ошибки при проверке, и была использована для прогнозирования температурных показателей на ближайшие 5 лет (2025–2029 г.г.).

Исследование демонстрирует значительный потенциал применения методов машинного обучения для анализа и прогнозирования геотермических параметров в условиях полярных магнитных узлов. Применение современных нейросетевых моделей и алгоритмов градиентного бустинга позволило обеспечить значительное улучшение в точности предсказаний температурных изменений по сравнению с традиционными подходами. Высокую эффективность в прогнозировании температурных показателей на короткий срок продемонстрировала нейронная сеть «SimpleRegressionNN». В дальнейших работах необходимо сосредоточиться на расширении, углублении используемых алгоритмов машинного обучения для учета дополнительных переменных и факторов, а также на разработке мультимодельных подходов для уточнения и повышения надежности прогнозов. Таким образом, проведенное исследование подтверждает, что машинное обучение представляет собой мощный инструмент в изучении глобальных климатических изменений и может играть ключевую роль в разработке эффективных стратегий адаптации к будущим изменениям климата. Результаты данной работы могут служить основой для дальнейших исследований в области прогноза климатических процессов, а также стимулировать интеграцию технологий искусственного интеллекта в климатологические исследования.

Метрика статьи

Просмотров:858
Скачиваний:18
Просмотры
Всего:
Просмотров:858