Регрессионный анализ связи между числом дорожно-транспортных происшествий и количеством пострадавших
Регрессионный анализ связи между числом дорожно-транспортных происшествий и количеством пострадавших
Аннотация
Данная статья посвящена анализу статистической взаимосвязи между количеством ДТП и числом пострадавших с 2017 по 2024 год. Рассматривается период реализации Стратегии безопасности дорожного движения в Российской Федерации на 2018–2024 годы. Исследуются официальные статистические данные по безопасности дорожного движения в 86 регионах страны. Проведен корреляционный и регрессионный анализ. Выявлена сильная, близкая к функциональной зависимость между числом ДТП и количеством пострадавших. Также обнаружена устойчивая тенденция к снижению числа пострадавших в одном ДТП. Разработана регрессионная модель для прогнозирования, связывающая количество ДТП и число пострадавших и учитывающая указанную тенденцию.
1. Введение
В соответствии с данными, опубликованными на официальном сайте Государственной инспекции безопасности дорожного движения Министерства внутренних дел Российской Федерации, в 2024 году на дорогах общего пользования в России произошло 132 тысячи дорожно-транспортных происшествий (ДТП)
. В результате этих аварий погибло 14,4 тысячи человек, 164,8 тысячи получили ранения.Это количество пострадавших сопоставимо с населением таких городов, как Орёл, Псков или Уссурийск. Природные катаклизмы или техногенные катастрофы, повлекшие 180 тысяч жертв, стали бы настоящей трагедией для всего российского народа. Однако, хотя количество пострадавших в ДТП ежегодно остаётся значительным, это вызывает сравнительно меньший резонанс в обществе.
Тем не менее, каждое ДТП с пострадавшими — это не только личная трагедия для близких, но и нарушение общественной безопасности, создающее угрозу для жизни, здоровья, имущества и нормального функционирования общества в целом. При дорожно-транспортных происшествиях 20% пострадавших получают травмы, которые приводят к инвалидности
. Это наносит серьезный ущерб обществу и экономике России.Учитывая тяжесть последствий аварий на транспорте, Правительство Российской Федерации разработало и приняло Стратегию безопасности дорожного движения в Российской Федерации на 2018–2024 годы (далее — Стратегия)
. Цели Стратегии заключаются в повышении безопасности дорожного движения и стремлении к нулевой смертности в ДТП к 2030 году.В докладе о реализации Стратегии
указано, что бюджет выделил 6 674,1 миллиона рублей. Госавтоинспекция обновила свое оснащение, Минтранс повысил безопасность перевозок, Росавтодор снизил риски ДТП, Минпромторг внедрил современные технологии для уменьшения аварийности, МЧС улучшило помощь пострадавшим, а Минпросвещения обучало детей правилам дорожного движения. Целевые значения числа погибших не превышены.Основанные на использовании математического моделирования научные исследования играют важную роль в рамках Стратегии.
Имеются данные, подтверждающие существование статистически значимой связи между количеством ДТП и числом пострадавших. Например, в диссертации В.С. Чамовских «Статистическое исследование дорожно-транспортной обстановки в г. Москве» был проведен корреляционный анализ, который выявил почти функциональную зависимость между числом ДТП и количеством пострадавших (коэффициент корреляции составил 0,991) .
В работе А.В. Горяинова и Е.А. Полякова рассмотрены факторы, влияющие на число пострадавших в ДТП. В результате получена статистически значимая модель множественной регрессии, объясняющая значительную часть дисперсии зависимой переменной (коэффициент множественной детерминации — 0,743) .
Для прогнозирования последствий мероприятий по снижению числа ДТП важно разработать регрессионную модель, которая свяжет количество аварий и число пострадавших. Также интересно изучить, как менялись параметры этой модели в период реализации Стратегии.
Исследование базируется на методах математической статистики и статистических данных о состоянии безопасности дорожного движения, доступных на официальном сайте Госавтоинспекции МВД России.
2. Основные результаты
Проведены корреляционный и регрессионный анализ годовых статистических данных о состоянии безопасности дорожного движения в 86 регионах России за период реализации Стратегии с 2017 по 2024 год.
Принята линейная регрессионная модель
y = a·x +b,
y = a·x,
где y — число пострадавших, x — количество ДТП, b = 0 (значение результативного признака при нулевом значении независимой переменной x).
Результаты анализа представлены в таблице 1.
Таблица 1 - Результаты корреляционного и регрессионного анализа
Год | r | Модель | R2 | Значимость F |
2017 | 0,995 | y = 1,349x | 0,996 | 9,6·10–101 |
2018 | 0,995 | y = 1,350x | 0,995 | 3,0·10–100 |
2019 | 0,996 | y = 1,350x | 0,995 | 2,4·10–100 |
2020 | 0,995 | y = 1,338x | 0,995 | 1,4·10–99 |
2021 | 0,995 | y = 1,329x | 0,994 | 8,8·10–97 |
2022 | 0,995 | y = 1,333x | 0,995 | 4,6·10–99 |
2023 | 0,994 | y = 1,320x | 0,994 | 3,7·10–94 |
2024 | 0,994 | y = 1,309x | 0,993 | 4,1·10–93 |
Установлена очень тесная связь между числом ДТП и количеством пострадавших. Коэффициент корреляции r превышает 0,99.
Регрессионные модели точно описывают данные. Коэффициент детерминации R² превышает 0,99. Это означает, что на неучтенные факторы приходится менее 1% вариабельности зависимой переменной. Модели статистически значимы: вероятность случайного соответствия данных и модели крайне мала (значимость критерия Фишера F).
Параметр модели меняется со временем, наблюдается его снижение. Для прогнозирования последствий мер по снижению числа ДТП нужно учитывать этот тренд.
Поэтому параметр модели следует представить как функцию времени:
a(t) = c·t + d,
где t — год, c и d — константы.
Получено уравнение регрессии:
a(t) = –0,005799 t + 13,05.
Эта функциональная зависимость хорошо описывает массив параметров модели за 2017–2024 годы, коэффициент детерминации R² составляет 0,902. Она также статистически значима на уровне 0,001, что подтверждает устойчивую тенденцию к снижению числа пострадавших в одном ДТП.
С учетом вариабельности параметра уравнение регрессионной модели принимает вид:
y = a·x +b,
y = (–0,005799 t + 13,05)·x.
Полученная модель может предсказать, как реализация плана по улучшению безопасности на дорогах и снижению количества ДТП повлияет на число пострадавших.
Прогнозирование с помощью регрессионных моделей опирается на предположение о случайности ошибок аппроксимации — разницы между фактическими и расчетными данными. Для этого должны выполняться три условия: ошибки должны быть случайными и независимыми, а также подчиняться нормальному закону распределения .
Случайность ошибок проверяется методом «поворотных точек». Точка считается поворотной, если ошибка аппроксимации больше или меньше соседних ошибок. Для подтверждения случайности должно выполняться неравенство :
k > ent[2(n-2)/3 - 1,96((16n-29)/90)0,5], 3 > 1,
где k = 3 — фактическое количество поворотных точек, n = 8 — число наблюдений, ent[ ] — целая часть выражения.
Независимость ошибок проверяется по критерию Дарбина-Уотсона, который составил 1,35. Это больше критического значения для числа объясняющих переменных m = 1 при уровне значимости α = 0,05. Поэтому гипотеза о независимости ошибок аппроксимации принимается.
Нормальность распределения ошибок подтверждается коэффициентами асимметрии As и эксцесса Ex :
|As| ≤ 3 (6n(n-1)/((n-2)(n+1)(n+3)))0,5,
0,4 ≤ 2,3,
|Ex| ≤ 5 (24n(n-1)2/((n-3)(n-2)(n+3)(n+5)))0,5,
|–1,0| ≤ 7,4.
Таким образом, подтверждена пригодность модели для прогнозирования. Например, можно прогнозировать, что в 2025 году среднее количество пострадавших в ДТП снизится до следующей величины:
a(2025) = –0,005799·2025 + 13,05.
a(2025) = 1,306.
Точечный прогноз можно заменить более надежным интервальным прогнозированием с учетом оценки ошибки D :
где ta — критическое значение t-статистики Стьюдента (α = 0,1); s — среднеквадратическое отклонение расчетных и фактических данных; k — номер года, на который составляется прогноз, отсчитываемый от середины интервала наблюдения; S t2 — сумма квадратов номеров годов внутри интервала, отсчитываемых от его середины.
Расчетное значение оценки ошибки прогноза на 2025 год составляет 0,034. Это означает, что фактическое значение показателя a будет находиться в пределах доверительного интервала:
a + D … a – D
1,272 … 1,340
Прогнозируем, что количество числа пострадавших в одном ДТП в России в 2025 году с вероятностью 90% окажется в пределах от 1,272 до 1,34.
3. Заключение
В период реализации стратегии обнаружена близкая к функциональной зависимость между числом ДТП и количеством пострадавших. Выявлена устойчивая тенденция к снижению числа пострадавших в одном ДТП. Получена пригодная для прогнозирования регрессионная модель, связывающая количество ДТП и число пострадавших.
