
- •Глава 1. Анализ предметной области 6
- •Глава 2. Описание набора данных 9
- •Глава 3. Выполнение задания 13
- •Введение
- •Глава 1. Анализ предметной области
- •1.1. Применение языка Python для анализа данных
- •1.2. Синтаксис языка Python
- •1.3. Библиотеки и инструменты для анализа и визуализации данных
- •Глава 2. Описание набора данных
- •2.1. Общая информация о наборе данных
- •2.2. Описание столбцов набора данных
- •2.3. Базовая статистика
- •Глава 3. Выполнение задания
- •3.1. Загрузка первичных данных
- •3.2. Очистка данных
- •3.3. Выполнение запросов для выявления закономерностей
- •3.4. Визуализация данных
- •3.5 Корреляционный и регрессионный анализ
- •Приложение
Глава 2. Описание набора данных
2.1. Общая информация о наборе данных
Тема безопасности на дорогах становится все более актуальной по мере роста числа автомобилей и водителей. С увеличением плотности дорожного движения возрастает и количество ДТП. Чтобы снизить риск возникновения ДТП, необходимо выявить причины их возникновения и устранить их в дальнейшем. Для этого с каждого ДТП собираются всевозможные данные, которые впоследствии объединяются в большие базы данных для последующего анализа. В своей работе я рассмотрю такую БД, которая предоставляет детальную информацию о множестве аварий, и попытаюсь найти закономерности, влияющие на ДТП, и разработать меры по их снижению.
Эта база данных содержит информацию о каждом инциденте, включая такие параметры, как время и место происшествия, погодные условия, состояние дорожного покрытия, участие различных транспортных средств и многое другое. Благодаря большому количеству данных и разнообразным факторам, влияющим на ДТП, этот набор данных позволяет провести всесторонний анализ и выявить закономерности.
Использование этого набора данных предоставляет возможность для машинного обучения с целью предсказания и предотвращения дорожных происшествий, а также для улучшения дорожной безопасности.
2.2. Описание столбцов набора данных
В наборе данных о дорожных происшествиях содержится много информации, однако, для нашего анализа выделим шесть самых значимых:
Дата и время происшествия (Accident Date): этот столбец позволяет анализировать временные закономерности, такие как пиковые часы аварий и сезонные колебания. Понимание этих закономерностей помогает в разработке стратегий для улучшения дорожной безопасности в наиболее критические периоды.
Тип транспортного средства (Vehicle Type): информация о типе транспортного средства помогает определить, какие транспортные средства чаще всего попадают в аварии. Это важно для целенаправленных профилактических мер, направленных на конкретные категории транспортных средств.
Место происшествия (Location): позволяет выявить опасные участки дорог и зоны с высокой концентрацией аварий. Эти данные могут быть использованы для улучшения инфраструктуры и принятия мер по снижению риска аварий в определенных местах.
Погодные условия (Weather Conditions): этот фактор играет важную роль в частоте и серьезности происшествий. Анализ погодных условий помогает понять, при каких условиях чаще всего происходят аварии и как можно минимизировать их влияние.
Тип происшествия (Accident Type): классификация аварий по типам позволяет выявить наиболее частые сценарии и разработать специфические меры по их предотвращению. Это может включать изменения в правилах дорожного движения или улучшение дорожной разметки.
Состояние дороги (Road Conditions): помогает понять, как состояние дорожного покрытия влияет на аварийность. Эти данные могут использоваться для планирования ремонтов и улучшений дорожного покрытия, чтобы снизить риск аварий.
Эти столбцы были выбраны из-за их непосредственного влияния на возможность предсказания аварий и разработки мер по их предотвращению.