
- •Глава 1. Анализ предметной области 6
- •Глава 2. Описание набора данных 9
- •Глава 3. Выполнение задания 13
- •Введение
- •Глава 1. Анализ предметной области
- •1.1. Применение языка Python для анализа данных
- •1.2. Синтаксис языка Python
- •1.3. Библиотеки и инструменты для анализа и визуализации данных
- •Глава 2. Описание набора данных
- •2.1. Общая информация о наборе данных
- •2.2. Описание столбцов набора данных
- •2.3. Базовая статистика
- •Глава 3. Выполнение задания
- •3.1. Загрузка первичных данных
- •3.2. Очистка данных
- •3.3. Выполнение запросов для выявления закономерностей
- •3.4. Визуализация данных
- •3.5 Корреляционный и регрессионный анализ
- •Приложение
МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ, СВЯЗИ И МАССОВЫХ
КОММУНИКАЦИЙ РОССИЙСКОЙ ФЕДЕРАЦИИ
Ордена Трудового Красного Знамени федеральное государственное
бюджетное образовательное учреждение высшего образования
Московский технический университет связи и информатики
Кафедра «Интеллектуальные системы в управлении и автоматизации»
КУРСОВОЙ ПРОЕКТ
по дисциплине
«Информационные технологии и программирование»
Руководитель:
Оценка: ______________
«___» _________ 20 __ г.
Москва 202г.
Содержание
Введение 4
Глава 1. Анализ предметной области 6
1.1. Применение языка Python для анализа данных 6
1.2. Синтаксис языка Python 6
1.3. Библиотеки и инструменты для анализа и визуализации данных 7
Вывод 8
Глава 2. Описание набора данных 9
2.1. Общая информация о наборе данных 9
2.2. Описание столбцов набора данных 9
2.3. Базовая статистика 10
Вывод 11
Глава 3. Выполнение задания 13
3.1. Загрузка первичных данных 13
3.2. Очистка данных 15
3.3. Выполнение запросов для выявления закономерностей 16
3.4. Визуализация данных 18
3.5 Корреляционный и регрессионный анализ 21
Вывод 23
Заключение 24
Список использованных источников и литературы 25
Приложение 26
Введение
В современном мире обеспечение безопасности дорожного движения является одной из ключевых задач, стоящих перед государствами и обществами. Количество дорожно-транспортных происшествий (ДТП) остается высоким, что требует всестороннего анализа для выявления факторов, влияющих на их частоту и тяжесть. Одним из перспективных методов анализа является использование баз данных для хранения и обработки информации о ДТП и связанных с ними факторов.
Анализ данных о ДТП с целью выявления корреляций между различными факторами, такими как погода, скорость, время суток, дата и другие, позволяет получить ценные инсайты, которые могут быть использованы для улучшения мер по обеспечению безопасности на дорогах. В условиях развития информационных технологий, использование баз данных и методов анализа данных становится все более востребованным инструментом для органов государственной власти, страховых компаний и исследовательских организаций. Таким образом, данная работа является актуальной и востребованной в контексте повышения безопасности дорожного движения и снижения количества ДТП.
Целью данной работы является анализ базы данных ДТП для выявления ключевых факторов, влияющих на их частоту и тяжесть, с использованием методов сортировки, построения графиков, диаграмм и корреляционного анализа.
Для достижения данной цели необходимо решить следующие задачи:
Сбор и предварительная обработка данных о ДТП и связанных с ними факторов.
Построение графиков и диаграмм для визуализации данных.
Проведение сортировки данных для выявления наиболее значимых факторов.
Выполнение корреляционного анализа для определения взаимосвязей между различными факторами.
Интерпретация полученных результатов и формулирование выводов.
Работа состоит из нескольких разделов, каждый из которых направлен на достижение поставленных целей и задач:
Введение: описание актуальности работы, цели и задач, объекта и предмета исследования, структуры работы.
Первая глава: анализ предметной области, рассмотрение применения языка Python для анализа данных, разбор синтаксиса и библиотек.
Вторая глава: описание набора данных, сведения о содержании столбцов, количество записей.
Третья глава: выполнение задания, включающего загрузку данных, их очистку, выполнение запросов для выявления закономерностей, визуализация данных, корреляционный и регрессионный анализ.
Заключение: обоснование актуальности работы, основные результаты, краткий самоотчёт о полученных знаниях и навыках.
Количество страниц, рисунков, таблиц, формул, использованных источников, приложений
Количество страниц: 29
Количество рисунков: 11
Количество таблиц: 0
Количество формул: 0
Количество использованных источников: 5
Количество приложений: 4