
- •Оглавление
- •Глава 1 8
- •Глава 2 12
- •Глава 3 17
- •Глава 1
- •Применение языка Python для анализа данных
- •Глава 2
- •2.1. Значимость анализа данных о преступности
- •2.2. Краткие сведения о содержании столбцов
- •Глава 3
- •Импорты библиотек Python
- •Тепловая карта уровня преступности
- •Матрица корреляции
- •Анализ процентного соотношения преступлений
- •Выполнение прогнозирования
Глава 2
В современных городах проблема преступности остается одной из наиболее острых и значимых. Данные о преступлениях являются важным инструментом для анализа и разработки стратегий по снижению уровня преступности. Для данной работы был выбран набор данных “Crime Data from 2020 to Present”. Этот набор данных отражает случаи преступности в городе Лос-Анджелес, начиная с 2020 года и представляет собой ценный ресурс для исследований в области криминологии, городского планирования и общественной безопасности. Эти данные взяты из оригинальных отчетов о преступлениях, напечатанных на бумаге, поэтому в данных могут быть некоторые неточности. Некоторые поля местоположения с отсутствующими данными отмечены как (0°, 0°). Поля адреса предоставляются только с точностью до ближайшей сотни для обеспечения конфиденциальности. Эти данные так же точны, как и данные в базе данных.
2.1. Значимость анализа данных о преступности
Анализ данных о преступности позволяет:
Выявлять тенденции и закономерности: определение временных и пространственных тенденций преступности помогает понять, какие районы наиболее подвержены определенным видам преступлений.
Разрабатывать превентивные меры: на основе анализа данных можно разрабатывать и внедрять превентивные меры, направленные на снижение уровня преступности.
Улучшать общественную безопасность: правоохранительные органы могут использовать данные для оптимизации своих ресурсов и повышения эффективности патрулирования.
Информировать общественность: доступ к информации о преступности помогает жителям города быть более осведомленными и принимать меры для собственной безопасности.
2.2. Краткие сведения о содержании столбцов
DR_NO:
Номер отдела записей: официальный номер файла, состоящий из двухзначного года, идентификатора региона и пяти цифр.
Date Rptd:
ММ/ДД/ГГГГ
DATE OCC:
ММ/ДД/ГГГГ
TIME OCC:
Время в формате HH:MM
AREA:
В полиции Лос-Анджелеса имеется 21 общественный полицейский участок, называемый географическими зонами внутри департамента. Эти географические зоны последовательно пронумерованы от 1 до 21.
AREA NAME:
21 географическому району или патрульному подразделению также присвоено название, которое ссылается на достопримечательность или окружающее сообщество, за которое оно несет ответственность. Например, подразделение 77-й улицы расположено на пересечении Южного Бродвея и 77-й улицы и обслуживает районы Южного Лос-Анджелеса.
Rpt Dist No:
Четырехзначный код, обозначающий подрайон в пределах географической зоны. Все записи о преступлениях содержат ссылку на «RD», в котором они произошли, для статистического сравнения.
Crm Cd:
Указывает на совершенное преступление. (То же, что и Кодекс преступлений 1)
Crm Cd Desc:
Определяет предусмотренный Уголовный кодекс.
Mocodes:
Действия, связанные с подозреваемым в совершении преступления. Список кодов МО в числовом порядке см. в прилагаемом PDF-файле. https://data.lacity.org/api/views/y8tr-7khq/files/3a967fbd-f210-4857-bc52-60230efe256c?download=true&filename=MO%20CODES%20(numerical%20order).pdf
Vict Age:
Возраст
Vict Sex:
Пол
Vict Descent:
Код происхождения: A – другой азиат B – черный C – китаец D – камбоджиец F – филиппинец G – гуамец H – латиноамериканец/латиноамериканец/мексиканец I – американский индеец/коренной житель Аляски J – японец K – кореец L – лаосец O – другой P – Житель островов Тихого океана S — Самоанец U — Гавайец V — Вьетнамец W — Белый X — Неизвестно Z — Индеец азиатского происхождения.
Premis Cd:
Тип строения, транспортного средства или места, где произошло преступление.
Premis Desc:
Определяет предоставленный код помещения.
Weapon Used Cd:
Вид оружия, использованного при совершении преступления.
Weapon Desc:
Определяет предоставленный код использования оружия.
Status:
Статус дела. (IC используется по умолчанию)
Status Desc:
Определяет предоставленный код состояния.
Crm Cd 1:
Указывает на совершенное преступление. Кодекс преступления 1 является основным и наиболее серьезным. Уголовный кодекс 2, 3 и 4 относятся к менее тяжким правонарушениям соответственно. Более низкий класс преступности более серьезен.
Crm Cd 2:
Может содержать код дополнительного преступления, менее серьезного, чем Кодекс преступления 1.
Crm Cd 3:
Может содержать код дополнительного преступления, менее серьезного, чем Кодекс преступления 1.
Crm Cd 4:
Может содержать код дополнительного преступления, менее серьезного, чем Кодекс преступления 1.
LOCATION:
Адрес места преступления округлен до ближайшей сотни для сохранения анонимности.
Cross Street:
Перекрестная улица с закругленным адресом
LAT:
Широта
LON:
Долгота
Всего в датаесете имеется 28 столбцов и 918443 строк, ячеек с данными – 25716404 единиц.
Вывод
Набор данных включает различные столбцы, которые содержат информацию о типах преступлений, их географическом расположении и временных характеристиках. Количество записей в наборе данных обеспечивает достаточную выборку для анализа и выявления тенденций. Однако следует учитывать, что некоторые поля местоположения могут содержать отсутствующие данные, отмеченные как (0°, 0°), а адреса представлены с точностью до ближайшей сотни для обеспечения конфиденциальности.
В целом, несмотря на некоторые ограничения, данные являются достаточно точными для проведения анализа и представляют важный источник информации для исследования преступности в Лос-Анджелесе.