- •Информационные технологии обеспечения юридической деятельности
- •030900 «Юриспруденция»
- •Оглавление
- •Введение
- •Предмет и структура информатики. Особенности обработки информации в правовой сфере деятельности
- •Понятие «информатика»
- •Структура правовой информации
- •Основы работы в табличном процессоре excel
- •Интерфейс окна книги Excel
- •Расчеты в таблицах и основные функции Excel
- •Подведение промежуточных итогов
- •Использование логической функции и поиск данных
- •Основные методы математико-статистического анализа в обработке социально-правовой информации
- •Определение меры вариации статистической совокупности
- •Определение аномальных значений совокупностей
- •Построение гистограмм
- •Расчет коэффициента корреляции
- •Построение модели парной линейной регрессии
- •Построение рейтинга экономических субъектов
- •Компьютерные сети
- •Назначение и классификация компьютерных сетей
- •Архитектура связей
- •Сетевое оборудование и передача данных
- •Технология «клиент – сервер» и программные средства компьютерных сетей
- •Некоторые особенности сетей повышенной надежности
- •Структура глобальной сети Internet, сетевые протоколы
- •Адресация в Internet
- •Классификация сервисов Internet
- •Электронная почта
- •Система гипермедиа www
- •Браузер как основная программа доступа к службам Сети
- •Безопасный обмен информацией через Internet
- •Информационная безопасность
- •Концепция информационной безопасности Российской Федерации
- •Источники угроз информационной безопасности
- •Несанкционированный доступ
- •Безопасность корпоративных информационных систем
- •Этап анализа и оценки существующих рисков в организации
- •Этап внедрения системы безопасности
- •Этап поддержки
- •Методы противодействия информационным атакам в сети
- •Электронный документооборот и электронная цифровая подпись
- •Оценка состояния и ключевые проблемы обеспечения информационной безопасности
- •Вопросы для самопроверки
- •Требования к выполеннию и оформлению контрольной работы
- •Вариант задания 1
- •Вариант задания 2
- •Вариант задания 3
- •Вариант задания 4
- •Вариант задания 5
- •Вариант задания 6
- •Вариант задания 7
- •Вариант задания 8
- •Вариант задания 9
- •Вариант задания 10
- •Приложение
- •Литература
- •Прикладная информатика и информационная безопасность в юридической деятельности
- •030900 «Юриспруденция»
- •443023, Г. Самара, ул. Промышленности, 278.
Определение аномальных значений совокупностей
Неоднородные совокупности следует проверить на наличие «выбросов».
«Выбросы» – это нетипичные или редкие значения, которые существенно отклоняются от распределения остальных выборочных данных. Эти данные могут отражать истинные свойства изучаемого явления (переменной), а могут быть связаны с ошибками измерения или аномальными явлениями и поэтому не должны включаться в модель. Визуально «выбросы» можно проследить на графике. Для этого необходимо построить линейный график, ось абсцисс которого – название регионов, ось ординат – значения показателя (рис. 36).
Рисунок
36. График определения аномальных значений
совокупности «сверху»
Получаем график, визуальный анализ которого позволяет сделать вывод о регионах - точках «выбросов» по данному показателю. В нашем случае это г. Москва, так как значение этого показателя выше верхней границы.
Аналитически (один
из простейших способов) «выбросы»
определяются с помощью следующего
правила: значение может быть отброшено,
если оно лежит вне области Xср.
± 4
.
Причем среднее значение и стандартное
отклонение рассчитывается без учета
экстремальных значений (в нашем случае
без значения г. Москвы).
Пример. Определим, является ли значение среднедушевых доходов г. Москвы аномальным для рассматриваемой совокупности регионов. Зная значение «аномальной» точки, определим верхнюю допустимую границу. Все расчеты оформим в виде таблицы (рис. 37). Заполнение ее будет состоять из следующих этапов:
Определить числовое значение показателя, соответствующего точке выброса (максимальное или минимальное значение по столбцу).
Рассчитать среднее значение показателя без учета точки выброса с помощью формулы:
=(СУММ($C$3:$C$81)-$C$20)/(СЧЕТ($C$3:$C$81)-1).
Найти квадрат отклонения текущих значений от среднего (без учета значения г. Москвы), например для Белгородской области, с помощью формулы: =(C3-$D$3) ^2.
Определить среднеквадратическое отклонение признака без учета точки выброса с помощью формулы:
КОРЕНЬ((СУММ($E$3: $E$81)/СЧЕТ($E$3:$E$81))),
включив ее в формулу расчета верхней и нижней границ допустимых интервалов соответственно:
=D3+4*КОРЕНЬ((СУММ($E$3:$E$81)/СЧЕТ($E$3:$E$81))) – для верхней границы;
=D3-4*КОРЕНЬ((СУММ($E$3:$E$81)/СЧЕТ($E$3:$E$81))) – для нижней.
|
Рисунок 37. Фрагмент таблицы в режиме формул определения допустимых границ значений показателей
|
В режиме значений таблица дана на рис. 38.
Рисунок 38 . Фрагмент таблицы в режиме «значений» определения допустимых границ показателей
Для определения того, является ли значение г. Москвы точкой «выброса», введем логическую функцию, например в ячейку D86:
=ЕСЛИ(C20>F3; «аномальное значение»; «значение принадлежит совокупности»), где С20 – ячейка, содержащая среднедушевые доходы г. Москвы; F3 – ячейка, содержащая верхние допустимые границы.
В нашем случае в ячейке «результат» будет сообщение: аномальное значение. Следовательно, при проведении корреляционно-регрессионного анализа необходимо значение г. Москвы исключить из совокупности, например, сформировав новую таблицу с помощью расширенного фильтра.
Следующий этап разведочного анализа – определение характера распределения совокупности значений данных визуально с помощью построения гистограмм.
