
3 курс (заочка) / Доклад - Data Mining / Полезности по теме / Data Mining хорошая методичка
.pdf
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ш |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ЧЕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис.9 Сравнение задач классификации и кластеризацииН |
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На сегодняшний день разработано более сотни различных алгоритмов |
|||||||||||||||||||||||||||||||
|
|
|
кластеризации. |
|
|
|
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Приведем краткую характеристику подходов к кластеризации. |
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Алгоритмы, основанные |
|
|
Е |
|
|
|
|
|
|
(Partitioning |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
наТразделении данных |
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
algorithms), в т.ч. итеративные: |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
o разделение объектов на k кластеров; |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
o итеративное |
И |
|
|
|
|
|
|
объектов для |
улучшения |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
перераспределение |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
кластеризацииН. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
Иерархические алгоритмыЙ |
(Hierarchy algorithms): |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
o |
агломерацияЫ |
: каждый объект |
|
первоначально является |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
кластеромН |
, кластеры, соединяясь друг с другом, формируют |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
большийВ |
кластер и т.д. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
МетодыС , основанные на концентрации объектов (Density-based |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
methods):А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
Д |
|
основаны на возможности соединения объектов; |
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
У o |
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
o |
игнорируют |
шумы, |
|
нахождение |
кластеров произвольной |
||||||||||||||||||||||
|
|
|
|
|
|
|
Г |
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
Й |
|
|
|
|
|
формы. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
К |
|
|
|
|
Грид-методы (Grid-based methods): |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
С |
|
|
|
|
|
o квантование объектов в грид-структуры. |
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
Модельные методы (Model-based): |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
Р |
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
А |
А |
|
|
|
|
|
|
|
|
o использование модели для нахождения кластеров, наиболее |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
соответствующих данным. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Оценка качества кластеризации.
Оценка качества кластеризации может быть проведена на основе следующих процедур:
ручная проверка;
31
установление контрольных точек и проверка на полученных кластерах;
определение стабильности кластеризации путем добавления в модель новых переменных;
создание и сравнение кластеров с использованием различных методов.
|
|
|
|
|
|
|
Разные методы кластеризации могут создавать разные кластеры, и это |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
является |
|
нормальным |
явлением. |
|
Однако |
|
создание схожих |
|
|
|
|
|
|
Г |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
кластеров |
||||||||||||||||||||||||||||
|
|
|
|
|
различными методами указывает на правильность кластеризации. |
|
|
|
|
|
О |
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
К |
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
Процесс кластеризации. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
Процесс кластеризации зависит от выбранного метода и почти всегда |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ш |
|
|
|
|
|
|
|
|
|
|
|
является итеративным. Он может стать увлекательным процессомЫи включать |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
, например, |
||||||
|
|
|
|
|
множество экспериментов по выбору разнообразных параметровР |
||||||||||||||||||||||||||||||||
|
|
|
|
|
меры расстояния, типа стандартизации переменных, количестваЧЕ |
кластеров и |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
т.д. |
Полученные |
результаты |
|
требуют |
|
|
Г |
интерпретации, |
||||||||||||||||||||||||
|
|
|
|
|
|
|
дальнейшей |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
исследования и изучения свойств и характеристик объектовН |
для возможности |
|||||||||||||||||||||||||||||||
|
|
|
|
|
точного описания сформированных кластеров. |
|
НИ |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задача прогнозирования |
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задачи прогнозирования решаются в самых разнообразных областях |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
человеческой деятельности, таких |
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
как наука, экономика, производство и |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
множество |
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
элементом |
|||||||||||
|
|
|
|
|
|
других сфер. Прогнозирование является важным |
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
организации управления как отдельными хозяйствующими субъектами, так и |
||||||||||||||||||||||||||||||||
|
|
|
|
|
экономики в целом. |
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
Развитие методов |
Н |
|
|
|
|
|
|
|
|
|
непосредственно |
|
связано с |
|||||||||||||||||
|
|
|
|
|
|
|
прогнозированияУ |
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
развитием информационных технологий, в частности, с ростом объемов |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
методов и алгоритмов прогнозирования, |
|||||||||||||||||||
|
|
|
|
|
хранимых данных и усложнениемН |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
Data Mining. |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
реализованных в инструментахЕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
(forecasting), в широком понимании этого слова, |
||||||||||||||||||||||
|
|
|
|
|
|
|
ПрогнозированиеТ |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
определяется какРопережающее отражение будущего. Целью прогнозирования |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
А |
|
|
будущих событий. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
является предсказаниеД |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
У |
|
(prognostics) |
|
- |
|
теория |
и практика |
прогнозирования. |
|||||||||||||||||||
|
|
|
|
|
|
|
Прогностика |
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
направлено |
|
на |
|
|
определение тенденций |
|
динамики |
||||||||||||||||||
|
|
|
|
|
Прогнозирование |
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
конкретногоЙ |
объекта или события на основе ретроспективных данных, т.е. |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
И |
его состояния в прошлом и настоящем. Таким образом, решение |
|||||||||||||||||||||||||||||
|
|
|
|
|
анализаК |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Взадачи прогнозирования требует некоторой обучающей выборки данных. |
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
О |
|
Прогнозирование - установление функциональной зависимости между |
|||||||||||||||||||||||||||||||
|
|
|
Т |
|
|
||||||||||||||||||||||||||||||||
|
|
А |
|
зависимыми и независимыми переменными. Типичной в сфере маркетинга |
|||||||||||||||||||||||||||||||||
|
Р |
|
|
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
А |
|
|
|
является задача прогнозирования рынков (market forecasting). В результате |
|||||||||||||||||||||||||||||||||
С |
|
|
|
|
решения данной задачи оцениваются перспективы развития конъюнктуры определенного рынка, изменения рыночных условий на будущие периоды, определяются тенденции рынка (структурные изменения, потребности покупателей, изменения цен).
В самых общих чертах решение задачи прогнозирования сводится к решению таких подзадач:
выбор модели прогнозирования;
анализ адекватности и точности построенного прогноза. Прогнозирование сходно с задачей классификации.
Многие методы Data Mining используются для решения задач
|
|
|
|
|
классификации и прогнозирования: |
линейная |
регрессия, |
нейронные сети, |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
деревья решений (которые иногда так и называют - деревья прогнозированияГ |
||||||||||||||||||||||||||||||||
|
|
|
|
|
и классификации). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К |
|
|||||||||
|
|
|
|
|
|
|
При |
решении |
обеих |
|
задач |
|
используется |
двухэтапный |
|
|
С |
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Впроцесс |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
построения модели на основе обучающего набора и ее использования для |
||||||||||||||||||||||||||||||||
|
|
|
|
|
предсказания неизвестных значений зависимой переменной. |
|
Ш |
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
Ы |
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
в том, что в |
|||||
|
|
|
|
|
|
|
Различие задач классификации и прогнозирования состоитР |
||||||||||||||||||||||||||||||
|
|
|
|
|
первой задаче предсказывается класс зависимой переменнойЧЕ, а во второй - |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
или неизвестные |
||||||
|
|
|
|
|
числовые значения зависимой переменной, пропущенныеГ |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
(относящиеся к будущему). |
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Прогнозирование и временные ряды |
|
Е |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
Основой для прогнозирования |
|
|
|
|
историческая информация, |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
служитИ |
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
хранящаяся в базе данных в виде временных рядов. |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Существует понятие Data Mining временных рядов (Time-Series Data |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Mining). Временной ряд - последовательность наблюдаемых значений какого- |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
либо признака, упорядоченных в неслучайные моменты времени. |
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
ряда - данные биржевых торгов. |
|
|
|
||||||||||||||
|
|
|
|
|
|
|
Типичный пример временногоИ |
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Анализ временного рядаУосуществляется с целью: |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
определения природы ряда; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
будущих значений ряда. |
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
прогнозированияН |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
структуры и закономерностей временного ряда |
|||||||||||||||||||
|
|
|
|
|
|
|
В процессе определенияЕ |
||||||||||||||||||||||||||||||
|
|
|
|
|
предполагается |
|
В |
|
|
|
|
|
|
|
|
|
|
и выбросов, |
тренда, |
|
сезонной |
||||||||||||||||
|
|
|
|
|
обнаружениеТ : шумов |
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
компоненты, |
|
|
|
С |
|
|
|
компоненты. Определение природы временного |
||||||||||||||||||||||||
|
|
|
|
|
|
|
циклическойР |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
А |
использовано как своеобразная "разведка" данных. Знание |
|||||||||||||||||||||||||
|
|
|
|
|
ряда может бытьД |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
необходимо, например, |
для |
|||||||||||
|
|
|
|
|
аналитика о наличии сезонной компоненты |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
количества записей выборки, которое должно принимать участие |
||||||||||||||||||||||||||||
|
|
|
|
|
определенияГ |
||||||||||||||||||||||||||||||||
|
|
|
|
|
в построенииЙ |
|
прогноза. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К Шумы и выбросы усложняют анализ временного ряда. Существуют |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
С |
|
|
методы |
определения |
|
и |
|
фильтрации |
выбросов, |
|
дающие |
||||||||||||||||||||
|
|
|
|
|
Вразличные |
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
возможность исключить их с целью более качественного анализа. |
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
А |
|
|
|
Основными составляющими временного ряда являются тренд и сезонная |
|||||||||||||||||||||||||||||||
|
Р |
|
|
|
|
||||||||||||||||||||||||||||||||
А |
|
|
|
компонента. Тренд является систематической компонентой временного ряда, |
|||||||||||||||||||||||||||||||||
С |
|
|
|
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
которая может изменяться во времени. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
Трендом называют неслучайную функцию, которая формируется под |
||||||||||||||||||||||||||||||
|
|
|
|
|
действием общих или долговременных тенденций, влияющих на временной |
||||||||||||||||||||||||||||||||
|
|
|
|
|
ряд. Автоматического способа обнаружения трендов во временных рядах не |
||||||||||||||||||||||||||||||||
|
|
|
|
|
существует. |
|
Но |
если |
временной |
ряд |
включает |
монотонный |
тренд |
(т.е. |
отмечено его устойчивое возрастание или устойчивое убывание), анализировать временной ряд в большинстве случаев нетрудно.
Существует большое разнообразие постановок задач прогнозирования, которое можно подразделить на две группы: прогнозирование односерийных рядов и прогнозирование мультисерийных, или взаимовлияющих, рядов.
|
|
|
|
|
|
|
Группа прогнозирование односерийных рядов включает задачи |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
построения прогноза одной переменной по ретроспективным данным только |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
этой переменной, без учета влияния других переменных и факторов. |
|
|
|
О |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
Г |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
Группа прогнозирования мультисерийных, или взаимовлияющих, рядовК |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
включает |
задачи |
|
|
анализа, |
где |
|
необходимо |
учитывать |
|
|
|
|
|
|
С |
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
взаимовлияющие |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
факторы на одну или несколько переменных. |
|
|
|
|
|
|
|
|
Е |
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Ш |
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
Кроме деления на классы по односерийности и многосерийности, ряды |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
также бывают сезонными и несезонными. |
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
Последнее деление подразумевает наличие или отсутствие у временного |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ЧЕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ряда такой |
|
составляющей |
как |
|
сезонность, |
|
|
. |
|
|
|
|
|
сезонной |
||||||||||||||||||||||||
|
|
|
|
|
|
|
т.е. включениеГ |
|
|
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
компоненты. Сезонная составляющая временногоН |
ряда является |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
периодически повторяющейся компонентой временного ряда. |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
|
равные промежутки |
|||||||||
|
|
|
|
|
|
|
Свойство сезонности означает, что через примерноЕ |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
времени форма кривой, которая описывает поведение зависимой переменной, |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
повторяет свои характерные очертания. |
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ряд можно считать несезонным, если при рассмотрении его внешнего |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
вида нельзя сделать предположений |
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
Со повторяемости формы кривой через |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
равные промежутки времени. ИногдаЕ |
по внешнему виду кривой ряда нельзя |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
определить, является он сезоннымИили нет. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
Существует |
|
|
|
|
|
|
|
|
Н |
|
|
|
|
мультиряда. В нем каждый ряд |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
понятие сезонногоУ |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
описывает поведение факторовЙ |
, которые влияют на зависимую (целевую) |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
переменную. |
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
При |
|
сборе |
|
|
|
|
Н |
|
и |
выборе |
факторов |
для |
решения |
|
задачи |
по |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
данных |
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
прогнозированию в таких случаях следует учитывать, что влияние объемов |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
продаж товаров друг на друга здесь намного меньше, чем воздействие фактора |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
сезонности. |
|
|
А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
Д |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Очень |
часто тренд и сезонность присутствуют во временном ряде |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
одновременноО . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
различать |
циклическую |
компоненту |
|
и |
|
|
сезонную. |
||||||||||||||||||||||
|
|
|
|
|
|
|
Принято |
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Продолжительность цикла, как правило, больше, чем один сезонный период, |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
К |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
отличие от |
|
сезонных |
|
периодов, |
не |
имеют определенной |
||||||||||||||||||||||||||||
|
|
|
|
|
циклы, в |
|
|
|
|
||||||||||||||||||||||||||||||||||
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Опродолжительности. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
|
|
|
При |
|
|
выполнении |
|
каких-либо |
преобразований |
понять |
|
природу |
||||||||||||||||||||||||||||
|
Р |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
|
|
|
временного ряда значительно проще, такими преобразованиями могут быть, |
||||||||||||||||||||||||||||||||||||||||
А |
|
|
|
||||||||||||||||||||||||||||||||||||||||
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
например, удаление тренда или сглаживание ряда.
Перед началом прогнозирования необходимо ответить на следующие вопросы:
1. Что нужно прогнозировать?
2. В каких временных элементах (параметрах)?
3. С какой точностью прогноза?
При ответе на первый вопрос, мы определяем переменные, которые
|
|
|
|
|
будут прогнозироваться. Это может быть, например, уровень производства |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
конкретного вида продукции в следующем квартале, прогноз суммы продажи |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
этой продукции и т.д. При выборе переменных следует учитывать доступность |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
ретроспективных данных, предпочтения лиц, принимающих решения, |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
окончательную |
|
стоимость |
|
Data |
Mining. |
Часто |
при |
решении |
|
задач |
|||||||||||||||||||||||||
|
|
|
|
|
прогнозирования |
|
|
возникает |
необходимость |
предсказания |
|
не |
|
|
|
|
О |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
самойГ |
||||||||||||||||||||||||||||||
|
|
|
|
|
переменной, а изменений ее значений. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К |
|
|||||||||||||||||||
|
|
|
|
|
|
|
При |
|
решении второго |
вопроса |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
задачи прогнозирования определяют |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
следующие параметры: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ш |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
период прогнозирования; |
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
горизонт прогнозирования; |
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
интервала прогнозирования. |
|
|
|
|
|
|
.ЧЕ |
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Период прогнозирования - основная единица времени, на которую |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
делается прогноз. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
Горизонт прогнозирования - это число периодов в будущем, которые |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
покрывает прогноз. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
Интервал |
прогнозирования |
|
- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
частотаИ, с которой делается новый |
||||||||||||||||||||||||||||||||
|
|
|
|
|
прогноз. |
|
Интервал |
|
прогнозирования |
|
|
Т |
совпадать |
|
с |
периодом |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
может |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
прогнозирования. |
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
При |
|
выборе |
|
параметров |
|
|
С |
|
|
|
|
учитывать, |
|
что |
горизонт |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
необходимо |
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
прогнозирования должен быть не меньше, чем время, которое необходимо для |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
реализации решения, |
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
принятогоИна основе этого прогноза. Только в этом |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
случае прогнозирование будетУиметь смысл. |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
С увеличением |
|
|
Й |
|
прогнозирования точность прогноза, как |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
горизонта |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
горизонта - повышается. |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
правило, снижается, а с уменьшениемН |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
Можно |
|
|
|
|
|
|
Н |
качество |
|
|
|
прогнозирования, уменьшая |
|
время, |
|||||||||||||||||||
|
|
|
|
|
|
|
|
улучшитьЕ |
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
решения, для которого осуществляется прогноз, |
|||||||||||||||||||||||
|
|
|
|
|
необходимое на реализациюТ |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и, следовательноР, уменьшив при этом горизонт и ошибку прогнозирования. |
|
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
А |
|
интервала прогнозирования следует выбирать между двумя |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
При выбореД |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
рисками: вовремя не определить изменения в анализируемом процессе и |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
высокой стоимостью прогноза. При длительном интервале прогнозирования |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
возникаетЙ |
риск не идентифицировать изменения, произошедшие в процессе, |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
И |
|
|
|
- |
|
возрастают |
издержки |
|
на |
прогнозирование. |
При |
|
выборе |
||||||||||||||||||||
|
|
|
|
|
приКкоротком |
|
|
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
С |
|
|
необходимо |
также |
учитывать |
стабильность |
анализируемого |
|||||||||||||||||||||||||||
|
|
|
|
|
Винтервала |
|
||||||||||||||||||||||||||||||||||
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
процесса и стоимость проведения прогноза. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
А |
|
|
|
Точность прогноза. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
А |
|
|
|
|
|
Точность |
|
прогноза, |
требуемая |
|
для |
решения |
|
конкретной |
|
задачи, |
||||||||||||||||||||||||
С |
|
|
|
|
|
|
|
|
|
|
оказывает большое влияние на прогнозирующую систему. Ошибка прогноза зависит от используемой системы прогноза. Чем больше ресурсов имеет такая система, тем больше шансов получить более точный прогноз. Однако прогнозирование не может полностью уничтожить риски при принятии решений. Поэтому всегда учитывается возможная ошибка прогнозирования.
Точность прогноза характеризуется ошибкой прогноза. Наиболее распространенные виды ошибок:
|
|
|
|
|
|
|
|
1. |
Средняя ошибка (СО). Она вычисляется простым усреднением |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
ошибок на каждом шаге. Недостаток этого вида ошибки - |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
положительные и отрицательные ошибки аннулируют друг |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
друга. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
2. Средняя абсолютная ошибка (САО). Она рассчитывается как |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
среднее абсолютных ошибок. Если она равна нулю, то мыГ |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
имеем |
|
совершенный |
|
прогноз. |
В |
сравнении |
|
со |
|
|
|
О |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
среднейК |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
квадратической |
ошибкой, |
|
эта |
мера "не |
придает |
|
В |
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
слишком |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
большого значения" выбросам. |
|
|
|
|
|
|
|
Ш |
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. Сумма квадратов ошибок (SSE), среднеквадратическая ошибка. |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Она вычисляется как сумма (или среднее) квадратов ошибок. |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ЧЕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Это наиболее часто используемая оценка точности прогноза. |
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
4. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
Относительная ошибка (ОО). ПредыдущиеГмеры использовали |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
действительные |
значения |
|
ошибок. |
. |
|
|
|
|
|
|
ошибка |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
ОтносительнаяН |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
выражает качество подгонки в терминах относительных |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
ошибок. |
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Виды прогнозов. |
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Прогноз может быть краткосрочным, среднесрочным и долгосрочным. |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Краткосрочный прогноз представляет собой прогноз на несколько шагов |
|||||||||||||||||||||||||||||||||
|
|
|
вперед, т.е. осуществляется построениеСпрогноза не более чем на 3% от объема |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
наблюдений или на 1-3 шага впередЕ. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
Среднесрочный прогноз - |
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
Иэто прогноз на 3-5% от объема наблюдений, |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
но не более 7-12 шагов впередУ |
; также под этим типом прогноза понимают |
||||||||||||||||||||||||||||||||||
|
|
|
прогноз на |
|
один |
|
или |
|
половинуЙ |
сезонного |
|
цикла. |
Для |
|
построения |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
краткосрочных и среднесрочных прогнозов вполне подходят статистические |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
методы. |
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
прогноз - это прогноз более чем на 5% от объема |
||||||||||||||||||||||||
|
|
|
|
|
Долгосрочный |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
наблюдений. При построении данного типа прогнозов статистические методы |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Д |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
практически не используются, кроме случаев очень "хороших" рядов, для |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
которых прогноз можно просто "нарисовать". |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задача визуализации |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К |
Визуализация |
|
- это |
инструментарий, |
который |
|
позволяет |
|
увидеть |
||||||||||||||||||||||||||
|
|
|
С |
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
конечный результат вычислений, организовать управление вычислительным |
|||||||||||||||||||||||||||||||||||
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
Опроцессом и даже вернуться назад к исходным данным, чтобы определить |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Р |
|
наиболее рациональное направление дальнейшего движения. |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
|
|
|
|
В результате использования визуализации создается графический образ |
данных. Применение визуализации помогает в процессе анализа данных увидеть аномалии, структуры, тренды. В задачах классификации и кластеризации, для иллюстрации распределения объектов в двухмерном пространстве также применяется визуализация.
36
Применение визуализации является более экономичным и простым способом выявления закономерностей (на первом этапе исследования). Линия тренда или скопления точек на диаграмме рассеивания позволяет аналитику намного быстрее определить закономерности и прийти к нужному решению. Таким образом, здесь идет речь об использовании в Data Mining не символов, а образов.
|
|
|
|
|
|
|
Визуализации данных может быть представлена в виде: графиков, схем, |
||||||||||||||||||||||||||||
|
|
|
|
|
гистограмм, диаграмм и т.д. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
Кратко роль визуализации можно описать такими ее возможностямиК: |
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
поддержка интерактивного и согласованного исследования; |
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
помощь в представлении результатов; |
|
|
|
|
|
Ш |
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
наглядность, |
чтобы создавать зрительные образы и Ыосмысливать |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
их. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
При этом необходимо иметь в виду, |
что неграмотнаяЧЕ |
визуализация |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
может приводит к неверным заключениям, которые обычно выявляются при |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
дальнейшем анализе. |
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
Н |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Основы анализа данных |
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На |
первом этапе |
|
|
|
|
|
|
|
Т |
|
|
данных, |
как правило, |
|||||||||||||||
|
|
|
|
|
|
|
статистическогоЕанализа |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
расчет корреляций и строят |
||||||||||
|
|
|
|
|
вычисляют описательную статистику, проводятИ |
||||||||||||||||||||||||||||||
|
|
|
|
|
линейную регрессию. |
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Описательная статистика (Descriptive statistics ) - техника сбора и |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
данных, |
которая |
|
используется |
для |
||||||||||||
|
|
|
|
|
суммирования количественных |
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
превращения массы цифровых данных в форму, удобную для восприятия и |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
обсуждения. |
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
результаты, |
|||||
|
|
|
|
|
|
|
Цель описательной статистики - обобщить первичные |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
полученные в результате наблюдений и экспериментов. |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В состав описательной статистики входят такие характеристики: |
||||||||||||||||||||||||||||
|
|
|
|
|
среднее; |
стандартнаяР |
|
ошибка; медиана; мода; стандартное |
|
отклонение; |
|||||||||||||||||||||||||
|
|
|
|
|
дисперсия |
|
А |
|
|
; |
|
эксцесс; |
|
асимметричность; |
интервал; |
минимум; |
|||||||||||||||||||
|
|
|
|
|
выборкиД |
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
максимум;Ссумма; счет. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
О |
|
|
|
тенденция. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
ЦентральнаяГ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К |
Измерение центральной тенденции заключается в выборе числа, которое |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
способом |
|
описывает |
все значения признака набора данных. |
|||||||||||||||||||||||
|
|
|
|
|
наилучшим |
|
|||||||||||||||||||||||||||||
|
|
|
|
|
ВРассмотрим две характеристики этого измерения, а именно: среднее значение |
||||||||||||||||||||||||||||||
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
набора |
|
данных |
для |
||||
|
|
|
Т |
и медиану. Главная цель среднего - представление |
|
|
|||||||||||||||||||||||||||||
|
|
А |
|
последующего анализа, сопоставления и сравнения. |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
Значение среднего легко вычисляется и может быть использовано для |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
последующего анализа. Оно может быть вычислено для данных, измеряемых по интервальной шкале, и для некоторых данных, измеряемых по порядковой шкале. Среднее значение рассчитывается как среднее арифметическое набора данных: сумма всех значений выборки, деленная на объем выборки. "Сжимая" данные таким образом, теряется много информации.
37
Среднее значение очень информативно и позволяет делать вывод относительно всего исследуемого набора данных.
|
|
|
|
|
|
Свойства среднего. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
1. |
При расчете среднего не допускаются пропущенные значения |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
данных. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
2. Среднее может вычисляться только для числовых данных и для |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
дихотомических шкал. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|||||||||||
|
|
|
|
|
|
|
|
|
3. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
Для одного набора данных может быть рассчитано одноГи |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
только одно значение среднего. |
|
|
|
|
|
|
|
|
|
|
|
О |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К |
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
Информативность среднего значения переменной высока, если известен |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
ее |
|
доверительный интервал. Доверительным |
|
интервалом |
|
|
Ш |
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
для среднего |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
значения является интервал значений вокруг оценки, где с данным уровнем |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
доверия находится "истинное" среднее популяции. |
|
|
Р |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
ЧЕ |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вычисление |
|
|
|
доверительных |
|
|
|
интервалов |
|
|
основывается |
|
|
на |
|||||||||||||||||||||
|
|
|
предположении |
|
|
|
нормальности |
|
|
наблюдаемых |
|
|
. |
|
|
|
Ширина |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
Гвеличин. |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
доверительного интервала зависит от размера выборкиНи от разброса данных. |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С увеличением размера выборки точность оценки среднего возрастает. |
|||||||||||||||||||||||||||||||||||
|
|
|
С увеличением разброса значений выборки надежностьЕ |
среднего падает. Если |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
размер выборки |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
увеличивается |
|||||||||||||||||
|
|
|
|
достаточно большой, качество среднего |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
независимо от выполнения предположения нормальности выборки. |
|
|
|
|
|
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Медиана - точная середина выборки, которая делит ее на две равные |
|||||||||||||||||||||||||||||||||||
|
|
|
части по числу наблюдений. |
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
Обязательным |
|
|
условием |
|
Р |
нахождения |
|
медианы |
|
|
является |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|||||||||||||||||||||||||||||
|
|
|
упорядоченность |
|
|
|
|
|
|
|
В |
|
образом, |
для |
нечетного |
|
количества |
||||||||||||||||||||||||
|
|
|
|
выборки. ТакимИ |
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
наблюдение с номером (n+1)/2, где n - |
||||||||||||||||||||
|
|
|
наблюдений медианой выступаетУ |
||||||||||||||||||||||||||||||||||||||
|
|
|
количество наблюдений в выборкеЙ |
. Для четного числа наблюдений медианой |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
является среднее значение наблюдений n/2 и (n+2)/2. |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Некоторые свойства медианы. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1. Для одного набора данных может быть рассчитано одно и |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
только одно значение медианы. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Д |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Медиана может быть рассчитана для неполного набора данных, |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
С |
|
для этого необходимо знать номера наблюдений по порядку, |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
Й |
О |
|
|
общее |
|
количество |
|
наблюдений |
|
и |
несколько |
|
значений |
|
в |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
середине набора данных. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
К |
Характеристики вариации данных. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
Наиболее простыми характеристиками выборки являются максимум и |
|||||||||||||||||||||||||||||||||||
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
Оминимум. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Р |
|
|
|
|
Минимум - наименьшее значение выборки. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
|
|
|
|
|
Максимум - наибольшее значение выборки. |
|
|
|
|
|
|
|
|
|
|
|
|
Размах - разница между наибольшим и наименьшим значениями выборки.
Дисперсия - среднее арифметическое квадратов отклонений значений от их среднего.
38
Стандартное отклонение - квадратный корень из дисперсии выборки - мера того, насколько широко разбросаны точки данных относительно их
|
|
|
|
|
среднего. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
Эксцесс показывает "остроту пика" распределения, характеризует |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
относительную остроконечность или сглаженность распределения по |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
сравнению с нормальным распределением. Положительный эксцесс |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
обозначает |
|
относительно |
остроконечное |
распределение |
(пик |
|
заострен). |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
Отрицательный эксцесс обозначает относительно сглаженное распределениеГ |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
(пик |
закруглен). |
|
Если |
|
эксцесс |
|
существенно |
|
отличается |
|
от |
|
|
|
О |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
нуляК, то |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
распределение имеет или более закругленный пик, чем нормальное, или, |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
напротив, |
имеет более острый пик (возможно, |
|
|
|
|
|
|
|
|
Е |
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
имеется несколько пиков). |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
Эксцесс нормального распределения равен нулю. |
|
|
|
|
|
|
Ш |
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
Асимметрия |
|
|
или |
асимметричность |
|
показывает |
Н |
отклонение |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
распределения от симметричного. Если асимметрия существенно отличается |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ЧЕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
от нуля, |
|
то |
|
распределение несимметрично, |
|
|
|
. |
|
распределение |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
нормальноеГ |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
абсолютно симметрично. Если распределение имеет длинныйН |
правый хвост, |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
асимметрия положительна; если длинный левый хвост - отрицательна. |
|
|
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
НИ |
от основного числа |
||||||||||
|
|
|
|
|
|
|
Выбросы (outliers) - данные, резко отличающиесяЕ |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
М |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
данных. При обнаружении выбросов перед исследователем стоит дилемма: |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
оставить наблюдения - |
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
выбросы либо от них отказаться. Второй вариант |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
требует серьезной аргументации и описания. Полезным будет провести анализ |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
данных с выбросами и без и сравнить результатыС |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
Следует |
|
помнить, |
что |
|
|
Р |
применении |
классических |
|
методов |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
приЕ |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
статистического анализа, которыеИ , как правило, не являются робастными |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
в наборе данных приводит к некорректным |
|||||||||||||||||
|
|
|
|
|
(устойчивыми), наличие выбросовУ |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
результатам. |
Если |
набор данныхЙ |
относительно мал, исключение данных, |
||||||||||||||||||||||||||||||||
|
|
|
|
|
которые |
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
|
|
|
|
|
|
|
|
на |
результаты |
|||||||||
|
|
|
|
|
|
считаются выбросами, может заметно повлиять |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
анализа. |
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Наличие выбросов в наборе данных может быть связано с появлением |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
так |
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
значений, |
связанных |
с |
систематической |
|||||||||||||||||
|
|
|
|
|
называемых "сдвинутых" |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ошибкой, ошибок ввода, ошибок сбора данных и т.д. Иногда к выбросам могут |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
Д |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
относиться наименьшие и наибольшие значения набора данных. |
|
|
|
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Корреляционный анализ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
анализ |
применяется для |
количественной оценки |
|||||||||||||||||||
|
|
|
|
|
|
К |
Корреляционный |
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
взаимосвязи двух наборов данных, представленных в безразмерном виде. |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ОКорреляционный анализ дает возможность установить, ассоциированы ли |
||||||||||||||||||||||||||||||||||||
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
|
наборы данных по величине. Для определения наличия взаимосвязи между |
||||||||||||||||||||||||||||||||||||
|
Р |
|
|
|||||||||||||||||||||||||||||||||||||
|
|
|
двумя свойствами используется коэффициент корреляции. Тесноту связи |
|||||||||||||||||||||||||||||||||||||
А |
|
|
|
|||||||||||||||||||||||||||||||||||||
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
определяют по величине коэффициента корреляции, который может принимать значения от -1 до +1 включительно.
Обычно вычисляют коэффициент корреляции Пирсона, который отражает степень линейной зависимости между двумя множествами данных:

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
Здесь x и y - значения признаков, n - число пар данных. |
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
Варианты связи, характеризующие наличие или отсутствие линейной |
||||||||||||||||||||||||||||
|
|
|
|
|
связи между признаками: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
большие значения из одного набора данных связаны с большимиО |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
значениями |
|
|
другого |
|
набора |
(положительная |
|
|
|
|
|
Г |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
корреляцияО) - |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
наличие прямой линейной связи; |
|
|
|
|
|
|
|
|
|
|
К |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
малые значения одного набора связаны с большими значениямиЕ |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
другого (отрицательная |
|
корреляция) |
|
|
|
|
|
|
Ш |
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
- наличие отрицательной |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
линейной связи; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ы |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
данные двух диапазонов никак не связаны (нулевая корреляция) - |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ЧЕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
отсутствие линейной связи. |
|
|
|
|
|
|
. |
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
Любая |
зависимость между |
переменными |
. |
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
обладает двумя важными |
||||||||||||||||||||||||||||
|
|
|
|
|
свойствами: |
величиной |
|
и надежностью. |
Чем |
|
Н |
|
зависимость между |
||||||||||||||||||||||
|
|
|
|
|
|
сильнее |
|
||||||||||||||||||||||||||||
|
|
|
|
|
двумя переменными, |
тем больше |
|
величина |
|
НИ |
|
|
|
|
и тем |
легче |
|||||||||||||||||||
|
|
|
|
|
|
зависимости |
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
предсказать значение одной переменной по значениюМ |
|
другой переменной. |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Величину зависимости легче измерить, чем Тнадежность. |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
, |
насколько вероятно, что эта |
||||||||||
|
|
|
|
|
|
|
Надежность зависимости характеризуетТ |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
С ростом величины |
||||||||
|
|
|
|
|
зависимость будет снова найдена на других данных. |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
зависимости переменных ее надежность обычно возрастает. |
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионный анализ Н |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Основная особенность регрессионного анализа: при его помощи можно |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
получить |
конкретные |
|
сведенияЫ |
о том, какую |
форму и характер |
имеет |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Н |
|
|
переменными. |
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
зависимость между исследуемымиН |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Е |
|
|
этапы регрессионного анализа. |
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
Рассмотрим краткоВ |
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Т |
|
задачи. На этом этапе формируются предварительные |
|||||||||||||||||||||
|
|
|
|
|
|
|
1. ФормулировкаС |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
Р |
|
|
|
исследуемых явлений. |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
гипотезы о зависимостиА |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Д |
|
|
зависимых и независимых (объясняющих) переменных. |
||||||||||||||||||||||
|
|
|
|
|
|
|
2. ОпределениеУ |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. Сбор статистических данных. Данные должны быть собраны для |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
каждой из переменных, включенных в регрессионную модель. |
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
Й |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И4. Формулировка гипотезы о форме связи (простая или множественная, |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
К |
|
|
или нелинейная). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
линейнаяС |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
В |
|
5. Определение функции регрессии (заключается в расчете численных |
||||||||||||||||||||||||||||
|
|
|
|
О |
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
Т |
значений параметров уравнения регрессии) |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
А |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
Р |
|
|
|
|
6. Оценка точности регрессионного анализа. |
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
С |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7. Интерпретация полученных результатов. Полученные результаты регрессионного анализа сравниваются с предварительными гипотезами. Оценивается корректность и правдоподобие полученных результатов.
8. Предсказание неизвестных значений зависимой переменной.
При помощи регрессионного анализа возможно решение задачи прогнозирования и классификации. Прогнозные значения вычисляются путем
40