
2 курс допол. информ. для ИСУ / isu
.pdf
ванные на явном определении понятия "кластер", обычно через "максимально допустимый радиус" или "порог существенных связей").
Дискриминантный анализ
Дискриминантным анализом называют совокупность многомерных ста-
тистических методов классификации наблюдений в ситуациях, когда у исследо-
вателей имеются обучающие выборки.
Суть задачи дискриминации (различения) заключается в выработке пра-
вила, согласно которому по наблюдаемому значению (реализации) случайного вектора ( x1 ,..., xk ) объект исследования будут относить к одной из возможных совокупностей Si ( i 1,n ).
Процесс решения задачи дискриминации сводится к переходу от вектора признаков, характеризующих объект исследования, к линейной функции от них
– дискриминантной функции – гиперплоскости, разделяющей выборочные точ-
ки.
121

Резюме
Практически все данные, получаемые в процессе исследования социально-
экономических систем, имеют случайную составляющую.
В общем случае закон распределения случайной величины ξ задается
функцией |
|
|
– функцией распределения случайной величины ξ . |
F ( x) P ξ x |
|||
|
|
|
|
Неотрицательная функция |
p ( x) , при всех значениях x удовлетворяющая усло- |
||
|
x |
|
|
вию F ( x) p (z)d z , |
называется плотностью распределения случайной вели- |
чины ξ .
Случайные величины η и ξ называются независимыми, если закон рас-
пределения одной из них не зависит от того, какое значение приняла другая.
Основными числовыми характеристиками случайной величины являют-
ся функционалы распределения ее вероятностей – математическое ожидание
|
|
|
|
|
|
|
|
|
|
M(ξ ) (в |
непрерывном |
случае M( ξ ) |
x p ( x) d x , |
в дискретном |
– |
||||
|
|
|
|
|
|
|
|
|
|
M(ξ ) xi Pi ) |
и дисперсия |
D(ξ ) M(ξ M(ξ )) |
(в |
непрерывном случае |
|||||
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D(ξ ) ( x M( ξ ))2 p ( x) d x , |
в |
дискретном |
– |
D(ξ ) ( xi M( ξ ))2 Pi |
). |
||||
|
|
|
|
|
|
|
|
i |
|
|
σξ |
|
|
||||||
Величина |
D(ξ ) называется среднеквадратическим отклонением слу- |
чайной величины ξ .
Кнаиболее известным методам статистического анализа относятся:
регрессионный анализ;
корреляционный анализ;
канонический анализ;
метод главных компонентов;
факторный анализ;
дисперсионный анализ;
ковариационный анализ;
122
кластерный анализ;
дискриминантный анализ.
Для выявления функциональной зависимости между двумя или более пе-
ременными по экспериментальным данным используют методы регрессионного и корреляционного анализа. Регрессионный анализ помогает построить, исходя из экспериментальных данных, аппроксимирующую функцию (функцию регрес-
сии), соответствующую исследуемой зависимости, а корреляционный анализ – проверить, насколько хорошо экспериментальные данные согласуются с этим уравнением.
Одним из важнейших понятий математической статистики является кор-
реляция. В самом общем случае под корреляцией понимается связь между яв-
лениями, когда одно из них входит в число причин, определяющих другие, или когда имеются общие причины, воздействующие на эти явления. Однако чаще всего корреляцией называется вероятностная (стохастическая) зависимость ме-
жду случайными величинами, не имеющая строго функционального характера.
Из показателей, характеризующих зависимость между случайными вели-
чинами, наиболее известны ковариация и коэффициент корреляции.
Случайные величины, коэффициент корреляции которых равен 0, называ-
ются некоррелированными. Некоррелированные величины являются независи-
мыми.
С помощью измерения статистической связи между изучаемыми явления-
ми можно определить, как повлияло бы на функцию изменение одного из ее ар-
гументов, если бы другие аргументы оставались неизменными, и оценить сте-
пень искажающего влияния посторонних факторов на изучаемую зависимость.
Установить наличие или отсутствие связи между изучаемыми явлениями или величинами, а также количественно оценить уровень этой связи позволяет корреляционный анализ.
При исследовании структуры корреляционных связей между двумя сово-
купностями случайных величин применяется канонический анализ.
123
Для определения общих факторов (компонентов), от которых зависит множество случайных значений нескольких изучаемых показателей, применя-
ется метод главных компонентов.
Главная задача факторного анализа как раздела многомерного статисти-
ческого анализа заключается в снижении размерности исследуемого многомер-
ного признака. Предполагается, что большинство наблюдаемых или измеряемых показателей только косвенно характеризует закономерности, присущие изучае-
мым явлениям (объектам), и что в действительности существует лишь неболь-
шое число существенных параметров – факторов, которые и определяют значе-
ния наблюдаемых показателей.
С помощью дисперсионного анализа оценивается влияние качественных факторов на математическое ожидание случайной величины по характеристикам ее рассеяния (дисперсии).
Ковариационный анализ применяется в тех случаях, когда в изучаемом процессе присутствуют одновременно качественные и количественные факторы.
Под кластерным анализом понимается совокупность многомерных стати-
стических методов, предназначенных для формирования относительно отдален-
ных друг от друга групп однородных объектов по информации о расстояниях или связях между ними.
Дискриминантным анализом называют совокупность многомерных стати-
стических методов классификации наблюдений в ситуациях, когда у исследова-
телей имеются обучающие выборки.
124
Вопросы для повторения
1.Что такое случайное событие?
2.Что такое случайная величина?
3.Что такое случайный процесс?
4.Что такое вероятность?
5.Что такое функция распределения случайной величины?
6.Что такое плотность распределения случайной величины?
7.Какие величины называются независимыми?
8.Чему равна вероятность совместного осуществления двух независимых случайных событий?
9.Чему равна вероятность совместного осуществления двух зависимых слу-
чайных событий?
10.Что такое математическое ожидание случайной величины?
11.Что такое дисперсия случайной величины?
12.Перечислите основные методы статистического анализа.
13.В чем суть регрессионного анализа?
14.Что такое регрессионная модель?
15.Что такое корреляция?
16.Какие показатели характеризуют зависимость между случайными величи-
нами?
17.Какие величины называются некоррелированными?
18.Что такое автокорреляционная функция?
19.Что такое взаимная корреляционная функция?
20.Какие задачи решает корреляционный анализ?
21.Когда применяется канонический анализ?
22.Как выглядит ковариационная матрица канонических случайных величин?
23.Что определяют с помощью метода главных компонентов?
24.В чем заключается главная задача факторного анализа?
25.Чем характеризуется основная модель факторного анализа?
26.Когда применяется дисперсионный анализ?
125
27.На чем основано применение дисперсионного анализа?
28.Когда применяется ковариационный анализ?
29.С какой целью проводится кластерный анализ?
30.Какую задачу решает дискриминантный анализ?
126
Тест по теме
1.Регрессионный анализ помогает
1)построить, исходя из экспериментальных данных, аппроксимирующую функцию, соответствующую исследуемой зависимости;
2)установить наличие или отсутствие связи между изучаемыми явлениями или величинами, а также количественно оценить уровень этой связи;
3)исследовать структуру корреляционных связей между двумя совокупностя-
ми случайных величин.
2.Корреляционный анализ помогает
1)построить, исходя из экспериментальных данных, аппроксимирующую функцию, соответствующую исследуемой зависимости;
2)установить наличие или отсутствие связи между изучаемыми явлениями или величинами, а также количественно оценить уровень этой связи;
3)исследовать структуру корреляционных связей между двумя совокупностя-
ми случайных величин.
3.Канонический анализ помогает
1)построить, исходя из экспериментальных данных, аппроксимирующую функцию, соответствующую исследуемой зависимости;
2)установить наличие или отсутствие связи между изучаемыми явлениями или величинами, а также количественно оценить уровень этой связи;
3)исследовать структуру корреляционных связей между двумя совокупностя-
ми случайных величин.
4.Метод главных компонентов помогает
1)определить общие факторы, от которых зависит множество случайных зна-
чений нескольких изучаемых показателей;
2)снизить размерность исследуемого многомерного признака;
3)оценить влияние качественных факторов на математическое ожидание слу-
чайной величины.
5.Факторный анализ помогает
1)определить общие факторы, от которых зависит множество случайных зна-
чений нескольких изучаемых показателей;
2)снизить размерность исследуемого многомерного признака;
127
3)оценить влияние качественных факторов на математическое ожидание слу-
чайной величины.
6.Дисперсионный анализ помогает
1)определить общие факторы, от которых зависит множество случайных зна-
чений нескольких изучаемых показателей;
2)снизить размерность исследуемого многомерного признака;
3)оценить влияние качественных факторов на математическое ожидание слу-
чайной величины.
7.Ковариационный анализ помогает
1)в тех случаях, когда в изучаемом процессе присутствуют одновременно ка-
чественные и количественные факторы;
2)формировать относительно отдаленные друг от друга группы однородных объектов по информации о расстояниях или связях между ними;
3)производить классификацию наблюдений в ситуациях, когда у исследова-
телей имеются обучающие выборки.
8.Кластерный анализ помогает
1)в тех случаях, когда в изучаемом процессе присутствуют одновременно ка-
чественные и количественные факторы;
2)формировать относительно отдаленные друг от друга группы однородных объектов по информации о расстояниях или связях между ними;
3)производить классификацию наблюдений в ситуациях, когда у исследова-
телей имеются обучающие выборки.
9.Дискриминантный анализ помогает
1)в тех случаях, когда в изучаемом процессе присутствуют одновременно ка-
чественные и количественные факторы;
2)формировать относительно отдаленные друг от друга группы однородных объектов по информации о расстояниях или связях между ними;
3)производить классификацию наблюдений в ситуациях, когда у исследова-
телей имеются обучающие выборки.
10.Построить аппроксимирующую функцию, соответствующую исследуемой зависимости, помогает
1)канонический анализ;
128
2)корреляционный анализ;
3)регрессионный анализ.
11.Установить наличие или отсутствие связи между изучаемыми явлениями или величинами, а также количественно оценить уровень этой связи помогает
1)канонический анализ;
2)корреляционный анализ;
3)регрессионный анализ.
12.Исследовать структуру корреляционных связей между двумя совокупностя-
ми случайных величин помогает
1)канонический анализ;
2)корреляционный анализ;
3)регрессионный анализ.
13.В тех случаях, когда в изучаемом процессе присутствуют одновременно ка-
чественные и количественные факторы, применяется
1)дискриминантный анализ;
2)кластерный анализ;
3)ковариационный анализ.
14.Для формирования относительно отдаленных друг от друга групп однород-
ных объектов по информации о расстояниях или связях между ними применя-
ется
1)дискриминантный анализ;
2)кластерный анализ;
3)ковариационный анализ.
15.Для классификации наблюдений в ситуациях, когда у исследователей име-
ются обучающие выборки, применяется
1)дискриминантный анализ;кластерный анализ;ковариационный анализ.
16.Для оценки влияния качественных факторов на математическое ожидание
случайной величины применяется
1)метод главных компонентов;
2)факторный анализ;
3)дисперсионный анализ.
129
17. Для снижения размерности исследуемого многомерного признака применя-
ется
1)метод главных компонентов;
2)факторный анализ;
3)дисперсионный анализ.
18.Для определения общих факторов, от которых зависит множество случайных значений нескольких изучаемых показателей, применяется
1)метод главных компонентов;
2)факторный анализ;
3)дисперсионный анализ.
130