Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii / bmd2.doc
Скачиваний:
103
Добавлен:
29.03.2016
Размер:
1.19 Mб
Скачать

42

2. Основы анализа связей

  1. Предположение о природе связи

Различные методы обработки эмпирических данных направлены на выявление закономерностей, которым подчиняется изучаемое явление. Это означает, что предполагается следующее: если изучаемое явление подвергнуть новому обследованию и получить в результате нового эксперимента, вообще говоря, другую матрицу данных, то после ее обработки теми же методами будут получены совпадающие в некотором смысле результаты.

Естественно, что такое предположение следует обосновать. Обоснование состоит в том, что предполагается справедливой некоторая гипотеза порождения различных матриц данных. Наиболее распространенной из таких гипотез является статистическая гипотеза, согласно которой матрица данных порождается некоторым случайным образом в соответствии с некоторой вероятностной закономерностью.

Простейшая статистическая гипотеза состоит в том, что в n-мерном пространстве признаков существует некоторое распределение вероятностей, и каждая строка исходной матрицы данных порождается в соответствии с этим распределением независимо от других строк.

Справедливость такой гипотезы часто подтверждается на практике, если учесть, что на проявление свойств каждого из признаков влияет большее число случайных воздействий. В таких случаях предполагается, что признаки, измеряемые в ходе эксперимента, образуют систему случайных величин и полностью характеризуются некоторым многомерным законом распределения. Поэтому широко эксплуатируется гипотеза о многомерном нормальном законе распределения. Во многих случаях (но не во всех) многомерное нормальное распределение является хорошим приближением реальных распределений. Это его свойство основано на центральной предельной теореме, согласно которой сумма очень большого числа взаимно независимых случайных величин, влияние каждой из которых ничтожно мало, имеет распределение, близкое к нормальному.

2.2. Нормальное распределение

Многомерное нормальное распределение часто обозначается , где- вектор средних,- ковариационня матрица. Закон распределения записывается как многомерная плотность вероятности

,

где det - определитель ковариационной матрицы

Кратко напомним основные свойства многомерного нормального распределения на примере двухмерного. Это полезно сделать, так как позволит подробнее рассмотреть структуру ковариационной матрицы и потом использовать при геометрической интерпретации ее свойств.

Рассмотрим коэффициент корреляции rijмежду признакамиXiиXjисходной матрицы данныхX:

.

Отсюда . Ковариационная матрица двухмерного нормального распределения имеет вид

Определитель матрицы неотрицателен, так как

Найдем обратную матрицу . В невырожденных случаях, когда, определитель. В этом случае квадратная матрица является невырожденной (неособенной) и имеет обратную матрицу. Из линейной алгебры известно, что квадратная матрицаA-1называется обратной к матрицеA, если, гдеE- единичная матрица. Обратная матрица вычисляется как, где- присоединенная матрица, элементами которой являются алгебраические дополненияAijкаждого элементаaijматрицыA.

Напомним, что при вычеркивании в матрице строкиi и столбцаj для элементаaijоставшиеся строки и столбцы образуют минорMijпорядкаn-1. Алгебраическим дополнением элементаaijназывается его минор со знаком. Тогда

.

Вектор средних выражается как . Преобразуем показатель степени:

.

Тогда плотность распределения имеет вид

выражения, в котором коэффициент корреляции, матожидания и дисперсии признаков X1иX2являются основными числовыми характеристиками распределения. Очевидно, что в случае независимости данных признаковr12 =r = 0, и выполнено условие

.

В случае линейной зависимости данных признаков , и распределениеявляется вырожденным, так как.

Соседние файлы в папке Lektsii