Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АОЭД(лекции).doc
Скачиваний:
26
Добавлен:
13.09.2019
Размер:
1.37 Mб
Скачать

6.4Минимальный объем выборки для точной оценки коэффициента корреляции

Можно рассчитать объем выборки для задания значения коэффициента корреляции, вычтенного на малообъемных выборках, который был бы достаточен для опровержения нулевой гипотезы (если корреляция между признаками действительно существует).

Для этого:

где

n – искомый объем выборки,

t – величина, заданная по принятому уровню значимости (α=1–5%),

z – преобразованный эмпирический коэффициент корреляции.

6.5Вычисление коэффициента корреляции при больших выборках

При наличии многочисленных исходных данных их приходиться группировать в вариативные ряды и, построив вариативную решетку, разносить по ее ячейкам общие частоты сопряженных рядов. Образуется корреляционная решетка пересечением строк и столбцов, число которых равно числу групп или классов корреляционных рядов. Классы располагаются в верхней строке и в первом (слева) столбце корреляционной таблицы, а общие частоты fxy – в клетках корреляционной решетки, составляющей основную часть корреляционной таблицы.

Классы, помещаемые в верхней строке таблицы, обычно располагаются слева направо в возрастающем порядке, а в первом столбце таблицы – сверху вниз в убывающем. Если частоты fxy распределены по клеткам корреляционной решетки более или менее равномерно, не образуя эллипса, это указывает на отсутствие корреляции между признаками.

Распределение частот fxy по клеткам корреляционной решетки дает лишь общее представление о наличии или отсутствии связей между признаками. Судить о тесноте и силе связей более точно можно по значению и знаку коэффициента корреляции. При вычислении коэффициента корреляции не следует брать слишком широкие классовые интервалы. Между числом классов и величиной классового интервала λ существует определенное соотношение. В общем виде оно выражается формулой, в которой знаменатель к находиться в зависимости от объема выборки n.

Величину к можно поставить в зависимость от объема выборки т.о.

Объем выборки n

Значение к=

30 < n ≤ 50

к =1+3,32*lg n

50 < n ≤ 100

к =5* lg n

100 < n ≤ 200

к =7*lg n

200 < n ≤ 300

к =8*lg n

Как и другие статистические характеристики коэффициент корреляции определяют разными способами, дающими совершенно идентичные результаты.

Способ произведения. Упрощая символику, отклонение вариант от их средних обозначим через а, т.е. и . Тогда формула для коэффициента корреляции с учетом повторяемости отклонений будет иметь вид

6.6Оценка разности между коэффициентами корреляции

При сравнении коэффициентов корреляции двух независимых выборок нулевая гипотеза сводится к предположению о том, что в генеральной совокупности разница между этими показателями равна нулю. Т.е. разница, наблюдаемая между сравниваемыми эмпирическими коэффициентами корреляции, возникла случайно.

Для проверки этой нулевой гипотезы служит t-критерий Стьюдента, т.е. отношение разности между эмпирическими коэффициентами корреляции r1 и r2 к своей статистической ошибке, определенной по формуле:

, где – ошибки сравниваемых коэффициентов.

Нулевая гипотеза опровергается при условии:

Для принятого уровня значимости α и числа степеней свободы к

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]