Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Gubin statist metodi obrabotki.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
6.35 Mб
Скачать

§10. Коэффициент корреляции, его свойства и значимость

После выбора функции как формы корреляционной зависимости между признаками и решается задача, состоящая в определении тесноты связи между ними, в оценке рассеяния относительно линии регрессии значений одного признака для различных значений другого. Для этого используют выборочный коэффициент корреляции , который вычисляют по формуле (53). Линейный коэффициент корреляции изменяется на множестве , то есть . Если , то корреляционная зависимость становится функциональной. При эта зависимость прямая (рис. 6), при связь обратная (рис. 7).

Если , то линейная связь между признаками и отсутствует, но может существовать криволинейная корреляционная связь или нелинейная функциональная.

Оценку тесноты линейной корреляционной связи определяют, пользуясь табл. 22.

Таблица 22

Теснота связи

Величина

Прямая связь

Обратная связь

Линейной

связи нет

Слабая

Средняя

Сильная

Функциональная

Значимость выборочного коэффициента корреляции проверяют по критерию Стьюдента. По опытным данным находят статистику , пользуясь формулой

(59)

Затем по таблице критических точек распределения Стьюдента (приложение) по заданному уровню значимости и числу степеней свободы находят табличное значение двусторонней критической области. Если , то незначимый (мало отличается от нуля) и признаки и некоррелированы. Если , то приходят к выводу о наличии линейной корреляционной связи.

§11. Определение надежности (доверительного интервала) коэффициента корреляции

Коэффициент корреляции, как правило, рассчитывается по данным выборки. Чтобы полученный результат распространить на генеральную совокупность, приходится допустить некоторую ошибку, которую оценивают с помощью средней квадратической ошибки . С помощью производят оценку надежности коэффициента корреляции, построив доверительные интервалы для различных объемов выборки. Пусть число наблюдений пар чисел меньше 50 . В этом случае средняя квадратическая ошибка вычисляется по формуле

, (60)

где — коэффициент парной линейной корреляции, — объем выборки. Доверительный интервал для оценки находят по формуле

(61)

где находят по таблице значений функции Лапласа (приложение).

Если задать надежность , то и .

Если объем выборки , то погрешность для коэффициента корреляции находят также по формуле (60). Затем вычисляют отношение . Если это отношение больше 3, то можно считать, что найденный коэффициент корреляции отражает истинную зависимость между признаками и . Величина является гарантийным минимумом, а величина гарантийным максимумом коэффициента корреляции и доверительный интервал для оценки запишется в виде

(62)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]