4.3 Построение доверительного интервала для коэффициента корреляции

Для выборочных данных вычисляемые показатели тесноты связи выступают в качестве описательных мер. Действительно, коэффициент корреляции для выборки это просто число, которое отражает направление (знак) и тесноту связи переменных. При помощи этого числа мы заменяем объемную диаграмму рассеивания, на которой информация о соотношении переменных представлена более полно. Теряется ли при таком переходе от диаграммы рассеивания к единственному числу какая-то часть информации? Да, безусловно. Тем более, что корреляция по Пирсону -- мера линейной связи, поэтому в ситуациях, когда две переменные находятся даже в однозначном нелинейном соотношении этот показатель будет указывать на отсутствие зависимости. Не анализируя диаграмму рассеивания, мы ошибочно придем к выводу, что связь между переменными отсутствует, тогда как отсутствует лишь линейная связь. Кроме того, на величину коэффициента корреляции (особенно, Пирсона) сильное влияние оказывают выбросы (необычные наблюдения, сильно отличающиеся от остальной массы). Таким образом, коэффициент корреляции, как и всякий индикатор, не лишен недостатков и в некоторых обстоятельствах оказывается неработоспособным.

Получив описательную информацию о связях переменных в выборке, исследователь должен выявить устойчивые закономерности, которые проявляют себя не только в данной выборке, но будут существовать и в генеральной совокупности (объекте), из которой мы извлекли лишь небольшую часть для проведения своих экспериментов. Поэтому требуется от характеристики связи в выборке перейти к тому, что можно сказать о генеральной совокупности на основании данных, полученных в конкретном единичном эксперименте. Для этого служит статистика, с которой мы уже сталкивались, проверяя гипотезы о различи средних.

Чаще всего, вычисляя коэффициент корреляции, исследователь проверяет гипотезу о том, что в генеральной совокупности он не равен нулю. Если истинное значение гораздо меньше, (скажем, 0.2), результаты некоторых экспериментов на выборке не позволят увидеть связь -- выборочные коэффициенты будут в некоторых экспериментах близки к нулю или даже отрицательными. Исследователь, получив такие данные, сделает вывод о том, что получены незначимые корреляции (т.е. в генеральной совокупности связи нет, а слабые отклонения от нуля в выборке обусловлены случайными причинами).

Значимость корреляции в прошлой работе мы определяли на основании вероятности получения наблюдаемого коэффициента в условиях справедливости нулевой гипотезы. Это процедура заключалась в сравнении уровня значимости (P) с заранее установленным уровнем значимости (чаще всего 0,05). Если вероятность наблюдаемого коэффициента меньше этого уровня, то мы можем утверждать - связь в генеральной совокупности не равна нулю и действительно существует.

Однако, следуя этой процедуре, мы можем забыть одну важную вещь. Если выборка очень велика, значимыми становятся уже очень небольшие коэффициенты. Это означает, что объем выборки настолько велик, что позволяет "разглядеть" факт неравенства нулю очень слабой связи в генеральной совокупности. Но для объяснения поведения переменных эта связь не представляет никакого практического интереса.

Для того, чтобы более осмысленно подходить к проверке гипотез, рекомендуется не оценивать значимость, а строить доверительные интервалы для корреляции в генеральной совокупности на основании корреляции, полученной в выборке. В этом случае мы более точно осознаём значение полученных в эмпирическом исследовании результатов.

Для построения доверительных интервалов вокруг значений коэффициентов корреляции мы воспользуемся преобразованием Фишера.

В пакете Excel Microsoft Office или редакторе данных пакета SPSS создайте два столбца с именами R и N (в R вы занесете значения корреляции в выборке, в N -- объем выборки). Создание столбца производится следующим образом: сдвоенным щелчком по заголовку столбца вызовите диалог определения переменной и в поле «Name» введите ее имя).
В созданные столбцы введите значения коэффициентов и объем выборки (см. задание ниже).
Откройте файл синтаксиса с именем FISHER.SPS. Выделите все команды и щелкните по кнопке RUN. По формулам, записанным в файле синтаксиса будут вычислены новые столбцы. Для каждого коэффициента R посмотрите на значения R.L (нижняя граница доверительного интервала для корреляции в генеральной совокупности) и R.H (высшая граница).

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1510 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
29.04.2019708.1 Кб11методичка к ср по системному анализу ПО ИС.doc
#
31.08.20193.7 Mб17МЕТОДИЧКА КЛ ЛАБ часть 2.doc
#
16.12.2018717.82 Кб3Методичка курс ЕОЕГ.doc
#
07.11.20181.33 Mб2Методичка лабы ТОЭ.doc
#
02.05.20191.57 Mб9методичка макро для дпи.doc
#
24.11.2019874.5 Кб4методичка моделирование.doc
#
28.04.2019766.46 Кб4Методичка МЧМ, ПТ, ОМТ для метолургов 2011.doc
#
19.11.20191.57 Mб2методичка МЧМ; МКМ;ОМТ;ТП(ПТТ).rtf
#
19.11.20193.23 Mб3МЕТОДИЧКА ОБД Ч1.doc
#
23.11.2019219.78 Кб6методичка ответы рус.docx
#
18.07.2019210.85 Кб25методичка переработка и качество.docx