Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы информатика(1).docx
Скачиваний:
711
Добавлен:
23.02.2016
Размер:
2.18 Mб
Скачать

11.Ошибка выборочного коэффициента линейной корреляции. Проверка гипотезы о значимости выборочного коэффициента линейной корреляции.

Проверка гипотезы о значимости выборочного коэффициента линейной корреляции.

это ответ на вопрос существует ли вообще эта связь. Эмпирический коэффициент корреляции, как и любой другой выборочный показатель, служит оценкой своего генерального параметра. Выборочный коэффициент линейной корреляции rв – величина случайная, так как он вычисляется по значениям переменных, случайно попавшим в выборку из генеральной совокупности, а значит, как и любая случайная величина имеет ошибку mr. Чтобы выяснить находятся ли случайные величины X и Y генеральной совокупности в линейной корреляционной зависимости, надо проверить значимость rв

Для этого проверяют нулевую гипотезу о равенстве нулю коэффициента корреляции генеральной совокупности Н: rген = 0, то есть линейная корреляционная связь между признаками X и Y случайна. Выдвигается альтернативная гипотеза Н1: rген ≠ 0. ,т.е. эта линейная корреляционная связь имеется. Задаётся уровень значимости, например, α≤0,05 Критерием для проверки нулевой гипотезы является отношение выборочного коэффициента корреляции к своей ошибке:

где mr – ошибка коэффициента корреляции. Если объем выборки n<100, то mr = формуле (1), если n>100, то формуле (2). Число степеней свободы проверки критерия равно f=n-2. Гипотезу проверяют по таблицам распределения Стьюдента в соответствии с выбранным уровнем значимости. По таблице критических точек распределения Стьюдента находим tкрит (α,f), определённое на уровне значимости α≤0,05 при числе степеней свободы f=n-2, где n – объём двумерной выборки.

Если tнабл>tкрит →Н1 – отвергают нулевую гипотезу и принимают альтернативную: : rген ≠ 0, имеется линейная корреляционная связь между признаками.

Если tнабл<tкрит ,то нет оснований отвергать нулевую гипотезу, а rв статистически незначим. эта связь случайна.

12. Выборочное уравнение линейной регрессии. Нелинейная регрессия. Коэффициент корреляции рангов Спирмена.

Регрессионный анализ имеет в своем распоряжении специальные процедуры проверки, является ли выбранная математическая модель адекватной для описания имеющихся данных.

Чаще всего регрессионный анализ используется для прогноза, то есть предсказания значений ряда зависимых переменных по известным значениям других переменных.

Регрессияэто функция, позволяющая по величине одного признака Х находить среднее ожидаемое (должное) значение другого признака Y, корреляционно связанного с Х.

В линейной математической модели уравнение линейной регрессии имеет вид:

=ax+b,

где a и b – параметры линейной регрессии

Если график регрессии =f(х) изображается кривой, то это не линейная регрессия.

Выбор вида уравнения регрессии производится на основании опыта предыдущих исследований, литературных источников, профессионального мнения и визуального наблюдения расположения точек корреляционного поля. Этот очень важный этап анализа называется спецификацией.

Для определения неизвестных параметров регрессии используется метод наименьших квадратов.

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

1) Сопоставить каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).

2) Определить разности рангов каждой пары сопоставляемых значений.

3) Возвести в квадрат каждую разность и суммировать полученные результаты.

4) Вычислить коэффициент корреляции рангов по формуле:.

где - сумма квадратов разностей рангов, а - число парных наблюдений.

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Соседние файлы в предмете Медицинская информатика