Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
85-96.DOC
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
741.89 Кб
Скачать

98

равную сумме рангов второй выборки.

Если распределение второй выборки сдвинуто вправо относительно первой (альтернативная гипотеза то статистика K будет принимать значения, большие критического и гипотеза отвергается в пользу альтернативы

Если рассматривается альтернатива то гипотеза отвергается, если выполняется одно из двух условий: или

Пример 2. В биохимическом исследовании, проведенном методом меченных атомов, по результатам изучения 7 препаратов опытной группы получены следующие показания счетчика импульсов (в импульсах в минуту): 340, 343, 322, 332, 320, 313, 304. Результаты контрольной группы: 318, 321, 318, 301, 312.

Можно ли считать, что полученные значения опытной и контрольной групп различны

Решение. Сформулируем основную и альтернативную гипотезы.

— выборки однородны; различия в результатах опытной и контрольной групп можно отнести на счет случайных воздействий.

— выборки извлечены из генеральных совокупностей с разными распределениями; различие между контрольной и опытной группами существенно.

Объединим выборки и расположим полученные данные в порядке возрастания: — здесь подчеркнуты элементы второй выборки (контрольной группы). Занумеровав все элементы в порядке возрастания, получим ранговую последовательность: — подчеркнуты ранги контрольной группы.

Наблюдаемое значение статистики Вилкоксона равно

Критическая область является двусторонней, ее правая граница при (табл. 6.10)

,

левая граница

.

Наблюдаемое значение попадает в критическую область: поэтому основная гипотеза отвергается в пользу альтернативной.

Итак, на уровне значимости 0.1 можно утверждать, что разница между показаниями счетчика в контрольной и опытной группах существенна.

Таблица 6.10

Критические точки критерия Вилкоксона при

5

7

9

10

5

36

44

51

54

7. Корреляционный и регрессионный анализ

7.1. Основные задачи

В этом разделе мы рассмотрим виды и формы связей, различаемые в статистике. Связи между различными явлениями и их признаками можно разделить на два типа: функциональные и стохастические. Если два признака X и Y связаны функциональной зависимостью, то по значению одного из них можно точно указать значение другого. Например, зная рост X в сантиметрах наугад взятого человека, можно указать его рост Y в метрах. Стохастическая связь проявляется не в каждом отдельном случае, а в среднем при большом числе наблюдений. Если X — рост наугад взятого человека в сантиметрах, то — вес в килограммах. Изучение такого вида связей — предмет исследования корреляционного и регрессионного анализа. При этом независимый признак X называется фактором, а зависимый Yоткликом.

Основные задачи корреляционного анализа:

  1. выяснить, есть ли связь между двумя признаками;

  2. измерить силу этой связи;

  3. отобрать факторы, оказывающие наиболее сильное влияние на отклик.

В задачи регрессионного анализа входят следующие:

  1. описание формы зависимости;

  2. нахождение коэффициентов уравнения, описывающего зависимость, и оценка их точности;

  3. оценка качества полученной зависимости (адекватность модели).

7.2. Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона измеряет тесноту линейной связи между переменными X и Y

и обладает следующими свойствами.

Для любых переменных X и Y его абсолютная величина не превосходит единицы:

Значение коэффициента корреляции равно +1 или –1 тогда и только тогда, когда между переменными X и Y существует линейная функциональная связь

Если переменные X и Y независимы, то Если то переменные X и Y называются некоррелированными. Некоррелированность переменных означает отсутствие между ними линейной стохастической зависимости, но не означает отсутствия связи вообще.

Точечной оценкой коэффициента корреляции является выборочный коэффициент корреляции который можно рассчитывать по формулам:

где — независимая выборка объема n из двумерной генеральной совокупности;

— средние арифметические значения (выборочные средние) переменных X и Y;

— выборочные средние квадратические отклонения переменных X и Y.

Коэффициент корреляции , рассчитанный по выборке, является значением случайной величины . С увеличением числа наблюдений (свыше 500) распределение величины стремится к нормальному. С уменьшением числа наблюдений надежность этой оценки падает. Поэтому после вычисления оценки встает вопрос о значимости коэффициента корреляции.

Значимость коэффициента корреляции проверяется с помощью статистики, имеющей распределение Стьюдента (табл. 7.1).

Таблица 7.1

Проверка значимости коэффициента корреляции Пирсона

Гипотеза

Предположение

Двумерная нормальная генеральная совокупность

Оценки по выборке

Статистика К

Распределение статистики К

Стьюдента

Пример 1. Проводится изучение зависимости массы монеты Y в граммах от времени обращения X (число лет обращения).

По результатам десяти наблюдений (табл. 7.2) выяснить, значима ли корреляция между массой монеты и временем ее обращения.

Решение. Рассчитаем по выборке объема (табл. 7.2) оценки средних и дисперсий

Таблица 7.2

Данные примера 1

i

1

2

3

4

5

6

7

8

9

10

(лет)

5

9

14

17

23

31

35

42

46

50

(г)

2.82

2.85

2.8

2.8

2.79

2.78

2.77

2.79

2.75

2.72

По формуле (7.1) получим значение выборочного коэффициента корреляции — можно предполагать достаточно сильную линейную отрицательную зависимость между массой монеты и возрастом ее обращения. Так как выборка малого объема, проверим значимость коэффициента корреляции.

Основная гипотеза состоит в том, что коэффициент корреляции не значим т.е. между переменными X и Y нет линейной связи. Альтернативная гипотеза — коэффициент корреляции значим, переменные X и Y связаны отрицательной линейной зависимостью.

Наблюдаемое значение статистики K (табл. 5.1) равно

Зададим уровень значимости и определим границу критической области по таблице распределения Стьюдента. По виду альтернативной гипотезы заключаем, что критическая область является левосторонней: Значение находим по таблице распределения Стьюдента (приложение 3):

Наблюдаемое значение попадает в критическую область поэтому основную гипотезу следует отвергнуть в пользу альтернативы: связь между переменными X и Y значима.

Данные наблюдений на уровне значимости 0.01 говорят о том, что масса монеты в среднем линейно убывает при увеличении возраста монеты.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]