Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Stat_metod.doc
Скачиваний:
7
Добавлен:
10.09.2019
Размер:
4.6 Mб
Скачать

17. Проверка надежности результатов корреляционного анализа

Анализируемые ряды динамики являются почти всегда выборками из более длинных рядов. Поэтому необходима всесторонняя проверка надежности результатов корреляционного и регрессионного анализа. Основой проверки является теория выборочного наблюдения.

Значение коэффициента корреляции r является случайной величиной, которая зависит от объема выборки. При увеличении объема числовой информации распределение выборочного коэффициента корреляции приближается к нормальному.

В практике анализа используемые ряды динамики представляют собой малые выборки. Следует отметить, что оценки, полученные на основе коротких рядов, не имеют особенного значения в качестве характеристик фактических параметров. Одни оценки могут быть лучше других, но ни одна из них не является совершенно надежной. Сказанное особенно относится к выборкам из совокупностей, не подчиненных нормальному распределению.

Несмотря на это, необходима оценка результатов анализа даже при малых выборках. При этом конечной целью является не оценивание фактических параметров (коэффициентов корреляции и регрессии), а проверка, варьируются ли найденные параметры в некотором интервале за счет влияния случайных факторов или нет.

Например, если надо проверить надежность коэффициента корреляции, то это не означает, что мы должны определить его величину в генеральной совокупности. Наша цель имеет более общий характер: можем ли мы получить такой коэффициент корреляции на основе выборки из совокупности, где корреляции нет, т. е. проверка надежности корреляции в совокупности.

Полученные результаты и выводы являются правильными только при нормально распределенных совокупностях. Но практические результаты показывают, что допустимо некоторое удаление от нормального распределения. Однако, если есть основание предполагать, что распределение существенно отличается от нормального, то результаты корреляционного и регрессионного анализа не противостоят критике.

Выше изложенное, конечно, не означает, что при распределениях, отличных от нормального, связи между явлениями нет. Дело в том, что методика исследования связей в таких совокупностях связана с существенными математическими трудностями.

И еще одно обстоятельство. При малых выборках надежность оценивается с более низкой вероятностью, чем в больших выборках. Обычно ограничиваются 95%-ной вероятностью оценки (вероятность ошибки — уровень значимости— 5%).

Критерий Стьюдента. Рассмотрим применение t-критерия для проверки надежности результатов корреляционного анализа. Пусть извлечена выборка объема N, и вычислен выборочный коэффициент корреляции r. Для проверки существенности линейной корреляции определяется величина . Поверка нулевой гипотезы (отсутствие линейной корреляции) состоит в сравнении значения tr с табличным значением критической точки распределения Стьюдента при заданном уровне значимости и числе степеней свободы N-2.

Если tr< , то гипотеза об отсутствии линейной связи принимается;

Если tr , то гипотеза об отсутствии линейной связи отвергается.

Пример: проверить с надежностью 95% гипотезу о наличии линейной связи между стоимостными показателями X и Y.

Стоимость,X

12

10

14

15

16

20

22

21

24

26

Стоимость,Y

30

27

20

32

24

18

40

14

60

25

Построим вспомогательную таблицу

Стоимость, X

Стоимость, Y

(X-Xср)2

(Y-Yср)2

XY

12

30

36

1

360

10

27

64

4

270

14

20

16

81

280

15

32

9

9

480

16

24

4

25

384

20

18

4

121

360

22

40

16

121

880

21

14

9

225

294

24

60

36

961

1440

26

25

64

16

650

Средние

18

29

25,8

156,4

539,8

Найдем коэффициент линейной корреляции r=0,28 и вычислим критерий Стьюдента . По таблице критических точек распределения Стьюдента находим . Поскольку , то с надежностью 95% можно утверждать, что линейной связи между показателями X и Y не наблюдается.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]