Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
математика / РАЗДЕЛ 3 Элементы математической статистики.doc
Скачиваний:
187
Добавлен:
18.05.2015
Размер:
1.47 Mб
Скачать

Свойства коэффициента корреляции

Свойство 1.Абсолютная величина выборочного коэффициента корреляции не превосходит единицы.

.

В зависимости от того, насколько приближается к 1, различают слабую, умеренную и сильную связь, т.е. чем ближе к 1, тем теснее связь.

Свойство 2.Если выборочный коэффициент корреляции равен нулю и выборочные линии регрессии – прямые, тоXиYне связаны линейной корреляционной зависимостью.

Свойство 3.Если абсолютная величина выборочного коэффициента корреляции равна единице, то наблюдаемые значения признака связаны линейной функциональной зависимостью.

Свойство 4.Если переменныеXиYумножить на одно и то же число, то коэффициент корреляции не изменится.

Из приведенных свойств вытекает смысл :выборочные коэффициент корреляции характеризует тесноту линейной связи между количественными признаками в выборке: чем ближе к 1, тем связь сильнее; чем ближе к 0, тем связь слабее.

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распределена и на генеральную совокупность.

Если график регрессии илиизображается кривой линией, то корреляцию называюткриволинейной.

Например, функции регрессии YнаXмогут иметь вид:

(параболическая корреляция второго порядка);

(параболическая корреляция третьего порядка);

(гиперболическая корреляция).

Теория криволинейной корреляции решает те же задачи, что и теория линейной корреляции (установление формы и тесноты корреляционной связи).

Неизвестные параметры уравнения регрессии находят методом наименьших квадратов. Для оценки тесноты криволинейной корреляции служат выборочные корреляционные отношения.

5. Элементы дисперсионного анализа

Дисперсионный анализ был предложен Р. Фишером для решения некоторых задач в области биологических исследований, в частности в сельскохозяйственной статистике. В настоящее время дисперсионный анализопределяется какстатистический метод, предназначенный дляоценки влияния различных факторов на результат эксперимента, в связи с чем область применения этого метода становится значительно шире.

Результатом эксперимента является некоторая случайная величина , называемая такжерезультативным признаком. На значения случайной величинывлияет фактор, состоящий из несколькихуровнейилигрупп.

Как было отмечено выше, в прикладных задачах статистического анализа зависимость между входными переменными и выходной переменнойносит стохастический характер. При изучении стохастических зависимостей в задачах техники, экономики и т.д. одним из главных моментов являетсяустановление вида зависимости от, т.е. вида уравнения регрессии – это задачирегрессионного анализ. Это связано в первую очередь с необходимостью прогнозирования исследуемых процессов.

В регрессионном анализе изучаются модели вида

, (5.1)

где неслучайная независимая переменная, называемаяфактором;случайная зависимая переменная (результативный признак);случайная переменная, характеризующая отклонение от линии регрессии (остаточная переменная).

Для того чтобы установить, соответствует ли выбранная регрессионная модель (5.1) экспериментальным данным, используют основное уравнение дисперсионного анализа:

, (5.2)

где

 общая сумма квадратов отклоненийот средней, (5.3)

 сумма квадратов, обусловленная регрессией, (5.4)

 остаточная сумма квадратов. (5.5)

Для несруппированной выборки формулы (5.3) (5.5) несколько упрощаются:

 общая сумма квадратов отклоненийот средней, (5.6)

 сумма квадратов, обусловленная регрессией, (5.7)

 остаточная сумма квадратов. (5.8)

Данные в корреляционных таблицах можно рассматривать как случайные выборки соответствующих генеральных совокупностей по некоторым признакам и. Статистические числовые характеристики, полученный по данной выборки, являются оценками для числовых характеристикгенеральной совокупности. Выборочный коэффициент корреляциии выборочные коэффициенты регрессииипри нормальном распределении случайных величинитакже можно рассматривать в качестве оценок соответствующих коэффициентови.

Так как рассмотренная выборка отобрана случайна, то еще нельзя заключить, что коэффициент корреляции генеральной совокупности также отличен от нуля.

При заданном уровне значимости проверим нулевую гипотезуH0.

H0: равенство нулю генерального коэффициента корреляции, т.е..

Конкурирующая гипотеза H1:.

Если нулевая гипотеза будет отвергнута, то это значит, что выборочный коэффициент корреляции значимо отличается от нуля, а X иYкоррелированны, т.е. связаны линейной зависимостью. Если нулевая гипотеза будет принята, то выборочный коэффициент корреляции незначим, аXиYнекоррелированы, т.е. не связаны линейной зависимостью.

Для проверки нулевой гипотезы найдем статистику по следующей формуле:

,

где инаходят по формулам (5.7) и (5.8);n– число наблюдений;l– число групп в корреляционной таблице или число оцениваемых параметров в несгруппированной выборке.

Для заданного уровня значимости находят критическое значение распределениеФишера пристепенях свободы.

Если , то уравнение линейной регрессии значимо. Принимаем конкурирующую гипотезуH1:.

Пример 5.1.Экспериментальная зависимость признакаYот фактораXимеет вид:

Xi

2

3

3,5

4

5

6

7

8

Yi

2

1,9

2,1

2,2

2,4

2,3

2,5

2,5

Требуется:

1) найти уравнение линейной регрессии ;

2) найти выборочный коэффициент корреляции ;

3) выяснить значимость уравнения регрессии при ;

4) построить линию регрессии и экспериментальные точки .

Решение.

1) Коэффициенты иbуравнения линейной регрессии находятся по следующим формулам:

;

,

где число наблюдений. В нашем случае.

Чтобы определить коэффициенты иb, а так же коэффициент корреляции ,составляем расчетную таблицу.

Тогда получаем

;

.

Итак, уравнение линейной регрессии имеет вид:

.

2) Выборочный коэффициент корреляции находится по следующей формуле:

.

Тогда получаем

.

3) Выше получили, что коэффициент корреляции .

Так как рассмотренная выборка отобрана случайна, то еще нельзя заключить, что коэффициент корреляции генеральной совокупности также отличен от нуля.

При заданном уровне значимости проверим нулевую гипотезуH0.

H0: равенство нулю генерального коэффициента корреляции, т.е..

Конкурирующая гипотеза H1:.

Если нулевая гипотеза будет отвергнута, то это значит, что выборочный коэффициент корреляции значимо отличается от нуля, а X иYкоррелированны, т.е. связаны линейной зависимостью. Если нулевая гипотеза будет принята, то выборочный коэффициент корреляции незначим, аXиYнекоррелированы, т.е. не связаны линейной зависимостью.

Для проверки нулевой гипотезы найдем статистику по следующей формуле:

,

где сумма квадратов, обусловленная регрессией;

 остаточная сумма квадратов;

n– число наблюдений;

l– число групп в корреляционной таблице или число оцениваемых параметров в несгруппированной выборке.

Для определения статистики tсоставляем расчетную таблицу.

Значения находим из уравнения регрессии, подставляя соответствующие значения. Среднюю выборочнуюнаходим следующим образом:

.

Итак, получаем .

В нашем случае число наблюдений . Поскольку рассматривается линейная регрессия, точисло оцениваемых параметров.

При по таблицам распределения Фишера находим.

Вычисляем статистику.

.

Так как , то уравнение линейной регрессии значимо. Принимаем конкурирующую гипотезуH1:.

4) Строим линию регрессии и экспериментальные точки .