
- •Содержание
- •Введение
- •I.Статистический анализ
- •§1.1. Основные понятия выборочного метода
- •§1.2. Законы распределения непрерывных случайных величин. Нормальное распределение
- •§1.3.Оценка параметров распределения
- •§ 1.4. Статистическая проверка гипотез
- •Тесты для самоконтроля Составьте краткие ответы на следующие вопросы
- •Характеристика тестов
- •II. Корреляционный и регрессионный анализ
- •§2.1. Система случайных величин
- •§ 2.2. Основы корреляционного анализа
- •§ 2.3. Регрессия. Линии среднеквадратической регрессии
- •§ 2.4. Выборочное уравнение регрессии
- •§ 2.5. Основы дисперсионного анализа
- •§ 2.6. Нелинейная корреляционная связь
- •Тесты для самоконтроля Составьте краткие ответы на вопросы
- •Характеристика тестов
- •III.Многомерный статистический анализ
- •§3.1. Основные характеристики многомерной генеральной совокупности
- •§ 3.2. Множественная корреляция
- •§ 3.3. Множественное уравнение регрессии
- •Тесты для самоконтроля
- •Характеристика тестов
- •IV. Статистический анализ в Excel
- •§ 4.1.Очистка информации от засорения
- •§ 4.2. Проверка закона распределения.
- •§ 4.3. Корреляционный анализ
- •§4.4. Регрессионный анализ двумерной модели.
- •§4.5. Регрессионный анализ трехмерной модели.
- •V. Содержание и объем курсовой работы
- •VI. Литература
- •Статистические данные.
- •Варианты заданий к работе « Статистический анализ»
§ 2.2. Основы корреляционного анализа
Корреляционным моментом μxy случайных величин X и Y называют математическое ожидание произведения отклонений этих величин от их математических ожиданий :
μxy = M {[ X – M ( X ) ] [ Y – M ( Y ) ]}.
Для дискретных случайных величин
μxy
=
;
для непрерывных величин
μxy
=
Корреляционный момент служит для характеристики связи между величинами X и Y. μxy = 0 , если X и Y независимы. Корреляционный момент имеет размерность, равную произведению размерностей X и Y . Для того, чтобы устранить этот недостаток, вводят новую числовую характеристику – коэффициент корреляции.
Коэффициент корреляции ρxy случайных величин X и Y – это отношение корреляционного момента к произведению средних квадратических отклонений этих величин:
ρxy = μxy / ( σx σy )
Очевидно, что коэффициент корреляции независимых случайных величин равен нулю. Абсолютная величина ρxy не превышает 1 : | ρxy | ≤ 1.
Коэффициент корреляции ρxy – количественная характеристика степени линейной зависимости случайных величин. Чем ближе значение ρxy к 1, тем меньше дисперсия, т.е. отклонение Y от наилучшего линейного приближения вида Y = aX + b.
Две случайные величины называются коррелированными, если их корреляционный момент ( коэффициент корреляции) отличен от нуля. X и Y называются некоррелированными , если их корреляционный момент равен 0. Две коррелированные случайные величины также и зависимы. Обратное не всегда верно, т.е. из зависимости случайных величин еще не следует их коррелированность. Из независимости двух величин следует их некоррелированность, но из некоррелированности еще нельзя сделать вывод о независимости этих величин.
Однако, из некоррелированности нормально распределенных величин вытекает их независимость.
Оценкой
коэффициента корреляции является
выборочный коэффициент корреляции
rxy.
Для его
определения необходимо знать оценки
следующих параметров: M(x),
M(y),
σx,
σy
, т.е.
,
,
sx
, sy
.
rxy
=
При большом числе наблюдений данные группируются и записываются в виде корреляционной таблицы, построенной на основе интервального ряда. Тогда
rxy
=
где x,y – варианты признаков X и Y; nxy – частота пары вариант (x,y) ; n – объем выборки.
Выборочный коэффициент корреляции rxy является оценкой коэффициента корреляции ρxy генеральной совокупности и также как он служит для измерения линейной связи между величинами – количественными признаками X и Y. Если выборка имеет достаточно большой объем и репрезентативна, то заключение о тесноте связи между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность.
Выборочный коэффициент корреляции является точечной оценкой коэффициента корреляции генеральной совокупности. Из равенства нулю выборочного коэффициента корреляции еще не следует равенство нулю самого коэффициента корреляции. Необходимо проверить значимость выборочного коэффициента корреляции r, т.е. установить, достаточна ли его величина для обоснованного вывода о наличии корреляционной связи, и только потом делать выводы. Для этого выдвигают и проверяют нулевую гипотезу H0 : ρ = 0. Предполагая, что случайные величины подчиняются двумерному нормальному распределению, вычисляют статистику
t
= r
,
которая распределена по закону Стьюдента с k = n-2 степенями свободы. По таблице t – распределения находят критическое значение tкр( α, k) при уровне значимости α и степени свободы k. Если │t │≥ tкр , нулевую гипотезу об отсутствии корреляционной связи между признаками X и Y отвергают. В противном случае , когда │t │< tкр , нет оснований отвергать нулевую гипотезу.
Гипотезу H0 : ρ = 0 можно проверить, сравнив значение выборочного коэффициента корреляции с rкр, найденным по таблице Фишера-Йетса по параметрам – уровню значимости α и объему выборки (rкр(0,05; 50) = 0,273). Если │rнабл │> rкр, гипотеза H0 отвергается.
В случае значимого выборочного коэффициента корреляции имеет смысл построение доверительного интервала для коэффициента корреляции ρ. Для оценки коэффициента корреляции нормально распределенной генеральной совокупности ( при n ≥ 50) можно воспользоваться формулой
r
– 3
.