Регрессионный анализ
ЛИНЕЙН(известные_значения_y;известные_значения_x; конст; статистика) LINEST( known_y's, [known_x's], [const], [stats] )
Возвращается массив, который задает линейное уравнение регрессии признака Y на признак Х, а также дополнительные статистические данные.
Уравнение для регрессии в виде прямой линии имеет следующий вид:
Y = mx + b или Y = m1x1 + m2x2 + ... + b (в случае нескольких независимых признаков x1, х2, …).
Зависимое значение Y является функцией независимого значения Х. Значения mi — коэффициенты, соответствующие каждой независимой переменной xi, а b — свободный коэффициент. Y, Х и m могут быть скалярами или векторами. Функция ЛИНЕЙН возвращает массив {mn;mn-1;...;m1;b} – коэффициенты линейного уравнения регрессии и свободный член.
Известные_значения_y — множество значений y. Известные_значения_x — множество значений x.
-
Если известные_значения_x опущены, то предполагается, что это массив {1;2;3;...} такого же размера, как и известные_значения_y.
Конст — это логическое значение, которое указывает, требуется ли, чтобы константа b была равна 0.
-
Если аргумент конст имеет значение ИСТИНА или опущено, то b вычисляется обычным образом.
-
Если аргумент конст имеет значение ЛОЖЬ, то b полагается равным 0 и значения m подбираются так, чтобы выполнялось соотношение
y = mx.
Статистика — это логическое значение, которое указывает, требуется ли вернуть дополнительную статистику по регрессии.
-
Если аргумент статистика имеет значение ИСТИНА, то функция ЛИНЕЙН возвращает дополнительную регрессионную статистику, так что возвращаемый массив будет иметь вид: {mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid}.
-
Если аргумент статистика имеет значение ЛОЖЬ или опущена, то функция возвращает только коэффициенты m и постоянную b.
ПРЕДСКАЗ(x;известные_значения_y;известные_значения_x)
FORECAST(x,known_y's,known_x's )
Вычисляет или предсказывает значение признака Y по существующим значениям. Значение Y предсказывается с использованием уравнения линейной регрессии, которое определяется по имеющимся выборочным данным: (Известные_значения_x, Известные_значения_y).
X - это значение признака Х, для которого предсказывается значение признака Y.
Известные_значения_y - это зависимый массив или интервал данных.
Известные_значения_x - это независимый массив или интервал данных.
Пробный вариант самостоятельной работы на EXEL
Имеется выборка пары признаков (Х,Y), представленная в виде несгруппированного вариационного ряда.
|
X |
-3 |
-1 |
4 |
8 |
11 |
14 |
15 |
18 |
19 |
20 |
22 |
25 |
26 |
28 |
|
Y |
2 |
1 |
0 |
2 |
6 |
9 |
11 |
3 |
7 |
9 |
14 |
16 |
15 |
16 |
С помощью стандартных функций EXEL выполнить следующее:
-
Вычислить:
,

,

-
Определить при уровне значимости 0,003 критическую точку распределения Стьюдента и построить доверительный интервал для
(математического
ожидания признака Х в генеральной
совокупности).
-
Определить при уровне значимости 0,04 критические точки распределения
и
построить доверительный интервал для
(среднеквадратического
отклонения признака Y
в генеральной совокупности).
-
Определить выборочную ковариацию признаков Х и Y, а также выборочный коэффициент корреляции. Сделать вывод о характере связи между Х и Y.
-
При уровне значимости 0,035 проверить гипотезу о значимости полученного коэффициента корреляции.
-
При уровне значимости 0,01 проверить верность гипотезы о том, что математическое ожидание признака Х равно 16 при альтернативной гипотезе
:
<16 -
При уровне значимости 0,07 проверить верность гипотезы о том, что дисперсия признака Y равна 35 при альтернативной гипотезе
:
.
-
Построить уравнение регрессии Y на Х.
