
- •Корреляционно-регрессионный анализ и прогнозирование
- •Постановка задачи
- •Задания для выполнения лабораторной работы
- •Ход выполнения работы
- •Описательные статистики
- •1.1 По выборочным данным рассчитаем основные точечные оценки параметров генеральной совокупности и коэффициенты вариации
- •1.2 По выборочным данным рассчитаем интервальные оценки для средних, дисперсий и средних квадратических отклонений
- •Корреляционный анализ исходных данных
- •2.2 Сравнительный анализ матрицы частных коэффициентов корреляции с матрицей парных коэффициентов корреляции
- •3. Регрессионный анализ
- •3.2 Оценим параметры множественной регрессии в стандартизированном масштабе:
- •3.3 Определим частные коэффициенты эластичности
- •3.4 Проведём анализ остатков уравнений множественной и парной регрессий на автокорреляцию
- •3.5 Оценим точность уравнения регрессии
- •3.7 Процедура пошаговой регрессии
- •4. Прогнозные расчёты
- •Доверительный интервал для функции регрессии
- •Доверительный интервал для индивидуальных значений зависимой переменной
- •Приложение а
- •Критические точки распределения Стъюдента
- •Приложение г
- •Вопросы для защиты лабораторной работы
- •Библиографический список
Описательные статистики
1.1 По выборочным данным рассчитаем основные точечные оценки параметров генеральной совокупности и коэффициенты вариации
Будем использовать обозначения параметров генеральной совокупности, их оценок и характеристик выборочной совокупности, принятые в пособии “Статистические методы принятия решений” (П. Я Бушин, 2002 г.).
Характеристика |
Параметр |
Оценка |
Выборочное значение |
Средняя |
μ |
|
|
Дисперсия |
σ 2 |
2 |
S2 |
Среднее квадратическое отклонение |
σ |
|
S |
Для получения описательных статистик выберем Describe / Numeric Data / Multiple – Variable Analysis, появится окно для задания анализируемых переменных (рисунок 4).
Рисунок 4 – Окно для задания анализируемых переменных
Введём в поле Data переменные х1, х2, х3, у, для чего выделим указанные переменные нажатием левой кнопки мыши, затем кнопки Data и ОК.
По умолчанию на экране появится окно Multiple – Variable Analysis (рисунок 5), в котором представлена информация о том, что к анализу приняты переменные х1, х2, х3, у, матрица парных коэффициентов корреляции и ее графическое изображение.
Рисунок 5 – Окно Multiple – Variable Analysis
Данное окно имеет свою кнопочную панель, расположенную под названием Multiple – Variable Analysis. Чаще используют первые четыре пиктограммы (слева направо), их назначения таковы: первая кнопка вызывает входную панель процедуры; с помощью второй пользователь устанавливает табличные опции; третья кнопка управляет графическими опциями; четвёртая даёт возможность сохранить результаты анализа в электронной таблице. Остальные восемь кнопок управляют графиками.
Нажмите кнопку табличных опций (вторая слева), на экране появится окно (рисунок 6), в котором рассматриваются следующие опции: описательный анализ, описательные статистики, доверительные интервалы, корреляции, ранговые корреляции, ковариации, частные корреляции.
Рисунок 6 – Окно табличных опций
Выберите строку Summary statistics, затем нажмите кнопку ОК, по умолчанию на экране появится определённый набор статистик. Полный набор описательных статистик можно получить следующим образом: щёлкните правой кнопкой мыши, появится меню (рисунок 7).
Рисунок 7 ─ Меню выбора команды
Выберите Pane Options, на экране появится окно Summary Statistics Options (рисунок 8), содержащее полный набор описательных статистик, в котором можно заказать необходимые изменения в наборе выдаваемых статистик.
Рисунок 8 – Окно опций описательных статистик
В таблице 1 приведена панель описательных статистик с их переводом.
Таблица 1 – Панель описательных статистик
Average ─ средняя |
Min минимальное значение |
Skewness асимметрия |
Median ─ медиана |
Max ─ максимальное значение |
Std. Skewness ─ стандартная асимметрия |
Mode ─ мода |
Range ─ вариационный размах |
Kurtosis ─ эксцесс |
Geo. Mean ─ геометрическая средняя |
Lower Quartile ─ нижний квартиль |
Std. Kurtosis ─ стандартный эксцесс |
Variance ─ дисперсия |
Upper Quartile ─ верхний квартиль |
Coeff. of Var. ─ коэффициент вариации |
Std. Deviation ─ стандартное отклонение |
Interquartile Range ─ межквартильный размах |
Sum ─ сумма |
Std. Error ─ стандартная ошибка |
|
|
В окне Summary Statistics Options (рисунок 8) пометьте следующие статистики: average, variance, std. deviation, range , coeff. of var, sum. На экране появится отчет (рисунок 9) о значениях оценок заказанных статистик.
Рисунок 9 – Рассчитанные оценки описательных статистик
Для примера, рассчитаем точечные оценки для переменной x1. Как известно, несмещённой, состоятельной и эффективной оценкой средней арифметической генеральной совокупности является выборочная средняя, т.е.
=
=
=
=
=
14,8533
Несмещённой, состоятельной и эффективной оценкой дисперсии генеральной является исправленная выборочная дисперсия
2
=
S2
=
=
(
(4
14,853)2+(4,8
14,853)2+(5,9
14,853)2+(8,7
14,853)2
+(8,2
14,853)2
+ (9,7
14,853)2
+ (14,7
14,853)2
+ (18,7
14,853)2
+
(19,8
14,853)2
+
(20,7
14,853)2
+
(21,7
14,853)2
+
(20,3
14,853)2
+
(21,6
14,853)2
+
(22
14,853)2
+
(22,5
14,853)2)
= =50,4427
Несмещённой, состоятельной и эффективной оценкой стандартного отклонения является
.
=
Коэффициент вариации характеризует рассеяние значений совокупности вокруг среднего и находится по формуле
V=
;
.
2,
и V
являются мерами вариации и характеризуют
меру рассеяния значений совокупности
вокруг выборочной средней.
2
и
являются абсолютными показателями
вариации; чем больше рассеяние данных
вокруг средней, тем неоднороднее данная
совокупность. Коэффициент вариации
является относительной величиной, он
не зависит от единиц измерения, поэтому
используется для сравнительного анализа.
Считается, что совокупность однородная,
если V < 33 %.
Анализируя,
полученные результаты, необходимо
отметить, что наибольшее рассеяние
значений вокруг выборочной средней
присуще совокупности значений х1,
(
%),
а наименьшее для совокупности значений
x3
(
%),
при этом наибольшей дисперсией обладает
совокупность значений у
(
).