- •Пример решения задачи №1 Линейная парная регрессия
- •Решение:
- •Корреляционное поле.
- •2. Рассчитаем параметры парной линейной регрессии.
- •Расчетная таблица
- •3. Оценим тесноту связи с помощью показателей корреляции и детерминации.
- •Расчётная таблица
- •4) Построим 95% доверительный интервал для параметра регрессионной модели .
- •5) Найдём доверительный интервал для параметра .
- •7.Оценим на уровне значимости значимость уравнения регрессии у по х:
- •Используя f – критерий Фишера;
- •Используя t – распределение Стьюдента.
- •Расчетная таблица
- •8.Определим значимость коэффициента корреляции.
- •9.Найдём коэффициент детерминации.
- •Ход работы:
- •Задача для самостоятельного решения №1
- •Варианты заданий для группы 21
- •Варианты заданий для группы 22
8.Определим значимость коэффициента корреляции.
Выдвигаем
гипотезу Н0
о статистически незначимом отличии
показателя
от нуля
.
Табличное значение t- критерия Стьюдента на уровне значимости при числе степеней свободы n-2
(Получен
предыдущий результат).
Поскольку
,
то отклоняем гипотезу о равенстве 0
коэффициента корреляции.
9.Найдём коэффициент детерминации.
Это значит, что вариация зависимой переменной Y – дохода предприятия от продажи продукции на 76% объясняется изменчивостью объясняющей переменной Х – расходов на рекламу.
Выполним задачу №1, используя Пакет анализа программы EXCEL.
C помощью инструмента анализа данных Регрессия можно получить результаты регрессионной статистики, дисперсионного анализа, доверительных интервалов, остатки и графики подбора линии регрессии. Если в меню сервис еще нет команды Анализ данных, то необходимо сделать следующее. В главном меню последовательно выбираем Сервис→Надстройки и устанавливаем «флажок» в строке Пакет анализа (рис.1.3).
Рис. 1.3.
Ход работы:
1. Создать таблицу по исходным данным (рис 1.4.):
Рис. 1.4. Создание таблицы по исходным данным
2. Выполнить команду Сервис/Анализ данных
3. В диалоговом окне из списка Инструменты анализа выбрать инструмент Регрессия и нажать ОК.
4. После появления диалогового окна Регрессия (рис. 1.5.) необходимо:
Рис. 1.5. Окно Регрессия
Здесь:
Входной интервал Y – диапазон, содержащий данные результативного признака;
Входной интервал X – диапазон, содержащий данные признака-фактора;
Метки – «флажок», который указывает, содержи ли первая строка названия столбцов;
Константа – ноль – «флажок», указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист – можно указать произвольное имя нового листа (или не указывать, тогда результаты выводятся на вновь созданный.
Выполнить:
В текстовом поле Входной интервал Y установить диапазон ячеек зависимой переменной Y (для нашего примера С4:С13);
в текстовом поле Входной интервал X установить диапазон ячеек независимой переменной X (для нашего примера B4:B13);
в поле Уровень надёжности ввести необходимое число ( в примере 95, что означает уровень доверия 95%)
Выбрать в Параметрах вывода желаемый пункт (например, Выходной интервал С15);
нажать ОК.
Результаты вмещают всю необходимую информацию (рис. 1.6.):
Рис. 1.6. Вывод итогов в том же окне.
В нашем отчёте:
В
строке 30 в столбце «Коэффициенты»
выведено значение
.
В
строке 31 в том же столбце выведено
значение
.
В
строке 17 раздела «Регрессионная
статистика» выведено
значение коэффициента
корреляции
.
В
строке 18 раздела «Регрессионная
статистика» выведено
значение коэффициента
детерминации
Все показатели, вычисленные ранее, совпали.
В
строке 20 раздела «Регрессионная
статистика» выведено
значение стандартной ошибки оценки
регрессии
Раздел дисперсионный анализ.
В
1 колонке
записано
число степеней свободы соответственно
для компонент дисперсии
регрессии 1
Остаточной 8
Общей 9
Во
2 колонке
приведены
суммы квадратов:
В
3 колонке
приведены
средние суммы квадратов отклонений с
учётом числа степеней свободы:
В 4 колонке приводится значение F – критерия Фишера с уровнем доверия 0,95.
В 5 колонке приведена «Значимость F», которая показывает, что при значении этого показателя менее 0,05 построенная регрессионная модель отвечает реальной регрессии.
Последняя таблица отчёта содержит:
В 1 колонке «Коэффициенты» приведены значения параметров и .
Во
2 колонке «Стандартная погрешность»
приведены
среднеквадратические отклонения
параметров модели
,
где
-
дисперсия остатков; Сjj-диагональный
элемент матрицы погрешностей C
(матрица, обратная к матрице системы
нормальных уравнений).
В 3 колонке «t-статистика» приводятся стандартизованные (нормированные) параметры уравнения регрессии, которые находятся делением каждого фактически найденного параметра (1 колонка) на его стандартную погрешность (2 колонка).
В
4 колонке «Р – значения» находятся
функции, которые рассчитываются по
таким показателям:
стандартизованные
t
– критерии Стьюдента, вычисленные путём
деления t
– критерии на значения их стандартных
погрешностей; количество степеней
свободы
:
если связь между Х и Y положительная или отрицательная, то используют число 1;
если не известно какой связи между Х и Yследует ожидать, то используют число 2.
В общем, если Р<0,05 то оценки параметров уравнения регрессии являются достоверными и модель отвечает реальной действительности.
В 5 колонке «Нижние 95%, Верхние 95%» помещены нижние и верхние границы 95-процентного уровня доверия для каждого параметра регрессии. Если доверительные интервалы не содержат в себе нуль, то с 95- процентной уверенностью можно утверждать, что независимая переменная добавляет в уравнение регрессии значимую информацию и можно достаточно точно описывать рассмотренный процесс или явление.
Рис. 1.7. Отчёт
