- •Глава 1. Применение математического ожидания и стандартного
- •Глава 2. Линейная регрессия стр. 5
- •Глава 3. Временные ряды стр. 20
- •Глава 1. Применение математического ожидания и стандартного отклонения для оценки риска
- •Глава 2. Линейная регрессия
- •1. Простая модель линейной регрессии
- •2. Ошибки
- •3. Коэффициент корреляции пирсона. Коэффициент детерминации
- •4. Предсказания и прогнозы на основе линейной модели регрессии
- •5. Основные предпосылки модели парной линейной регрессии
- •6. Процедура испытания гипотез
- •7. Испытание гипотезы для оценки линейности связи
- •7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
- •7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
- •8. Доверительные интервалы в линейном регрессионном анализе
- •9. Регрессия и ms excel
- •Глава 3. Временные ряды
- •1. Анализ аддитивной модели
- •2. Анализ мультипликативной модели
- •3. Преимущества и недостатки метода скользящей средней
- •Список вопросов для зачета
Глава 2. Линейная регрессия
Очень часто исследователя интересует связь между переменными. Это помогает при анализе их поведения. В этой главе будет разработана модель для описания связи между переменными с математической точки зрения. Начнем с наиболее простых для анализа линейных уравнений.
1. Простая модель линейной регрессии
Существует или нет линейная связь между двумя переменными x, y. Проводим случайную выборку. При значениях x1, x2, …, xn мы наблюдаем значения y1, y2, …, yn соответственно. На плоскости Oxy отметим точки с координатами (x1, y1), (x2, y2), …, (xn, y2n).
Предположим, что точки группируются вокруг некоторой прямой линии
y = a + bx.
Тогда:
Точки не находятся точно на линии y = a + bx. Но это неудивительно. Ведь помимо x на поведение y оказывают влияние и другие факторы. Дальнейший анализ полученного уравнения позволяет сказать, насколько сильно влияние неучтенных факторов, действительно ли модель линейна и т. д. На переменные x, y накладывается ряд условий. Для описания природы связи используется термин «регрессия». Коэффициент b называется показателем наклона линии линейной регрессии.
Пример 1. Изучается зависимость себестоимости единицы изделия (y, тыс. руб.) от величины выпуска продукции (x, тыс. шт.) по группам предприятий за отчетный период. Экономист обследовал n = 5 предприятий и получил следующие результаты (2-й и 3-й столбцы). Полагая, что между переменными x, y имеет место линейная зависимость, определим выборочное уравнение линейной регрессии. Заполним таблицу.
Номер |
x |
y |
x2 |
ху |
1 |
2 |
1,9 |
4 |
3,8 |
2 |
3 |
1,7 |
9 |
5,1 |
3 |
4 |
1,8 |
16 |
7,2 |
4 |
5 |
1,6 |
25 |
8 |
5 |
6 |
1,4 |
36 |
8,4 |
Сумма |
20 |
8,4 |
90 |
32,5 |
Поясним, как заполняется таблица. В 4-м столбце указаны квадраты соответствующих чисел 2-го столбца. Каждое число 2-го столбца умножаем на соответствующее число 3-го столбца и результат пишем в 5-м столбце. В последней строке указана сумма чисел соответствующего столбца.
Замечание. Вместо вычислений коэффициентов a и b по формулам можно воспользоваться соответственно статистическими функциями ОТРЕЗОК (изв_знач_y; изв_знач_x) и НАКЛОН (изв_знач_y; изв_знач_x) мастера функций fx пакета Excel. Здесь изв_знач_y и изв_знач_x – это ссылки на ячейки, содержащие значения переменных y и x соответственно.
Обозначим через
и
средние значения
переменных y
и x
соответственно.
2. Ошибки
Проводим случайную выборку.
При значениях x1,
x2,
…, xn
мы наблюдаем
значения y1,
y2,
…, yn
соответственно.
Получено уравнение
=
a
+ bx.
Если вместо х
подставить в это уравнение значения
x1,
x2,
…, xn,
то будут получены значения
1,
2,
…,
n,
которые, вообще говоря,
будут отличаться от y1,
y2,
…, yn.
Разница yi
-
i,
= еi
называется ошибкой
(остатком, отклонением).
Значения коэффициентов a
и b
в уравнении y
= a
+ bx,
которые рассчитывались
по приведенным в пункте 1 формулам,
подбирались так, чтобы минимизировать
сумму
.
Говорят, что они получены
методом наименьших
квадратов (МНК).
