Глава 2. Линейная регрессия

Очень часто исследователя интересует связь между переменными. Это помогает при анализе их поведения. В этой главе будет разработана модель для описания связи между переменными с математической точки зрения. Начнем с наиболее простых для анализа линейных уравнений.

1. Простая модель линейной регрессии

Существует или нет линейная связь между двумя переменными x, y. Проводим случайную выборку. При значениях x₁, x₂, …, x_n мы наблюдаем значения y₁, y₂, …, y_n соответственно. На плоскости Oxy отметим точки с координатами (x₁, y₁), (x₂, y₂), …, (x_n, y₂_n).

Предположим, что точки группируются вокруг некоторой прямой линии

y = a + bx.

Тогда:

Точки не находятся точно на линии y = a + bx. Но это неудивительно. Ведь помимо x на поведение y оказывают влияние и другие факторы. Дальнейший анализ полученного уравнения позволяет сказать, насколько сильно влияние неучтенных факторов, действительно ли модель линейна и т. д. На переменные x, y накладывается ряд условий. Для описания природы связи используется термин «регрессия». Коэффициент b называется показателем наклона линии линейной регрессии.

Пример 1. Изучается зависимость себестоимости единицы изделия (y, тыс. руб.) от величины выпуска продукции (x, тыс. шт.) по группам предприятий за отчетный период. Экономист обследовал n = 5 предприятий и получил следующие результаты (2-й и 3-й столбцы). Полагая, что между переменными x, y имеет место линейная зависимость, определим выборочное уравнение линейной регрессии. Заполним таблицу.

Номер	x	y	x²	ху
1	2	1,9	4	3,8
2	3	1,7	9	5,1
3	4	1,8	16	7,2
4	5	1,6	25	8
5	6	1,4	36	8,4
Сумма	20	8,4	90	32,5

Поясним, как заполняется таблица. В 4-м столбце указаны квадраты соответствующих чисел 2-го столбца. Каждое число 2-го столбца умножаем на соответствующее число 3-го столбца и результат пишем в 5-м столбце. В последней строке указана сумма чисел соответствующего столбца.

Замечание. Вместо вычислений коэффициентов a и b по формулам можно воспользоваться соответственно статистическими функциями ОТРЕЗОК (изв_знач_y; изв_знач_x) и НАКЛОН (изв_знач_y; изв_знач_x) мастера функций f_x пакета Excel. Здесь изв_знач_y и изв_знач_x – это ссылки на ячейки, содержащие значения переменных y и x соответственно.

Обозначим через и средние значения переменных y и x соответственно.

2. Ошибки

Проводим случайную выборку. При значениях x₁, x₂, …, x_n мы наблюдаем значения y₁, y₂, …, y_n соответственно. Получено уравнение = a + bx. Если вместо х подставить в это уравнение значения x₁, x₂, …, x_n, то будут получены значения ₁, ₂, …, _n, которые, вообще говоря, будут отличаться от y₁, y₂, …, y_n. Разница y_i - _i, = е_i называется ошибкой (остатком, отклонением). Значения коэффициентов a и b в уравнении y = a + bx, которые рассчитывались по приведенным в пункте 1 формулам, подбирались так, чтобы минимизировать сумму . Говорят, что они получены методом наименьших квадратов (МНК).

<<< < Предыдущая 12 / 102 3 4 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.04.2019385.4 Кб64Экзаменационные вопросы по истории.docx
#
14.04.2019405.52 Кб53Экзаменационные вопросы по философии.docx
#
01.04.202534.76 Кб11ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ 13,14,15.docx
#
01.05.2025207.87 Кб16Экологические модели деятельности в лагере.doc
#
01.03.202516.77 Mб39Экология города Королёв.doc
#
01.05.2025473.6 Кб16Эконометрика новая методичка.doc
#
08.03.2016461.82 Кб232ЭКОНОМИКА - ОТВЕТЫ.doc
#
24.09.2019720.38 Кб380Экономика организации.doc
#
16.11.2018443.39 Кб99экономика отрасли лекции.doc
#
01.07.202563.65 Кб10экономика-задания-15.docx
#
01.07.202556.64 Кб9Экономическая сфера.docx