
- •Три этапа развития статистики
- •Основные этапы развития статистики
- •2. Предмет и задачи статистики
- •3.Основные понятия теории статистики
- •Сбор информации;
- •1.Организационные и методологические вопросы статистического наблюдения
- •2. Ошибки статистического наблюдения
- •Классификация ошибок статистического наблюдения
- •3. Организационные формы, виды и способы статистического наблюдения
- •1. Сводка и группировка (понятие и основные виды)
- •2.Ряды распределения: атрибутивные и вариационные
- •3.Статистические таблицы и графики, требования к составлению таблиц
- •Макет таблицы
- •4. Классификация как особый вид группировки. Роль классификаций в статистике
- •2. Классификация относительных показателей
- •Классификация относительных показателей
- •3. Понятие «средняя величина» и основные виды средних величин в статистике Понятие «средняя величина»
- •Различные виды средних величин и способы их расчета
- •В табл. 4.2 те же обозначения, что и в табл. 4.1.
- •Вспомогательная таблица для расчета простой и взвешенной средней арифметической
- •Исходные данные и вспомогательные расчеты для определения средней гармонической
- •1. Понятие вариации и основные виды показателей вариации
- •Вспомогательная таблица для расчета показателей вариации
- •На основе исходных данных вначале подсчитываются средние величины, а затем находятся отклонения от средних. Рекомендуется в расчетах показателей вариации пользоваться формулой средней взвешенной.
- •2.Свойства средней арифметической и дисперсии
- •Свойства дисперсии
- •(Свойство минимальности).
- •3. Изучение структурных характеристик вариационного ряда
- •2. Показатели концентрации и дифференциации
- •3. Показатели структурных сдвигов
- •Лекция №7. Методология организации выборочных наблюдений5.
- •1.Задачи выборочного наблюдения и различные способы формирования выборки
- •Способы отбора единиц из генеральной совокупности
- •2. Понятие «ошибка выборки» и способы ее расчета
- •3. Расчет оптимальной численности выборки
- •Лекция №8. Методы и показатели оценки тесноты статистических взаимосвязей.
- •1.Понятие «статистическая взаимосвязь»
- •2. Классификация методов оценки тесноты статистических связей
- •3. Аналитические показатели оценки тесноты взаимосвязей между количественно измеримыми признаками
- •Вспомогательная таблица для расчета рангового коэффициента корреляции Спирмена
- •4.Способы оценки тесноты взаимосвязей между качественными признаками
- •Лекция №9. Статистическое изучение динамики социально -экономических процессов и явлений.
- •2. Аналитические показатели динамики
- •Аналитические показатели динамики
- •3. Сглаживание (выравнивание) динамических рядов: механическое и аналитическое сглаживание
- •Лекция №10. Построение уравнений тренда и уравнений парной линейной регрессии
- •1. Сущность метода наименьших квадратов
- •2. Построение уравнений регрессии
- •Расчет параметров парной линейной регрессии
- •3. Построение уравнений тренда
- •Вспомогательная таблица для расчета параметров уравнений линейного и квадратического тренда
- •4. Расчет корреляционного отношения на основе уравнения регрессии
- •Способы отбора факторных переменных.
- •Исходные данные для построения уравнений регрессии
- •После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:
- •Матрица коэффициентов парной корреляции
- •Использование метода наименьших квадратов для построения нелинейных уравнений регрессии
- •Нелинейные относительно оцениваемых параметров
- •1. Понятие «статистический индекс»
- •2.Различные виды статистических индексов и способы их расчета
- •Различные виды агрегатных индексов
- •Вспомогательная таблица для расчета агрегатных индексов по формулам Ласпейреса и Пааше
- •3. Сущность индексного метода в статистике
- •Примеры решения задач индексным методом.
- •1. Понятие «прогноз» и виды прогнозов
- •2. Сущность статистических методов прогнозирования и требования к исходной статистической информации
- •3.Прогнозирование на основе уравнений тренда
- •1.Кластерный анализ
- •Дискриминантный анализ
- •3.Факторный анализ (метод главных компонент)
Лекция №10. Построение уравнений тренда и уравнений парной линейной регрессии
Введение
На предыдущей лекции мы говорили о сглаживании динамических рядов и о том, что аналитическое сглаживание осуществляется на основе так называемых уравнений тренда. А перед этим, изучая методы анализа статистических взаимосвязей, мы говорили о построении так называемых уравнений регрессии. На самом деле между уравнениями тренда и уравнениями регрессии имеется немало общего и для расчета их параметров используется один и тот же метод наименьших квадратов (МНК). Разница лишь в том, что уравнения тренда выражают зависимость некоторого показателя от времени, а уравнения регрессии – статистическую зависимость между двумя и более показателями. На данной лекции мы будем более подробно изучать построение этих уравнений с помощью разработанного в математической статистике метода (МНК). И прежде всего кратко рассмотрим сущность этого метода.
1. Сущность метода наименьших квадратов
Этот метод более подробно изучается в математической статистике и в эконометрике.
Его сущность заключается в том, что параметры аналитической функции, используемой для сглаживания ряда, подбираются таким образом, чтобы минимизировать сумму квадратов отклонений расчетных (теоретических) значений динамического ряда от фактических (исходных) значений. То есть находится:
,
где
- фактические значения показателя
(исходные статистические данные), а
- расчетные значения (полученные на
основе построенного уравнения тренда
или регрессии). Например, для уравнения
линейного тренда такая сумма квадратов
имеет вид:
Так
как значения
и
нам
известны, то сумма квадратов в
действительности является функцией
многих переменных, в качестве которых
выступают неизвестные значения параметров
уравнений тренда (или регрессии).
=
Q
(a0,
a1,
a2,…
an)
Таким образом, задача поиска параметров функций, сглаживающих исходный ряд, преобразуется в задачу поиска min Q (a0, a1, a2,… an).
Как известно из высшей математики, задача поиска экстремума (минимума или максимума) некоторой функции обычно решается путем ее дифференцирования и приравнивания частных производных к нулю.
Точно так же данная задача решается и в этом случае. Находятся частные производные функции Q (a0, a1, a2,… an) по каждому из параметров и приравниваются к нулю. Получается система уравнений, в которой число неизвестных и параметров совпадает с числом параметров, которые необходимо найти. Эта система в статистике называется системой «нормальных уравнений». В зависимости от вида конкретного уравнения тренда или регрессии эти системы имеют разный вид.
2. Построение уравнений регрессии
Уравнение регрессии – это уравнение, выражающее статистическую зависимость между различными показателями.
В зависимости от того, сколько различных факторов (показателей) связаны этой зависимостью, разделяют уравнения парной и множественной регрессии.
Уравнение парной регрессии выражает связь между двумя признаками (или показателями), один из которых (независимый) называется факторным, а второй (зависимый) – результативным.
Уравнение множественной регрессии выражает зависимость между более чем двумя показателями, один из которых называется результативным (обозначается обычно через y, а остальные факторными: обозначаются x1, x2, x3,…).
Уравнения парной регрессии могут иметь различный вид, в зависимости от того, какой функцией эта зависимость выражается (линейной, параболой и т.п.): Чаще всего используются следующие функции:
линейная yx = a0 + a1x;
полулогарифмическая yx = a0 + a1lgx;
показательная yx = a0 + a1x;
степенная yx = a0 xa1;
гиперболическая yx
=
a0
+
a1
.
Для расчета параметров уравнений регрессии используется рассмотренный выше метод наименьших квадратов.
Параметры уравнения регрессии находятся путем решения так называемых систем «нормальных уравнений», которые имеют разную форму для уравнений регрессии различного вида (в зависимости от числа переменных и вида функциональной зависимости между показателями).
Остановимся вначале более детально на расчете параметров уравнения парной линейной регрессии, так как для расчета его параметров непосредственно выведены формулы, которые нетрудно использовать на практике.
Предположим, что имеется два ряда значений исходных показателей x и y (факторного и результативного признаков). Требуется построить уравнение парной линейной регрессии между признаками:
y = a0 + a1x.
Для определения его параметров составляется система нормальных уравнений:
n
a0
+
a1Σx
= Σy;
a0Σx + a1Σx2 = Σxy. (10.1)
Для решения системы обычно используется метод определителей.
Рассчитывается определитель матрицы коэффициентов при неизвестных, т.е. определитель
Δ
=
Затем поочередно вместо каждого столбца этой матрицы подставляется столбец свободных членов и рассчитывают еще два определителя:
Δ0
=
Δ1
=
Находим
неизвестные
и
по
формулам:
= Δ0/ Δ и = Δ1/ Δ
В результате получаем следующие формулы для расчета параметров уравнения регрессии:
(10.2)
Чтобы
воспользоваться приведенными выше
формулами, обычно строится вспомогательная
таблица (табл. 10.1), в последней строке
которой находятся величины
,
,
,
,
которые необходимо подставить в формулы
(11.2).
Таблица 101.1