- •Статистические методы
- •Сбора, обработки и анализа данных
- •В экономике и менеджменте
- •Учебное пособие
- •Глава 1. Предмет и метод статистики
- •Глава 2. Статистическое наблюдение
- •Глава 7. Показатели вариации
- •Глава 8. Ряды динамики 8.1. Динамические ряды как база исследования экономической
- •Глава 9. Индексы
- •Глава 10. Выборочное наблюдение
- •Глава 11. Статистическое изучение взаимосвязи социально-экономических явлений
- •Глава 1. Предмет и метод статистики
- •1.1. Предмет статистики
- •1.2. Основные понятия и категории статистики
- •1.3. Метод статистики
- •1.4. Задачи статистики
- •1.5. Организация статистики
- •Глава 2. Статистическое наблюдение
- •2.1. Общее понятие о статистическом наблюдении
- •2.2. Основные организационные формы статистического наблюдения
- •2.3. Виды статистических наблюдений
- •2.4. Способы статистического наблюдения
- •2.5. Программно-методологическое и организационное обеспечение статистического наблюдения
- •2.6. Ошибки наблюдения
- •Вопросы для самопроверки:
- •Глава 3. Сводка и группировка статистических материалов
- •3.1. Содержание и назначение сводки
- •3.2. Метод группировок
- •3.3. Расчет интервала группировок
- •Xmax - Xmin r
- •Xmax - Xmin
- •3.4. Методологические требования к системам группировок
- •3.5. Графики рядов распределения
- •3.6. Статистические таблицы
- •Вопросы для самопроверки:
- •Глава 4. Абсолютные и относительные величины
- •4.1. Абсолютные величины
- •4.2. Относительные величины
- •4.3. Комплексное использование абсолютных и относительных величин
- •Вопросы для самопроверки:
- •Глава 5. Графическое изображение статистических данных
- •5.1. Понятие о статистическом графике. Элементы графика
- •5.2. Виды графиков и их классификация
- •Вопросы для самопроверки:
- •Глава 6. Средние величины.
- •6.1. Средние величины, их сущность и значение
- •6.2. Виды средних величин
- •6.3. Выбор формулы средней
- •6.4. Свойства средней арифметической
- •6.5. Мода, медиана
- •6.6. Межорантность средних
- •6.7. Соотношение средних в зависимости от характера распределения
- •Вопросы для самопроверки:
- •Глава 7. Показатели вариации
- •7.1. Общее понятие о вариации признака
- •7.2. Расчет основных показателей вариации
- •7.3. Расчет дисперсии, ее свойства
- •7.4. Дисперсия альтернативного качественного признака
- •Вопросы для самопроверки:
- •Глава 8. Ряды динамики
- •8.1. Динамические ряды как база исследования экономической динамики
- •8.2. Аналитические показатели динамического ряда
- •8.3. Сглаживание и выравнивание динамических рядов
- •8.4. Изучение сезонных колебаний
- •8.5. Экстраполяция и интерполяция в рядах динамики
- •Вопросы для самопроверки:
- •Глава 9. Индексы
- •9.1. Общее понятие об индексах
- •9.2. Сводные индексы в агрегатной форме
- •9.3. Сводные индексы в средней арифметической и средней гармонической формах
- •9.4. Системы индексов
- •9.5. Индексный метод анализа динамики среднего уровня качественного показателя
- •Вопросы для самопроверки:
- •Глава 10. Выборочное наблюдение
- •10.1. Общее понятие о выборочном наблюдении
- •10.2. Способы отбора единиц в выборочную совокупность
- •10.3. Определение необходимого объема выборки
- •10.4. Малая выборка
- •Вопросы для самопроверки:
- •Глава 11. Статистическое изучение взаимосвязи социально-экономических явлений
- •11.1. Причинность, регрессия, корреляция
- •11.2. Парная регрессия на основе метода наименьших квадратов
- •11.3. Множественная регрессия
- •11.4. Собственно-корреляционные параметрические методы изучения связи
- •11.5. Методы изучения связи качественных признаков
- •11.6. Ранговые коэффициенты связи
- •Вопросы для самопроверки:
- •Оценка результатов обучения по курсу «Общая теория статистики»
- •Библиографический список
11.2. Парная регрессия на основе метода наименьших квадратов
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитическая связь между ними описывается уравнениями:
_
прямой yx = a0 + a1*x ;
_
параболы yx = a0 + a1*x + a2*x2 ;
гиперболы _ 1
yx = a0 + a1* -- и т.д.
x
Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболлическая или степенная регрессия.
Оценка параметров уравнений регрессии a0 и a1 (и a2 в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит прежположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели a0 и a1, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
( yi - yt ) 2 min.
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
a0*n + a1* t = y
a0* t + a1* t2 = y*t ,
где n - объем исследуемой совокупности (число единиц наблюдения) .
В уравнениях регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков, коэффициент регрессии a1 показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
11.3. Множественная регрессия
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:
_
y1,2,…k = f (x1, x2, …, xk). (11.3.1)
Построение моделей множественной регрессии включает несколько этапов:
выбор формы связи (уравнение регрессии);
отбор факторных признаков;
обеспечение достаточного объема совокупности.
Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.
Линейное уравнение множественной регрессии имеет вид:
_
y1,2,…k = a0 + a1*x1 + a2*x2 + … + ak*xk , (11.3.2)
_
где y1,2,…k - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;
x1 x2 … xk - факторные признаки;
a0 a1 a2 …ak - параметры модели (коэффициенты регрессии).
Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и т.д.
Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков. С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. С другой стороны, сокращение размерности модели за счет исключения второстепенных факторов способствует простоте и качеству ее реализации.
При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель (rxy > 0,8).
Наличие мультиколлинеарности между признаками приводит к искажению величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков.
В качестве причин возникновения мультиколлинеарности между признаками можно выделить следующие:
изучаемые факторные признаки являются характеристикой одной и той же стороны явления или процесса. Например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;
факторные признаки являются составляющими элементами друг друга;
факторные признаки по экономическому смыслу дублируют друг друга.
