- •Способы получения статистической информации:
- •Воп. 2. Точность статистического наблюдения и ее контроль.
- •Воп. 3. Задачи сводки и ее содержание.
- •Воп.4. Виды статистических группировок.
- •Воп.5. Принципы построения статистических группировок и классификаций.
- •Воп. 6. Сравнимость статистических группировок. Вторичная группировка.
- •Воп.7. Виды таблиц по характеру подлежащего.
- •Воп.8. Виды таблиц по разработке сказуемого.
- •Воп.9. Абсолютные и относительные показатели.
- •Воп.10. Понятие о статистическом графике. Элементы статистического графика.
- •Воп.11. Сущность средних показателей.
- •Воп.12. Средняя арифметическая и ее свойства.
- •Воп.13. Структурные средние.
- •Воп.14. Основные показатели вариации.
- •Воп.15. Использование показателей вариации в анализе взаимосвязей.
- •Воп.18. Определение необходимого объема выборки.
- •Воп.19. Оценка результатов выборочного наблюдения и распространение их на генеральную совокупность.
- •Количественные критерии оценки тесноты связи
- •Воп.22. Парная регрессия на основе метода наименьших квадратов и метода группировок.
- •Воп.23. Множественная (многофакторная) регрессия.
- •Воп.24. Собственно-корреляционные параметрические методы изучения связи.
- •Оценка линейного коэффициента корреляции
- •Воп.25. Принятие решений на основе уравнений регрессии.
- •Воп.27. Ранговые коэффициенты связи.
- •Воп.28. Понятие и классификации рядов динамики.
- •Воп.29. Сопоставимость уровней и смыкание рядов динамики.
- •Воп.33. Понятие структуры и основные направления ее исследования.
- •Воп.34. Частные показатели структурных сдвигов.
- •Воп.35. Показатели концентрации и централизации.
- •Воп.36. Индексный метод.
- •Воп.40. Индексы постоянного и переменного состава.
Воп.22. Парная регрессия на основе метода наименьших квадратов и метода группировок.
Парная регрессия - регрессия между двумя переменными у и х, т.е. модель вида: у = f (x)+E, где у- зависимая переменная (результативный признак); x - независимая, обьясняющая переменная (признак-фактор); E- возмущение, или стохастическая переменная, включающая влияние неучтенных факторов в модели. В случае парной линейной зависимости строится регрессионная модель по уравнению линейной регрессии. Параметры этого уравнения оцениваются с помощью процедур, наибольшее распространение получил метод наименьших квадратов.
Метод наименьших квадратов (МНК) - метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции.
Парная регрессия характеризует связь между двумя признаками - результативным и факторным. Аналитическая связь между ними описывается следующими уравнениями:
прямой
гиперболы
параболы и т.д.
Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если факторный признак увеличивается в арифметической прогрессии, а результативный - значительно быстрее, то используется связь параболическая или степенная.
Оценка параметров уравнений регрессии (а0, а1, и а2 в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.
Основной принцип метода наименьших квадратов рассмотрим на следующем примере: будем считать, что две величины (два показателя) X и У взаимосвязаны между собой, причем У находится в некоторой зависимости от Х. Следовательно, У будет зависимой, а Х- независимой величинами.
Сущность метода наименьших квадратов заключается в нахождении параметров модели (а0, а1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
Для прямой зависимости:
Откуда система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов примет следующий вид:
где n - объем исследуемой совокупности (число единиц наблюдений).
В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а1 (а в уравнении параболы и а2) –коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Применение метода наименьших квадратов объясняется неизбежным наличием случайных ошибок в результатах опыта.
Нахождение уравнения регрессии по сгруппированным данным. Если совокупность сгруппирована по признаку x, для каждой группы найдены средние значения другого признака у, то эти средние дают представление о том, как меняется в среднем у в зависимости от х. Поэтому группировка служит средством анализа связи в статистике.
Групповые средние хуже отражают закономерность связи, чем уравнение регрессии, но могут быть использованы в качестве основы для нахождения этого уравнения. Умножая численность каждой группы nч на групповую среднюю уч мы получим сумму у в пределах группы Суммируя эти суммы, найдем общую сумму у. Несколько сложнее с суммой ху. Если при сумме ху интервалы группировки малы, то можно считать значение x для всех единиц в рамках группы одинаковым Умножив на него сумму у, получим сумму произведений x на у в рамках группы и, суммируя эти суммы, общую сумму xу. Численность nx, здесь играет такую же роль, как взвешивание в вычислении средних.