 
        
        - •По гСтатитика!!
- •Статистика как наука. Предметы и объект статистической науки. Основные категории.
- •Социально-экономическая статистика и статистика населения
- •Статистические показатели
- •Получаемы данные должны быть сопоставимы
- •Данные должны быть своевременны
- •Группировка и сводка результатов статистического наблюдения.
- •Абсолютные, относительные и средние статистические величины
- •Описательные статистики
- •Любой центральный момент порядка может быть выражен через -начальных моментов
- •Показатели вариации альтернативного признака
- •Выборочный метод в статистике
- •Проверка статистических гипотез
- •Анализы взаимосвязей социально-экономических явлений
- •Коррекционный и регрессионный анализ
- •Анализ множественной корреляции. Множественный регрессионный анализ
- •Сезонные колебания в рядах динамики. Моделирование сезонности
- •Индексный метод в статистике
- •По степени охвата элементов совокупности
- •По содержанию и характеру индексируемой величины
- •По методологии расчета
- •Индексы качественных показателей
- •Статистика доходов и расходов
- •Основные виды доходов и расходов населения
- •Статистика цен и статистика инфляции
- •Расчет ипц
- •V.Cтатистические показатели инфляции
Коррекционный и регрессионный анализ
- Общее понятие о коррекционном и регрессионном. 
- Основные показатели парной корреляции и их оценивание по выборочным данным. 
- Формализация корреляционной связи путем построения уравнения регрессии 
- Понятие множественной корреляции. Множественный регрессионный анализ 
Коррекционный и регрессионный анализ - смежные разделы статистики и теории вероятностей предназначенной для выявления измерения силы и формализации статистических связей между теми или иными статистическими признаками.
Детерминированные связи – связи в которых одному значению факторного признака соответствует единственное значение результативного признака (наиболее часто это различные функции)
Стакастические (статистические) связи – связи в которых одному значению факторного признака соответствует целое распределение значения результативного признака.
Корреляционная связь – является частным случаем статистической связи, когда факторные и результирующий признак имеют количественное выражение
Если фактор один – говорят о парной корреляции
Если факторов много – говорят о множественной корреляции
Выявление наличия корреляционной связи, её измерение проводят путем решения следующих задач.
- Построение корреляционного поля 
- Расчет выборочных корреляционных характеристик 
- Проверка значимости 
Построение корреляционного поля
X – факторный признак
Y – результативный признак
Корреляционное поле – график отражающий характер совместного поведения значений факторного и результативного признака. График является точечным. Строится так чтобы график имел форму квадрата
В зависимости от характера расположения точек можно предположить
- Наличие прямой корреляционной связи (точки на одной линии) 
- Отсутствие корреляционной связи (точки расположены хаотично) 
- Наличие нелинейной корреляционной связи (точки на ломаной линии) 
- Наличие обратной корреляционной связи (точки расположены *сверху вниз*) 
Дальнейшее задачей является измерение силы связи для чего используют 3 показателя
- Коэффициент ковариации 
COVXY
	= 
	 .
.
	
	
Если связь линейная то ковариация положительная, если обратная линейная то отрицательная. Если ковариация = 0, то линейной связи нет.
Неудобство коэффициента в том, что он зависит от абсолютных значений принимаемых факторным и результативным признаком. в связи с этим вводят коэффициент линейной корреляции (нормированный коэффициент ковариации)
- Коэффициент линейной корреляции (в случае предположения линейной связи) 
ρXY=
	
	 
P=-1 – наличие строгой обратной функциональной связи
P=1- наличие прямой функциональной связи
В остальных случая ковариационная связь
Ковариация = 0 то и корреляция = 0 => отсутствие связи
- Корреляционное отношение (в случае любой формы связей). Является универсальным показателем связи. Расчет этого показателя основан на применении правила сложения дисперсий 
S2=Ϭ2+ 
S2= 
	
	 
Ϭ
	2=
	
	 fi
fi
=
	
	
	
	 fi
fi
 =
	=
	
	 
В связи с тем что коэфициент корреляции оценивается по выборочным данным, то он является случайной величиной и => может принять любое значение выборки (например значение 0,95 – связь сильная, а в генеральной совокупности этой связи нет) в связи с этим необходимо проверить статистическую гипотезу о значимости коэффициента корреляции.
Проверка данной гипотезы зависит от объема выборочных наблюдений
Z= 
ϬPXY – среднее квадратическое отклонение
Проверка значимости корреляционного отношения
H0: xy=0
H1: xy≠0
Нулевая гипотеза принимается если
F< a(k-1,n-k)
Формализация корреляционных связей путем построения уравнения регрессии
Е сли
	наличие линейной корреляционной связи
	доказано, то следующим этапом является
	формализация связей – представление
	её в виде некоторого уравнения
сли
	наличие линейной корреляционной связи
	доказано, то следующим этапом является
	формализация связей – представление
	её в виде некоторого уравнения 
	
 =α0+
	α1X
=α0+
	α1X
Коэффициенты α – коэффициенты регрессии
Задачей регрессионного анализа является – нахождение неизвестных коэффициентов уравнения регрессии по выборочным данным.
Основным методом определения неизвестных коэффициентов α0 и α1 является метод наименьших квадратов (МНК). Сущность метода заключается в минимизации суммы квадратов отклонений наблюдаемых значений результирующего признака У от значений рассчитываемых по уравнению регрессии.
Y^ - значение результата признака рассчитываемое по уровню регрессии Х
Y- значение результата признака полученное в результате наблюдений
 
F(α0
	α1)
	= Для
	определения значения неизвестных
	коэффициентов α0
	и
	α1
	необходимо
	от функции F взять частные производные
	от α0
	и
	α1
	и
	приравнять к 0
Для
	определения значения неизвестных
	коэффициентов α0
	и
	α1
	необходимо
	от функции F взять частные производные
	от α0
	и
	α1
	и
	приравнять к 0
СИСТЕМА УРАВНЕНИЙ
Полученная система уравнений называется системой нормальных уравнений метода наименьших квадратов
Из полученного соотношения следует что уравнение регрессии должно проходить через точку с координатами ( )
 
Пусть имеются данные по группе предприятий по производительности труда (результирующий признак) и величине фонда вооруженности.
| Номер предприятия | Производительность (тыс. руб) У | Фондоотдача (тыс.руб.чел.) Х | xy | x*x | Y*Y | 
| 1 | 360 | 15,2 | 5472 | 231,04 | 129600 | 
| 2 | 298 | 12,8 | 3814,4 | 163,84 | 88804 | 
| 3 | 328 | 13,8 | 4526,4 | 190,44 | 107584 | 
| 4 | 330 | 14 | 4620 | 196 | 108900 | 
| 5 | 366 | 16,3 | 5965,8 | 265,69 | 133956 | 
| 6 | 316 | 12,6 | 3981,6 | 158,76 | 99856 | 
| 7 | 334 | 13,2 | 4408,8 | 174,24 | 111556 | 
| 8 | 300 | 12,9 | 3870 | 166,41 | 90000 | 
| СУММА | 2632 | 110,8 | 36659 | 1546,42 | 870256 | 
Коэффициенты α0 и α1 полученные по данным регрессии являются случайными и могут принять ЛЮБЫЕ значения генеральной совокупности значений результирующего и факторного признака
Отсюда возникает задача проверки статистической значимости коэффициенты уравнения регрессии α0 и α1.
Порядок проверки
- Определяется величина называемая остатком, для каждого наблюдения   
- Определяется дисперсия остатка 
Ϭ2=
- Для коэффициентов α0 и α1 определяются их средние квадратические ошибки. 
Ϭα0=Ϭ/ Ϭα1=Ϭ/
	 Ϭα1=Ϭ/ 
	
	
- Для каждого коэффициента рассчитываются критерии Стьюдента 
Tα0/1 = |α0/1|/Ϭα0/1
- Полученные значения сравниваются с критической границей распределения Стьюдента с n-2 степенями свободы при уровне значимости р. 
Если выполняется условие tα0>tp(n-2) коэффициент α0 признается статистически значимым.
Коэффициент α0 признается не значимым то это не свидетельствует об отсутствии связи между факторным и результирующим признаком
Если коэффициенты регрессии оказались значимым то для них принято указывать доверительные интервалы с уровнем доверительной вероятности 1-р
 
Формулы для расчета доверительных интервалов показывают что неизвестные значения параметров регрессии с вероятностью 1-р содержатся в указанных интервалах
После определения значимости и построения доверительных интервалов для параметров регрессии осуществляют оценку качества всего уравнения регрессии в целом. Такую оценку проводят с использованием коэффициента детерминации R2
R2=
	1 - 
R2=
Точечная форма прогноза (прогноз в среднем) осуществляется подстановкой значения х* в уравнение регрессии
По полученому уравнению регресии принято также определять коэффициенты эластичности бета-коэфициент и дельта-коэфициент
Э=α1* /
Данный коэффициент показывает на сколько % изменится
Β= α1*Sx\Sy
Показывает на сколько % изменится значение среднего квадратического отклонения результирующего признака если среднее квадратическое отклонение факторного признака изменится на 1%
∆=ρXY*β/R2
Показывает какая доля вариации результирующего признака объясняется влиянием факторного признака
