- •По гСтатитика!!
- •Статистика как наука. Предметы и объект статистической науки. Основные категории.
- •Социально-экономическая статистика и статистика населения
- •Статистические показатели
- •Получаемы данные должны быть сопоставимы
- •Данные должны быть своевременны
- •Группировка и сводка результатов статистического наблюдения.
- •Абсолютные, относительные и средние статистические величины
- •Описательные статистики
- •Любой центральный момент порядка может быть выражен через -начальных моментов
- •Показатели вариации альтернативного признака
- •Выборочный метод в статистике
- •Проверка статистических гипотез
- •Анализы взаимосвязей социально-экономических явлений
- •Коррекционный и регрессионный анализ
- •Анализ множественной корреляции. Множественный регрессионный анализ
- •Сезонные колебания в рядах динамики. Моделирование сезонности
- •Индексный метод в статистике
- •По степени охвата элементов совокупности
- •По содержанию и характеру индексируемой величины
- •По методологии расчета
- •Индексы качественных показателей
- •Статистика доходов и расходов
- •Основные виды доходов и расходов населения
- •Статистика цен и статистика инфляции
- •Расчет ипц
- •V.Cтатистические показатели инфляции
Проверка статистических гипотез
Статистическая гипотеза – некоторое предположение о генеральной совокупности которая проверяется с использованием выборочных данных
Примеры статистических гипотез
в генеральной совокупности генеральное среднее значение = a0
Генеральные средние в двух различных генеральных совокупностях равны между собой
= a0
1= a0
Выборка х1, х2 и т.д. извлечена из генеральной совокупности которая подчиняется нормальному закону распределения случайных величин
Две выборки х11, х21, х22, и т.д. извлечены из одной и той же генеральной совокупности
Все статистические гипотезы делятся на две группы
Параметрические. Если в статистической гипотезе содержится утверждение о числовых характеристиках (параметрах) генеральной совокупности то такие гипотезы называются параметрическими
Простые (1 параметр)
Сложные (2 и более параметров)
Непараметрические. Если в гипотезе содержится утверждение о генеральной совокупности в целом то они называются непараметрическими.
Правила записи статистических гипотез
Любую статистическую гипотезу принято формулировать в виде основной или нуль-гипотезы
H0: содержание гипотезы
H0: = a0
На ряду с нулевой гипотезой формируется альтернативная гипотеза являющаяся логическим отрицанием нулевой гипотезы
H1: ≠ a0
Общие алгоритмы проверки статистических гипотез
Сформулировать основную или нуль-гипотезу
Сформулировать альтернативную гипотезу
По данным выборочного наблюдения рассчитать величину Θ которая называется статистикой гипотезы
Установить закон распределения статистики Θ
Область возможных значений статистики разбить на две взаимодополняющие подобласти:
первая – область принятия статистической гипотезы
вторая – область отвержения статистической гипотезы
Если статистика Θ попадает в область принятие гипотезы – гипотеза не отвергается, в противном случае отвергается в альтернативной
Разбиение области значения статистики производится по определенным правилам и определяется назначенным уровнем значимости проверки статистической гипотезы
При проверки уровень значимости – α, а область значения статистики разбивается таким образом чтобы выполнялось условие P(Θ> Θα) = α
Θα принято называть критической границей при проверки статистической гипотезы
Гипотезы о параметрах генеральных совокупностей
Н0: = a0
Среднее квадратическое отклонение в генеральной совокупности является известным.
Статистикой для проверки гипотезы является величина
Z=
Критические границы при проверке такой гипотезы устанавливаются в зависимости от вида альтернативной гипотезы
Н1: < a0 Принимается при | Z|< -U2α
Н2: > a0 Принимается при | Z|< U2α
Н3: ≠ a0 Принимается при | Z|< Uα
Пусть утверждается что в генеральной совокупности рост студента составляет 175 см. по результатам выборочного обследования 100 человек. Установлено что выборочный средний рост составляет 178 см. Среднее квадратическое отклонение составляет 2 необходимо на уровне значимости 0,05 (5%) установить можно ли согласиться с данным утверждением
Н0: =175
n=100
α= 0,05
Ϭ = 2 см
= 178
Назначаем альтернативную гипотезу
Н1: >175
Z= = 15
Ф(U0,1) = = 0,45 => U0,1= 1,65
Гипотеза о проверке среднего в генеральной совокупности при неизвестном генеральном среднем квадратическом отклонении
Н0: =a0
Ϭ – неизвестно
t=
S* - исправленное выборочное среднее квадратическое отклонение
В зависимости от вида альтернативной гипотезы нулевая гипотеза принимается при выполнении условий
Н1: < a0 принимается при t> -t2α
Н2: < a0 принимается при t< t2α
Н3: < a0 принимается при |t|> tα
t2α, tα – значение критических границ распределения Стьюдента с n-1 степенью свободы соответствующих 2α и α
Гипотеза о дисперсии генеральной совокупности
Н1: Ϭ2= b0
- известно
χ2 =
В зависимости от вида альтернативной гипотезы нулевая гипотеза принимается при выполнении условий
Н1 * Ϭ2 < b0 χ2 > 2α(n-1)
Н2 * Ϭ2 > b0 χ2 < 2α(n)
Н3 * Ϭ2 ≠ b0 < χ2 <
2α(n) – правосторонняя критическая граница с n степенями свободы отвечающая вероятности α
α2 – левосторонняя критическая граница
Н1: Ϭ2= b0
- неизвестно
χ2 =
В зависимости от вида альтернативной гипотезы нулевая гипотеза принимается при выполнении условий
Н1 * Ϭ2 < b0 χ2 > 2α(n-1)
Н2 * Ϭ2 > b0 χ2 < 2α(n-1)
Н3 * Ϭ2 ≠ b0 < χ2 <
Гипотеза о вероятности наступления события в одном испытании (гипотеза о генеральной доле единиц обладающих исследуемым признаком)
Н0: p=p0 (некоторое число)
Z=
В зависимости от вида альтернативной гипотезы гипотеза H0 принимается при выполнении условий
Н1: p < p0 принимается при | Z|> -U2α
Н2: p > p0 принимается при | Z|< U2α
Н3: ≠ p0 принимается при | Z|< Uα
При 100 подбрасываниях монетки выпало 55 решек можно ли на уровне значимости α=0,05 согласиться с теоретическим утверждением о том, что вероятность появления решки в одном испытании = 0,5
p0 = 0,5
= 0,55
n=100
α=0,05
Н0: p=0,5
Н1: p ≠ 0,5
Z= = 1 => U α = 1,96
Гипотеза относительно законов распределения (непараметрических). Теории согласия.
Гипотеза относительно законов распределения предполагают использование для установления закономерностей в распределении тех или иных статистических признаков в этом случае нулевая статистическая гипотеза может звучать следующим образом
H0: выборка извлеченная из генеральной совокупности подчиняющейся закону распределения F(X) – функциональная форма закона распределения
H0: выборки извлечены из одной и той же генеральной совокупности
Указанные гипотезы проверяются с использованием специальных статистических критериев, которые называются критериями согласия.
Наиболее часто используемыми критериями согласия являются
Критерий Пирсона χ2 – самый используемый. Сущность заключается в анализе расхождений между наблюдаемыми частотами и теоритическими частотами (теми частотами, которые наблюдались бы если бы выборка в точности подчинялась закону распределения F(x)
Критерий Колмагорова-Смирнова λ
Критерий фон Мизеса ῳ2
Алгоритм использование критерия Пирсона (χ2)
Всю совокупность выборочных значений разбивают на K непересекающихся групп или интервалов
Подсчитывается количество наблюдений fi (i= 1….k) попавших в i-ю группу/интервал.
Предположив справедливость гипотезы H0 определяют вероятность того, что значение признака будет принадлежать i-му интервалу/группе.
P1=P(X [Xi-1,X1)) = F(xi) – F(xi-1)
ϕ(x) = -функция распределения нормального закона
По вычисленным вероятностям Pi определяются значения теоретических частот fi’ = n* pi
Если в каком-то из интервалов значение теоретической частоты оказалось менее 5 то производят объединение этого интернвала с соседними так чтобы для каждого из интервалов выполнялось условие fi’ > 5. Новое количество интервалов обозначают K*.
Для каждого из вновь образованных интервалов рассчитывают величину расхождения между эмпирическими и теоретическими частотами
χ2 =
Полученную величину расхождения сравнивают с правосторонней критической границей χ2 распределения соответствующей уровню значимости проверки гипотезы альфа при степенях свободы
m=k*-L-1
L – количество параметров/характеристик генеральной совокупности, оценивающихся по выборочным данным
Если выполняется условие χ2< χ-2a(m), то нулевая гипотеза принимается и говорится что выборка хорошо согласуется с выбранным законом распределения.
ПРИМЕР
Значение признака |
Количество наблюдений |
Вероятность(3 шаг) Pi |
Теор частота (4 шаг) |
расхождение (6 шаг) |
190-192 |
1 |
0,0081 |
0,81 |
0,007 |
192-194 |
5 |
0,0385 |
3,85 |
|
149-196 |
10 |
0,1102 |
11,02 |
|
196-198 |
14 |
0,212 |
21,2 |
2,18 |
198-200 |
22 |
0,258 |
25,8 |
0,58 |
200-202 |
28 |
0,212 |
21,2 |
2,45 |
202-204 |
15 |
0,1102 |
11,02 |
1,074 |
206-208 |
5 |
0,0488 |
4,88 |
|
ИТОГ |
100 |
1,00 |
100 |
6,291 |
Выборка извлечена из генеральной совокупности подчиняющейся нормальному закону распределения случайных величин
= 199
S = 3,0
Pi= Ф( ) - Ф( ) = 0,0081
Критерий Пирсона как критерий однородности выборок
При использовании χ2 как критерии однородности выборок, нулевая критическая критерия звучит следующим образом
H0: выборки извлечены из одной и той же генеральной совокупности.
Постановка задачи
Имеется L выборок каждый из которых имеет равный объем n1,n2…..nL
Требуется проверить можно ли считать что выборки извлечены из одной и той же генеральной совокупности
Алгоритм использования критерия однородности χ2
Результаты первой, второй и т.д. L-й выборки группируют K-одинаковых групп или интервалов
Подсчитывают количество наблюдений fij (количество наблюдений i-й выборки попавших в j-ую группу/интервал). Данные представляют в виде групповой таблицы
Определить величину nj по формуле. nj=
Определить суммарный объем наблюдений. n=
Рассчитываются вероятности принадлежности одного наблюдения к k-й группе интервалу
Pi= i=1….k
Расчитываются теоретические частоты - частоты которые наблюдались бы, если при полной однородности выбора
fij’= pjnj=nj
Рассчитывается мера расхождения между эмпирическими и теоретическими частотами
χ2=
Рассчитанное значение χ2 сравнивается с правосторонней критической границей распределения χ2 отвечающей уровню значимости α при числе степеней свободы m=(l-1)(k-1)
ПРИМЕР: Для проведения респондентам задавался вопрос: будете ли вы принимать участие в выборах? Опрос проводился в дух регионах
Ответы |
Номер региона |
Nj |
|
1 |
2 |
||
Да |
40 |
25 |
65 |
Нет |
75 |
100 |
175 |
Итоги |
115 |
125 |
240 |
P1=65\240=0,27
P2=175\240 = 0,73
t11’= P1 n1 = 0,27 * 115 = 31
t12’= 84
t21’= 34
t22’= 91
χ2= 81\31+81\34+81\84+81\91 = 6,9
При 5% степенях значимости и одной степени свободы
χ20,05(1)=3,84
Поскольку χ2-расчетная оказалась больше критического значения то гипотезу H0 отвергнуть и считать что отношения к выборам в первом и втором регионе являются различным