- •Генеральная совокупность и выборка
- •Статистическое распределение выборки
- •1. Статистическое дискретное распределение. Полигон.
- •Генеральная средняя
- •Выборочная средняя
- •Включает ли ди какие-либо значения, представляющие особый интерес?
- •1. Способ оценки достоверности с помощью определения ошибок репрезентативности
- •2. Определение доверительных границ средних и относительных величин
- •Метод стандартизации
- •2. Проверка гипотезы о виде распределения
- •Задачи анализа.
- •Расчет теоретических данных.
- •Определение соответствия эмпирических и теоретических данных. Критерий χ2.
- •Критерий χ2 для произвольной таблицы.
- •Аналитические методы
- •Элементы теории корреляции
- •Линейная регрессия
- •Метод наименьших квадратов (мнк)
- •Проверка гипотезы о значимости коэффициента регрессии.
- •Корреляционный анализ.
- •Линейная корреляция
- •Выборочный коэффициент корреляции.
- •Проверка гипотезы о значимости коэффициента корреляции.
- •Проверка гипотезы о значимости коэффициента регрессии.
- •Проверка гипотезы о значимости коэффициента корреляции.
2. Проверка гипотезы о виде распределения
Во многих случаях закон распределения изучаемой случайной величины неизвестен, но есть основания предположить, что он имеет вполне определенный вид (назовем его вид А). В таких случаях нулевая гипотеза Н0 формулируется следующим образом: Н0- генеральная совокупность распределена по закону А, под альтернативной гипотезой Н1 будем понимать в данном случае то, что не выполнена основная.
Для проверки согласованности результатов наблюдений с высказанным предположением используют специально подобранную величину- критерий согласия.
ОПРЕДЕЛЕНИЕ: Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Существуют различные критерии согласия: Пирсона (Хи-квадрат), Колмогорова, Фишера, Смирнова. Критерий согласия Пирсона- наиболее часто употребляемый критерий для проверки простой гипотезы о законе распределения.
Критерий согласия χ2 (хи-квадрат) Пирсона.
Пусть дано n измерений. Важно установить, можно ли описать эти n значений с помощью принятой теоретической модели. В качестве теоретической модели может выступать любая уже известная модель (нормального распределения, равномерного распределения или распределения Пуассона).
Для проверки выдвигают нулевую гипотезу – Н0: «между эмперическим распределением и теоретической моделью нет никакого различия».
Для проверки гипотезы Н0 поступают следующим образом.
Разбивают
всю область значений случайной величины
Х на κ интервалов.
и подсчитвают вероятности Рі
(і=1,2,...,к) попадания случайной величины
Х (то есть наблюдения) в интервал
,
используя формулу Р(α≤Χ≤β)=F0(β)-F0(α).
Тогда теоретическое число значений
случайной величины Х попавших в
интервал
,
можно рассчитать по формуле
.
Таким образом, имеем статистический
ряд распределения случайной величины
Х (1) и теоретический ряд распределения:
|
|
… |
|
|
|
… |
|
(2)
Если
эмпирические частоты (
)
сильно отличаются от теоретических
(
)
,то проверяемую гипотезу Но
следует отвергнуть; в противном
случае-принять.
Критерием,
характеризующим степень расхождения
между эмпирическими и теоретическими
частотами предложил К. Пирсон (1857-1936
г.г., английский математик, статик,
биолог, философ)
,
О
–фактически наблюдаемое число, Е
– теоретически ожидаемое число или
,(3) где n-объем
выборки,
k-число
интервалов разбиения выборки,
-число
значений выборки, попавших в і-й интервал
(обычно это число не должно быть меньше
5),
-
теоретическая частота попадания значений
в і-й интервал.
Для
распределений признаков, которые
принимают всего 2 значения в формулу
расчета критерия соответствия Хи-квадрат
вносится поправка
Йейтса
Согласно теореме Пирсона, статистика
(3) имеет
распределения с m=k-r-1
степениями
свободы, где r-число
параметров предполагаемого распределения.
Если распределение нормально, то
оценивают два параметра ( а и
),
поэтому число степеней свободы m=k-2-1.
Правило применения критерия
Н0: «между эмперическим распределением и теоретической моделью нет никакого различия». Н1: «между эмперическим распределением и теоретической моделью есть различие».
Выбираем уровень значимости α критерия.
По формуле или вычисляют
-выборочное
значение статистики критерия.По таблице -распределения находим критическую точку
Если ≤ , то гипотеза Н0 принимается; если > , то гипотеза Н0 отвергается.
Неоходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений (то есть ≥5 ). Если в отдельных интервалах их меньше, то число интервалов надо уменьшить путем объединения (укрепления) соседних интервалов.
АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ.
