- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
6.2 Критерий согласия Пирсона
Критерием
является случайная величина Хи-квадрат
выборочная, вычисляемая по выборочным
данным с использованием одного из правил
,
,
,
где n– объем выборки;
k – число вариант либо промежутков разбиения.
Если некоторый
промежуток имеет малую частоту
, то его объединяют с соседним промежутком,
суммируя частоты, число промежутковkпри этом уменьшается;
ni –частота иwi– относительная частотаi–го промежутка, полученные
из статистического распределения выборки;
–выравнивающая
частота и Pi–
вероятность попадания дляi–го
промежутка, вычисленные из теоретического распределения.
Значение
показывает суммарное отличие
(относительное) между данными парами
чисел (наблюдаемого значения и значения,
получаемого из предложенного
распределения).
является случайной величиной, при
повторной выборке того же объёма может
получится другое её значение. При
случайная величина
имеет распределение Хи-квадрат сrстепенями свободы,
,
гдеk– количество
пар чисел,р– число параметров
предполагаемого распределения плюс 1.
-
Например
Для распределения Пуассона
;Для равномерного распределения
;Для нормального распределения
и т.д.
Критическая область
для критерия Пирсона чаще всего берётся
правосторонней, из условия
,
.
Критическая точка
критерия зависит от выбранного уровня
значимости и числа степеней свободы,
находится по таблице критических точек
распределения Хи-квадрат (приложение
5),
либо по графику квантильных функций
(Рис. 22). Область принятия гипотезы
.
Перечислим последовательность действийдля применения критерия Пирсона (Хи-квадрат):
Вычисляется значение
;Задавая уровень достоверности
,
находится уровень значимости
,
(
обычно берется 0.01 при
=99%,
0.05 при
=95%
или 0.1 при
=90%);
Определяется число степеней свободы
,
где k– число пар значений,t– число параметров распределения плюс 1;
По таблице значений
(приложение 5) либо по Рис. 22 находится
;Если
,
то гипотезаН0о виде
распределенияотвергается,
данные согласуются плохо.
Если
,
то гипотезаН0о виде
распределенияне
отвергается,считают расхождение выборочных данных
с предложенным распределением только
случайными (уровень согласованности
не ниже указанного
)
.
При увеличении
толькоуровня достоверности
(уменьшении уровня значимости
) значение
уменьшается, при увеличениитолькочисла степеней свободы
увеличивается.
Существует и
другая интерпретация критерия Пирсона
(Хи-квадрат): по найденному
можно с помощью другой таблицы (либо
с помощью программного обеспечения)
найти уровень согласованности
(достоверности) по объёму выборки и
числу степеней свободы. Результатом
является вероятность согласования
выборочных и предполагаемых данных.
Если такой уровень устраивает, то можно
считать отличие пар данных только
случайным. В противном случае
пары чисел согласуются плохо.
Если вычислить
для двух или более предполагаемых
распределений по одним и тем же выборочным
данным, то для данной выборки лучшее
приближение даёт распределение с
наименьшим значением
.
