
- •Элементы
- •2. Формы представления выборки.
- •3. Числовые характеристики выборки.
- •3.1. Описательные статистики
- •3.2. Обработка выборки в среде Excel.
- •4. Моделирование генеральной совокупности по результатам выборки.
- •4.1. Виды распределений
- •4.2 Точечные оценки параметров распределений.
- •4.2.1. Оценка математического ожидания.
- •4.2.2. Метод максимального правдоподобия
- •4.3. Интервальные оценки параметров
- •4.3.1. Доверительный интервал для математического ожидания нормально распределённой случайной величины.
- •4.3.1.1. Стандарт известен.
- •4.3.1.2. Стандарт неизвестен.
- •4.3.2. Доверительный интервал для дисперсии нормального распределения
- •4.3.3. Интервальная оценка доли (параметра биноминального распределения).
- •4.4 Проверка адекватности функции распределения
- •4.4.1. Метод Колмогорова.
- •4.4.2. Хи-квадрат тест.
- •4.4.3. Проверка нормальности распределения в надстройке AtteState.
- •1.Генеральная совокупность и выборка.
- •2. Формы представления выборки.
- •3. Числовые характеристики выборки.
- •3.1. Описательные статистики
- •3.2. Обработка выборки в среде Excel.
- •4. Моделирование генеральной совокупности по результатам выборки.
- •4.1. Виды распределений
- •4.2 Точечные оценки параметров распределений.
- •4.2.1. Оценка математического ожидания.
- •4.2.2. Метод максимального правдоподобия
- •4.3. Интервальные оценки параметров
- •4.3.1. Доверительный интервал для математического ожидания нормально распределённой случайной величины.
- •4.3.1.1. Стандарт известен.
- •4.3.1.2. Стандарт неизвестен.
- •4.3.2. Доверительный интервал для дисперсии нормального распределения
- •4.3.3. Интервальная оценка доли (параметра биноминального распределения).
- •4.4 Проверка адекватности функции распределения
- •4.4.1. Метод Колмогорова.
- •4.4.2. Хи-квадрат тест.
- •4.4.3. Проверка нормальности распределения в надстройке AtteState.
4.4.2. Хи-квадрат тест.
Проверку
адекватности полученной модельной
функции распределения можно провести
путём сравнения рассчитанных с её
помощью величин с данными выборки.
Стандартная процедура заключается в
следующем. Выборка объёма
разбивается на
групп
(интервалов), в каждой (-ом) из которых
вариант
,
и по найденной функции распределения
рассчитываются вероятности
попадания случайной величины в эти
группы (интервалы). После этого составляется
статистика:
распределение
которой асимптотически приближается
к распределению
с
степенями свободы. (
-число
групп (интервалов),
-число
параметров распределения, найденных
по выборке). Очевидно, чем меньше
вычисленное значение
,
тем лучше полученная функция распределения
описывает распределение как выборки
так и генеральной совокупности. Однако,
поскольку
-
случайная величина, надо определиться,
до какого её значения полученное описание
можно считать адекватным. Для установления
этого предельного значения необходимо,
как и при построении доверительного
интервала, задаться некоторой доверительной
вероятностью
,
или уровнем значимости
,
и
найти его по значениям
и
в таблице значений
,
соответствующих вероятностям
,
Найденную
функцию распределения можно считать
адекватной на уровне значимости
,
если
окажется меньше табличного значения.
Следует
иметь в виду, что слишком малые значения
недопустимы.
Поэтому, если в какой-то группе оно
окажется меньше пяти, её надо объединить
с соседней.
В
Excel
такую проверку
легко сделать с применением функции
ХИ2ТЕСТ
из меню
«Статистические».
Предварительно с помощью функции ЧАСТОТА надо сформировать
массив
частот, а с помощью ХХХХРАСПР
– массив
соответствующих значений интегральной
функции распределения. Далее, путём
вычитания смежных значений интегральной
функции, следует получить массив
вероятностей, а умножая эти вероятности
на общее число вариант – массив
теоретических частот np(i)
. Затем в окошко Фактический
интервал диалогового
окна ХИ2ТЕСТ
вводим
массив Частота,
а в окошко
Ожидаемый
интервал –
массив np(i).
Функция
возвращает вероятность того, что значения
могут превышать рассчитанные по выборке.
С определёнными оговорками эту величину
можно принять за вероятность того, чтовыборочное
распределение не противоречит модельному.
Ниже приведён результат применения
ХИ2ТЕСТ к
массиву результатов химического анализа,
полученных группой студентов. При этом
значения F(x)
рассчитывались
функцией НОРМРАСПР
с параметрами,
рассчитанными по этой выборке.
Карман |
Частота |
F(x) |
p(i)=F(x(i))-F(x(i-1) |
np(i) | |
3 |
4 |
0,040059 |
0,040059157 |
4,005915686 | |
6 |
12 |
0,158655 |
0,118596097 |
11,85960971 | |
9 |
23 |
0,401294 |
0,24263842 |
24,26384204 | |
12 |
31 |
0,691462 |
0,290168787 |
29,0168787 | |
15 |
20 |
0,89435 |
0,202887765 |
20,28877651 | |
18 |
8 |
0,97725 |
0,082899642 |
8,289964172 | |
21 |
2 |
0,99702 |
0,019770369 |
1,977036871 | |
хи-квадрат |
| ||||
0,999802 |
|