
- •Элементы
- •2. Формы представления выборки.
- •3. Числовые характеристики выборки.
- •3.1. Описательные статистики
- •3.2. Обработка выборки в среде Excel.
- •4. Моделирование генеральной совокупности по результатам выборки.
- •4.1. Виды распределений
- •4.2 Точечные оценки параметров распределений.
- •4.2.1. Оценка математического ожидания.
- •4.2.2. Метод максимального правдоподобия
- •4.3. Интервальные оценки параметров
- •4.3.1. Доверительный интервал для математического ожидания нормально распределённой случайной величины.
- •4.3.1.1. Стандарт известен.
- •4.3.1.2. Стандарт неизвестен.
- •4.3.2. Доверительный интервал для дисперсии нормального распределения
- •4.3.3. Интервальная оценка доли (параметра биноминального распределения).
- •4.4 Проверка адекватности функции распределения
- •4.4.1. Метод Колмогорова.
- •4.4.2. Хи-квадрат тест.
- •4.4.3. Проверка нормальности распределения в надстройке AtteState.
- •1.Генеральная совокупность и выборка.
- •2. Формы представления выборки.
- •3. Числовые характеристики выборки.
- •3.1. Описательные статистики
- •3.2. Обработка выборки в среде Excel.
- •4. Моделирование генеральной совокупности по результатам выборки.
- •4.1. Виды распределений
- •4.2 Точечные оценки параметров распределений.
- •4.2.1. Оценка математического ожидания.
- •4.2.2. Метод максимального правдоподобия
- •4.3. Интервальные оценки параметров
- •4.3.1. Доверительный интервал для математического ожидания нормально распределённой случайной величины.
- •4.3.1.1. Стандарт известен.
- •4.3.1.2. Стандарт неизвестен.
- •4.3.2. Доверительный интервал для дисперсии нормального распределения
- •4.3.3. Интервальная оценка доли (параметра биноминального распределения).
- •4.4 Проверка адекватности функции распределения
- •4.4.1. Метод Колмогорова.
- •4.4.2. Хи-квадрат тест.
- •4.4.3. Проверка нормальности распределения в надстройке AtteState.
4.3.3. Интервальная оценка доли (параметра биноминального распределения).
Пусть
генеральная совокупность содержит
элементов, из которых
элементов обладает признаком
.
Задача состоит в определении доли
в генеральной совокупности, если в
случайной выборке объёма
оказалось
элементов с этим признаком. Если выборка
безвозвратная, то вероятность реализации
такой выборки равна
Построение
доверительного интервала для
на основе этой формулы - достаточно
трудоёмкая задача. К счастью в большинстве
случаев объём выборки во много раз
меньше объёма генеральной совокупности,
и эту вероятность можно рассчитывать
по формуле Бернулли
,
Точечная
оценка доли, полученная по методу
максимального правдоподобия
.
Границы доверительного интервала с
доверительной вероятностью
находятся по формулам Клоппера-Пирсона:
Нижняя граница
,
Верхняя граница
.
В
этих формулах
- квантиль
-
распределения с
степенями свободы уровня
.
Рассмотрим
пример. Предположим, что среди
=30
случайно отобранных для продажи
автомобилей
=8
автомобилей имеют плохую отделку. Тогда
точечная оценка доли автомобилей с
плохой отделкой равна
.
Чтобы построить 95-процентный доверительный
интервал примем
.
Тогда
=
=
;
=
=
.
Соответствующие
значения квантилей
можно
найти в таблице
-распределения
Фишера, или воспользоваться функциейFРАСПОБР
в Excel.
При этом в
окно «Вероятность»
следует
вводить значение
Найдя
значения
находим
Следовательно,
с вероятностью 0,95 истинное значение
лежит в интервале (0,123;0,459).
При
больших выборках
можно пользоваться нормальной
аппроксимацией биноминального
распределения, которая приводит к
приближённым формулам:
.
Подставляя
в эти формулы данные предыдущего примера,
находим
,
,
,
.Эти приближённые
значения достаточно близки к значениям,
полученным по точным формулам.
4.4 Проверка адекватности функции распределения
Итак, мы предположили, что выборочные данные распределены по некоторому конкретному закону и нашли соответствующие параметры. Теперь надо проверить, насколько хорошо выбранное теоретическое распределение с найденными параметрами соответствует экспериментальным данным.
4.4.1. Метод Колмогорова.
Этот метод основан на сравнении выборочной функции распределения
с
модельной
.
Простейший способ такого сравнения –
нанесение на координатную плоскость
точек
.
Если найденная модельная функция
удовлетворительно описывает распределение
экспериментальных данных, то эти точки
должны быть близки к прямой
.
Приведенная ниже иллюстрация получена
следующим образом. Последовательным
переносом 4 столбцов исходного массива
данных был сформирован один общий
столбец. Затем нажатием иконки А
Я
эти данные были упорядочены по возрастанию,
т.е был получен ранжированный вариационный
ряд. Номер варианта в этом ряду
пропорционален значению выборочной
функции распределения. Затем в соседнем
столбце с помощью функцииНОРМРАСПР
был сформирован массив значений
интегральной функции нормального
распределения с параметрами, найденными
ранее. График был получен нажатием
иконки «Диаграмма» с последующем выбором
раздела «График» в выпадающем меню
мастера диаграмм. Как видим, точки
графика достаточно близки к прямой.