- •Статистическая обработка выборочных данных
- •Перечень основных понятий, определений и расчётных формул
- •Теории вероятности и аналитической статистики
- •Основы теории вероятности
- •Случайное событие
- •Вероятность события
- •Случайная величина
- •Закон распределения
- •Плотность распределения (плотность вероятности)
- •Математическое ожидание (среднее, среднее значение)
- •Дисперсия (рассеяние)
- •Среднеквадратическое отклонение (стандартное отклонение)
- •Нормальное распределение (распределение Гаусса)
- •Двумерное нормальное распределение
- •Коэффициент корреляции
- •Основы аналитической статистики Единица наблюдения
- •Генеральная совокупность
- •Выборка
- •Статистика
- •Ошибка оценки
- •Выборочное среднее
- •Выборочная дисперсия
- •Выборочное среднеквадратическое отклонение
- •Выборочная среднеквадратическая ошибка
- •Выборочный коэффициент корреляции
- •Гистограмма
- •Оценка доли качественного признака и её ошибка
- •Оценка математического ожидания количественного признака и её ошибка
- •Доверительный интервал
- •Необходимый объём выборки при оценке доли качественного признака
- •Необходимый объём выборки при оценке математического ожидания количественного признака
- •Роль нормального распределения в статистике
Необходимый объём выборки при оценке доли качественного признака
Необходимый объём выборки – это такое количество выборочных данных, которое обеспечивает среднеквадратическую ошибку оценки не хуже заданной .
Оцениваемая доля качественного признака p находится в пределах от 0 до 1. Заданная ошибка оценки обычно принимается равной 0,10 , 0,05 , 0,01 (10 %, 5 %, 1 %).
Необходимый объём выборки вычисляется с использованием формулы для ошибки доли качественного признака, в которой доля качественного признака p оценена по доступной выборке небольшого объёма:
nнеобх = .
Необходимый объём выборки при оценке математического ожидания количественного признака
Для задания допустимой среднеквадратической ошибки оценки математического ожидания количественного признака используется относительная ошибка, численно равная отношению среднеквадратической ошибки оценки к значению оценки:
= .
Заданная относительная ошибка оценки зад обычно принимается равной 0,10 , 0,05 , 0,01 (10 %, 5 %, 1 %).
Необходимый объём выборки вычисляется с использованием формулы для ошибки оценки математического ожидания количественного признака, в которой выборочная дисперсия s2 определяется по доступной выборке небольшого объёма:
nнеобх = .
Роль нормального распределения в статистике
Нормально распределённые случайные величины имеют наиболее широкое распространение как в природе, так и в статистическом анализе.
Частое применение нормального распределения при оценивании и проверке гипотез обусловлено тем, что при объёме выборки, превышающем 25, любые статистики имеют распределение, практически не отличающееся от нормального, причём вне зависимости от вида распределения наблюдаемой случайной величины. Более того, уже начиная с объёма выборки 10 распределение статистик имеет большое сходство с нормальным.
При выборках малого объёма распределение статистики может существенно отличаться от нормального, и использование нормального распределения для описания статистики приводит к большим ошибкам. Ряд статистик от выборок малого объёма описывается распределением Стьюдента, которое хорошо изучено, и поэтому широко применяется.