
- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
7.2 Наименьший объём выборки
Возьмём случайную
величину
–
выборочное среднее, которая от выборки
к выборке с равными объёмами может
принимать различные значения. Из
центральной предельной теоремы (п.
5.2.3) её дисперсия
.
Воспользовавшись дляYнеравенством Чебышева, получим
.
Найдём наименьший
объём выборки, при котором правая часть
неравенства равна заданному уровню
значимости
,
составив уравнение
.
Решая составленное уравнение, получим
или
(первыйспособ нахождения
).
Данная оценка
является завышенной, её можно улучшить
из условия, что
имеетнормальное
распределение, в таком случае
(см. 5.2.3)
.
Если найти такоеt,
что
,
то получим уравнение
.
В результате
получим
,
(второйспособ).
Замечание:
Часто встречается уровень достоверности,
ему соответствуетt
=1,96. В других случаях следует
вычислить значение
и найти его средизначенийфункции
в таблице (приложение 2). Значение
аргумента (жирный шрифт) соответствует
искомому значениюt.
Стоит обратить внимание, что для нахождения наименьшего объёма выборки, обеспечивающего нужное отклонение выборочного среднего с указанной достоверностью, необходимо знать дисперсиюисследуемого признака (либо его статистическую оценку – исправленную выборочную дисперсию).
В рассуждениях
предполагалась независимость
элементов выборки, т.е. выборка берётсяповторной(элемент генеральной совокупности после
исследования не исключается из неё и
может быть исследован повторно).
Для бесповторнойвыборки применимы перечисленные выводы
при условии, что объём такой выборки
значительно меньше объёма генеральной
совокупности. В противном случае для
бесповторной выборки используют формулу,
где N– объём генеральной совокупности,
S– исправленное выборочное среднее квадратичное отклонение,
t– аргумент функции Лапласа при известной достоверности.
Пример 13
Определить наименьший объём выборки, при котором выборочное среднее отличается от генерального среднего менее чем на 0,05 с достоверностью не менее 90%. Пробная выборка дала значение S=0,05.
Решение:
По условию
=0,05
,
=0,9
,
=1–
0,9 = 0,1 ,S=0,6 .
1 способ: Выборка повторная, наименьший объём выборки должен быть
.
2 способ: Выборка
повторная, наименьший объём выборки
уточним с помощью функции Лапласа. По
таблице значений функции Ф(х) найдём
значение аргумента, при котором Ф=,
получим
.
По формуле найдём соответствующее
;
3 способ: Пусть
выборка бесповторная, объём генеральной
совокупностиN=800
.
Ответ: Для бесповторной выборки достаточно взять выборку объёмаn=263, для повторнойn=400.
7.3 Доверительный интервал для м(х)
при нормальном распределении Х
Пусть критерий согласия говорит о хорошем согласовании выборочных данных с нормальным распределением Х(элементы выборки могут считаться значениями нормальной случайной величиныХ).
Точечной оценкой
параметра а=служит
,
.
Требуется найти
интервальную
оценку –
интервал с центром в
и таким радиусом
,
чтобы промежуток
«накрывал» реальное значение
с вероятностью не меньше заданного
.
При большом
объёме выборки(n50)
можно говорить о том, что
,
где
– функция Лапласа.
При заданном
получим
,
.
Из таблицы значений
функции Ф(х)(приложение 2) находится
значение аргументаt,
для которого.
Учитывая, что
,
найдется
– искомый радиус интервала. ИнтервалМ(Х)
является искомым доверительным интервалом
для математического ожидания исследуемой
случайной величины.
При малом
объёме выборки(n<50) используется правило:,
где
определяется из распределения Стьюдента
одним из способов:
а) Находим
– критическую точку распределения
Стьюдента (приложение 6), где число
степеней свободы
и уровень значимости
, область берётся двусторонней;
б) Находим значение
функции
(приложение 3), где n
–объём выборки и
–уровень
достоверности.
С помощью
находится радиус доверительного
интервала
.
Интервал
является доверительным интервалом для
математического ожидания исследуемой
случайной величины;