- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
5 Теоретические распределения
Пусть, в зависимости
от формы статистического распределения
выборки, по выборочным данным составлен
полигон, гистограмма и (либо) график
эмпирической плотности распределения
. По их виду и
соответствующим числовым характеристикам
выборки выдвигаетсягипотеза Н0
о виде распределения исследуемой
случайной величины Х с альтернативной
гипотезой Н1о другом виде
распределения. По виду предложенного
распределения находятся егопараметры.
Перечислимосновные виды распределенийслучайных величин и укажем правила нахождения их параметров по статистическим данным.
5.1 Дискретные случайные величины
5.1.1 Биномиальное распределение
Пусть производится mнезависимых испытаний, в каждом из которых событие А появляется либо нет. Вероятность появления А в каждом испытании остаётся постоянным числомр (независимо от результатов других испытаний).
Если обозначить
случайную величину Х – число появлений
А за m испытаний,
то формулаБернулли
описывает вероятность для Х принимать
значениеk,
.
В этом случае говорят, что случайная величина Х имеет биномиальное распределение (илибиномиальнораспределена).
Пример7:
Описать биномиальное распределение при m=9 испытаниях, в каждом из которых вероятность события равна p1=0,3 ( p2=0,5 , p3=0,8) .
Решение:В результате вычислений с помощью формулы Бернулли получим следующие распределения :
|
|
x | ||||||||||
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 | ||
|
p |
0.3 |
0.0404 |
0.1556 |
0.2668 |
0.2668 |
0.1715 |
0.0735 |
0.021 |
0.0039 |
0.0004 |
0 |
|
0.5 |
0.002 |
0.0176 |
0.0703 |
0.1641 |
0.2461 |
0.2461 |
0.1641 |
0.0703 |
0.0176 |
0.002 | |
|
0.8 |
0 |
0 |
0.0003 |
0.0028 |
0.0165 |
0.0661 |
0.1762 |
0.302 |
0.302 |
0.1342 | |
Например:
при р=0,3
,
,
и т.д.
Изобразим графически полученные распределения (см. Рис.12).
По рисунку видно, что при меньшем значении рабсцисса точки максимума сдвигается влево. При удалении от точки максимума высота уменьшается.


Замечание: Распределение Х близко к биномиальному, если для выборки её значений у полигона (гистограммы) одна или несколько соседнихвариант имеют наибольшую высоту и удаление от них даёт уменьшение высоты (вероятности);
Из теории вероятностей
известно, что для биномиально распределённой
случайной величины Х числовые
характеристики
,
.
Параметром биномиального распределения служит р, её значение статистически может быть найдено следующим образом:
1) Производится серия nисследований, в каждом из которых производитсяm испытаний (в каждом из которых А происходит либо нет). В каждом исследовании фиксируется число появлений события А.
Получаем
последовательность целочисленных
значений х1,х2, …..,хn(
).
2) Для данной выборки
находим
;
3) Из оценки М(Х)=
и условия
,
получаем
,
![]()
.
5.1.2 Альтернативный признак
Пусть в каждом испытании исходом является «1», если выполнился некоторый признак, либо «0», если признак не выполнился (других исходов нет). Такой признак называется альтернативным. Альтернативным признаком может быть «годная – негодная деталь», пол работника «мужской – женский» , событие произошло – не произошло и т.д.
В результате нескольких испытаний при альтернативном признаке Х получим выборку с двумя вариантами «0» и «1».
Обозначим
р– вероятность появления признака в каждом испытании,
q– вероятность непоявления признака в
каждом испытании (
),
–относительная
частота (доля) элементов, обладающих
данным
признаком,
m– число элементов, обладающих признаком средиnисследованных.
В таком случае
,
,
.
Максимальная
дисперсия альтернативного признака
при фиксированном nдостигается прир=0,5 и равна
,
в остальных случаях она меньшее чем
.
Для выборки с исследованием альтернативного признака возможно только две варианты «1» (событие А появилось) с частотой появления m, либо «0» (событие А не появилось) с частотой появленияn–m.
В таком случае
средняя для доли равна относительной
частоте элементов с выполнением признака
,
она и является точечной оценкой
вероятности появления признака в одном
испытаниир. Дисперсия такого
значения оценивает значение
,
стремится к нулю при увеличении объёма
выборки.
По выборочным
данным вероятность рпоявления
события А (альтернативного признака)
можно оценит его точечной оценкой
–относительной
частотой появления события А.
Распределение Пуассона
Пусть производится
mнезависимых испытаний,
в каждом из которых событие А появляется
либо нет, среднее число появлений события
А является известной величиной
.
Если обозначить
случайную величину Х – число появлений
события А, то формула Пуассона
описывает вероятность для Х
принимать значениеk,
.
В таком случае говорят, что случайная
величина Х имеетраспределение
Пуассона.
Из теории вероятностей
известно, что биномиальное распределение
превращается в распределение Пуассона
при
если при этом величина
остаётся постоянной (
– среднее число появлений).
Для вычисления
вероятностей применяется таблица
значений
(приложение 7).
Пример 8:
Описать распределение
Пуассона при
1=1
,
2=3 ,
3=5
.
Решение:В результате вычислений получим следующие распределения:
|
|
х
| |||||||||||||
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 | ||
|
|
1 |
0.3679 |
0.3679 |
0.1839 |
0.0613 |
0.0153 |
0.0031 |
0.0005 |
0.0001 |
0 |
0 |
0 |
0 |
0 |
|
3 |
0.0498 |
0.1494 |
0.224 |
0.224 |
0.168 |
0.1008 |
0.0504 |
0.0216 |
0.0081 |
0.0027 |
0.0008 |
0.0002 |
0.0001 | |
|
5 |
0 |
0.0337 |
0.0842 |
0.1404 |
0.1755 |
0.1755 |
0.1462 |
0.1044 |
0.0653 |
0.0363 |
0.0181 |
0.0082 |
0.0034 | |

Из теории вероятностей
известно, что для случайной величины
Х, имеющей распределение Пуассона,
числовые характеристики
.
Замечание:
Распределение Х близко к распределению
Пуассона, если для полигона (гистограммы)
её выборочных значений одна или несколькососеднихвариант имеют наибольшую высоту и
удаление от них даёт уменьшение высоты
(вероятности), а значение
не сильно отличается от
;
Для случайной
величины Х, имеющей распределение
Пуассона, параметром служит число
, её значение по выборочным данным может
быть найдено следующим образом:
1) Производится серия nисследований, в каждом из которых производитсяm испытаний (в каждом из которых А происходит либо нет) и фиксируется число появлений события А. Получаем последовательность целочисленных значений
х1,х2,
…..,хn(
);
2) Для данной выборки
находим
.
Если
сильно отличается от
,
то распределение Пуассона вряд ли имеет
место;
3) Из оценки
и условия
,
получаем
;

.0067