
- •Элементы
- •2. Формы представления выборки.
- •3. Числовые характеристики выборки.
- •3.1. Описательные статистики
- •3.2. Обработка выборки в среде Excel.
- •4. Моделирование генеральной совокупности по результатам выборки.
- •4.1. Виды распределений
- •4.2 Точечные оценки параметров распределений.
- •4.2.1. Оценка математического ожидания.
- •4.2.2. Метод максимального правдоподобия
- •4.3. Интервальные оценки параметров
- •4.3.1. Доверительный интервал для математического ожидания нормально распределённой случайной величины.
- •4.3.1.1. Стандарт известен.
- •4.3.1.2. Стандарт неизвестен.
- •4.3.2. Доверительный интервал для дисперсии нормального распределения
- •4.3.3. Интервальная оценка доли (параметра биноминального распределения).
- •4.4 Проверка адекватности функции распределения
- •4.4.1. Метод Колмогорова.
- •4.4.2. Хи-квадрат тест.
- •4.4.3. Проверка нормальности распределения в надстройке AtteState.
- •1.Генеральная совокупность и выборка.
- •2. Формы представления выборки.
- •3. Числовые характеристики выборки.
- •3.1. Описательные статистики
- •3.2. Обработка выборки в среде Excel.
- •4. Моделирование генеральной совокупности по результатам выборки.
- •4.1. Виды распределений
- •4.2 Точечные оценки параметров распределений.
- •4.2.1. Оценка математического ожидания.
- •4.2.2. Метод максимального правдоподобия
- •4.3. Интервальные оценки параметров
- •4.3.1. Доверительный интервал для математического ожидания нормально распределённой случайной величины.
- •4.3.1.1. Стандарт известен.
- •4.3.1.2. Стандарт неизвестен.
- •4.3.2. Доверительный интервал для дисперсии нормального распределения
- •4.3.3. Интервальная оценка доли (параметра биноминального распределения).
- •4.4 Проверка адекватности функции распределения
- •4.4.1. Метод Колмогорова.
- •4.4.2. Хи-квадрат тест.
- •4.4.3. Проверка нормальности распределения в надстройке AtteState.
Элементы
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Часть 1.
Описательная статистика
Моделирование генеральной совокупности.
1.Генеральная совокупность и выборка.
Математическая статистика – это раздел математики, в котором разработаны методы обработки результатов экспериментов, наблюдений, социологических опросов с позиций теории вероятностей. Все возможные, (по крайней мере, мысленно – возможные) результаты изучения какого-либо объекта рассматриваются как значения некоторой случайной величины с неизвестным распределением. Это множество носит название генеральной совокупности. В большинстве случаев выводы о генеральной совокупности приходится делать по некоторому конечному числу полученных значений этой случайной величины, которые называются вариантами, а их множество - выборкой. Выборка должна производиться таким образом, чтобы правильно характеризовать генеральную совокупность,- быть, как говорят, репрезентативной. Для этого она должна быть случайной. Это обеспечивается специальными процедурами получения данных.
2. Формы представления выборки.
Из
наблюдений или измерений мы получаем
выборку
случайных чисел – вариант
.
Число
называютобъёмом
выборки, а
разность между максимальным и минимальным
значением – её размахом.
Расположив варианты по возрастанию их
значений, мы получим ранжированный
вариационный ряд. Если
число вариант велико, то данные следует
структурировать. В случае, когда несколько
вариант имеют одинаковое значение,
можно представить их в виде таблицы:
|
|
|
…………… |
|
|
|
|
……………… |
|
Такая
таблица называется дискретным
вариационным рядом.
В её верхней строке указывается
различных значений вариант в порядке
их возрастания, а в нижней – числа
повторений этих значений –частоты.
Очевидно, сумма частот равна объёму
выборки,
.
Отношение
называютчастостью
варианта
;
.
Если число столбцов в ней оказывается
слишком большим, то несколько соседних
значений вариант можно объединить в
общий интервал. Тогда в первой строке
будут указываться интервалы, а во второй
– число вариант, попадающих в
соответствующий интервал. Такое
представление данных называютинтервальным
вариационным рядом.
Чаще всего строят равные интервалы, а
их число
принимают близким числу
.
Тогда ширина интервала равна
.
Для
наглядного представления дискретных
вариационных рядов строят полигоны
– ломаные линии, составленные из
отрезков, соединяющих точки с координатами
и
.
Интервальные вариационные ряды
представляют в видегистограмм
–наборов
прямоугольников, основания которых –
соответствующие интервалы, отложенные
по оси абсцисс, а высоты – соответствующие
частоты
,
или частости
.
Если интервалы имеют разную ширину, то
высоты прямоугольников устанавливается
равными отношению
,
или
.
Последнюю величину можно рассматривать
как аналог плотности вероятности .
Сумму
накопленных частостей
называютвыборочной
функцией распределения.
Очевидно, она является аналогом
интегральной функции распределения
вероятностей. Её график называется
кумулятой.