- •Математическая статистика Учебное пособие
- •Содержание
- •Предисловие
- •Введение
- •1. Математическая статистика. Предмет и задачи
- •2. Способы сбора информации
- •3. Первичная обработка выборки
- •3.1. Решение типовых задач
- •3.2. Задачи для самостоятельного решения
- •4. Статистические оценки параметров генеральной совокупности и их классификация
- •4.1. Точечные оценки
- •4.2. Доверительные интервалы
- •4.3. Доверительные интервалы для параметров нормального распределения Доверительный интервал для математического ожидания при известном σ
- •Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном σ
- •Доверительный интервал для ско нормального распределения
- •4.4. Решение типовых задач
- •4.5. Задачи для самостоятельного решения
- •5. Статистическая проверка статистических гипотез
- •5.1. Статистические гипотезы
- •5.2. Ошибки при проверке гипотез
- •5.3. Общая схема проверки гипотез
- •5.4. Критерий согласия Пирсона
- •Методика расчета теоретических частот
- •5.5. Решение типовых задач (типового расчета)
- •6. Элементы корреляционно-регрессионного анализа
- •6.1. Решение типовых задач (типового расчета)
- •Пояснения к составлению расчетной таблицы 3
- •6.2. Задачи для самостоятельного решения
- •7. Элементы дисперсионного анализа
- •7.1. Постановка задачи
- •7.2. Однофакторный дисперсионный анализ Одинаковое число испытаний на всех уровнях
- •Неодинаковое число испытаний на различных уровнях
- •7.3. Решение типовых задач
- •7.4. Задачи для самостоятельного решения
- •Варианты типовых расчетов
- •Вопросы для самопроверки
- •Ответы к задачам
- •Заключение
- •Принятые условные обозначения
- •Список литературы
- •Затабулированные функции
- •665709, Братск, ул. Макаренко, 40
2. Способы сбора информации
Пусть требуется изучить некоторую совокупность однородных объектов относительно качественных и количественных признаков. Например, для партии деталей
качественный признак Х – стандартность детали;
количественный признак Х – контролируемый размер детали.
Различают следующие способы сбора информации:
Сплошное обследование всех единиц изучаемой совокупности.
Н есплошное обследование, т. е. случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению (рис. 2).
Рис. 2. Виды отборов
О. 1. Генеральная совокупность (ГС) – это все объекты, предназначенные для исследования.
О. 2. Количество объектов (элементов) ГС называется ее объемом (N).
На практике в случае большого объема ГС сплошное исследование физически невозможно, а также связано с большими трудовыми и материальными затратами.
О. 3. Выборочной совокупностью (ВС) или просто выборкой называют все случайно отобранные из генеральной совокупности объекты, предназначенные для непосредственного исследования.
О. 4. Число элементов в выборке называется объемом выборки (n).
О. 5. Выборка, правильно представляющая пропорции ГС, называется репрезентативной (т. е. объективно отражающая ГС).
Для репрезентативной выборки следует придерживаться принципов случайности и достаточности числа взятых объектов.
3. Первичная обработка выборки
Пусть из ГС извлекли выборку, причем разные объекты имеют разные числовые значения (xi) изучаемого параметра.
О. 1. Наблюдаемые значения изучаемого параметра (количественного либо качественного признака) называются вариантами (xi).
О. 2. Последовательность вариант, записанная в порядке возрастания (убывания), называется вариационным рядом.
есть вариационный ряд,
если (или х1 ≥ х2 ≥ х3 ≥ … ≥ хn).
О. 3. Число, показывающее, сколько раз данная варианта xi встречается в совокупности, называется частотой варианты (ni).
Очевидно, что для любой выборки .
О. 4. Отношение называется относительной частотой варианты ( , т. к. ).
О. 5. Статистическим распределением выборки (или статистическим рядом) называется перечень вариант xi вариационного ряда и соответствующих им частот ni (либо относительных частот ωi).
xi |
x1 |
x2 |
… |
xk |
либо |
xi |
x1 |
x2 |
… |
xk |
ni |
n1 |
n2 |
… |
nk |
i |
1 |
2 |
… |
k |
При большом объеме выборки или при незначительных отклонениях вариант строят интервальный статистический ряд: интервал, содержащий все значения выборки, разбивают на k равных интервалов и подсчитывают частоты интервалов.
О. 6. Размахом выборки называют расстояние между наименьшим и наибольшим значением вариант этой выборки.
Расчет длины и границ интервалов проводится по следующим формулам:
,
где k – количество задаваемых интервалов;
= х1; ;
остальные границы рассчитываются по формуле xi = xi–1 + ∆x.
О. 7. Частотой интервала называется количество всех вариант, попавших в данный интервал.
Интервальный статистический ряд имеет вид
-
№
(xi, xi+1)
ni
1
(x1, x2)
n1
2
(x2, x3)
n2
…
…
…
…
k
(xk–1, xk)
nk
____________
– середина интервала (xi, xi+1).
Геометрической интерпретацией статистического ряда являются полигон и гистограмма частот.
О. 8. Полигоном частот называют ломаную на координатной плоскости, отрезки которой соединяют последовательно точки (x1, n1), (x2, n2), …, (xk, nk) (рис. 3).
О. 9. Полигоном относительных частот называют ломаную на координатной плоскости, отрезки которой последовательно соединяют точки (x1, ω1), (x2, ω2), …, (xk, ωk) (рис. 4).
ni
nk
n2
n1
x1 x2 x3 xk xi
Рис. 3. Полигон частот
ωi
ω2
ω1
x1 x2 x3 xk xi
Рис. 4. Полигон относительных частот
Если статистический ряд интервальный, то для него строят гистограмму частот (либо относительных частот).
О. 10. Гистограммой частот (рис. 5) называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы (xi, xi+1) длиной Δх, а высоты равны отношению
.
Площадь i-го прямоугольника равна сумме частот вариант, попавших в i-й интервал:
.
Тогда площадь всей гистограммы частот равна сумме всех частот, т. е. объему выборки n:
.
Рис. 5. Гистограмма частот
На гистограмме частот строят эмпирическую функцию плотности распределения f *(x).
По виду f*(x) можно выдвинуть гипотезу о виде распределения изучаемого признака, который можно рассматривать как случайную величину Х (с.в. Х). Например, можно предположить, что на рис. 6 признак Х распределен равномерно, на рис. 7 – нормально, на рис. 8 – по показательному закону.
Аналогично строят гистограмму относительных частот (рис. 9).
x1 x2 x3 xk–1 xk xi
Рис. 9. Гистограмма относительных частот
Площадь гистограммы определяется по формуле
.
На основании статистического ряда строится эмпирическая (полученная опытным путем) функция распределения.
О. 11. Эмпирической функцией распределения (обозначается F*(x)) называют функцию, определяющую для каждого числа x относительную частоту события X < x:
,
где nx – число вариант, меньших х; n – объем выборки.