
- •Теория вероятностей и математическая статистика
- •Правила выполнения и оформления контрольных работ
- •Тема 1 Классическая и статистическая вероятности
- •Тема 2 Теоремы сложения и умножения вероятностей
- •Тема 3 Полная вероятность. Формула Байеса
- •Тема 4 Повторные независимые испытания
- •Тема 5 Случайные величины
- •Тема 6 Закон нормального распределения.
- •Тема 7 Закон больших чисел
- •Тема 8 Выборочный метод
- •Тема 9 Статистические оценки параметров распределения
- •Тема 10 Доверительная вероятность. Интервальные оценки
- •Тема 11 Элементы теории корреляции
- •Уравнение линейной зависимости между х и y называется выборочным уравнением прямой линии регрессии и имеет вид:
- •Задача 2
- •Задача 3
- •Задача 5
- •Литература
Тема 9 Статистические оценки параметров распределения
Пусть требуется изучить количественный признак генеральной совокупности. Из теоретических соображений и по виду гистограммы или полигона частот установлено, что изучаемый признак распределен в генеральной совокупности по нормальному закону. Тогда необходимо оценить математическое ожидание и среднее квадратическое отклонение, то есть параметры, определяющие нормальное распределение.
Для того чтобы статистическая оценка, найденная по данным выборки, давала «хорошее» приближение оцениваемого параметра, она должна удовлетворять следующим трем требованиям: быть несмещенной, эффективной и состоятельной.
Несмещенной
называют статистическую оценку
,
математическое ожидание которой равно
оцениваемому параметру
при любом объеме выборки:
.
Эффективной называют статистическую оценку, которая при заданном объеме выборки имеет наименьшую возможную дисперсию.
Состоятельной
называют статистическую оценку, которая
при
стремится по вероятности к оцениваемому
параметру.
Для изучения генеральной совокупности относительно количественного признака извлечена выборка объема .
Точечная оценка представляет из себя приближённое значение оцениваемого параметра и определяется одним числом.
Выборочной средней
называют среднее арифметическое
взвешенное значение признака выборочной
совокупности и вычисляется по формуле:
.
Выборочная
средняя
есть несмещенная, эффективная и
состоятельная оценка генеральной
средней
.
Для того, чтобы
охарактеризовать рассеяние наблюдаемых
значений количественного признака
выборки вокруг своего среднего значения
,
вводят выборочную дисперсию,
которую вычисляют по формуле
и среднее
квадратическое отклонение
,
которое в математической статистике
часто называют выборочным стандартом.
Выборочную
дисперсию
и отклонение
вычисляют для больших выборок
.
Для малых выборок
вычисляют исправленную
дисперсию
:
и исправленное стандартное отклонение:
Вычисление
выборочных характеристик
,
DB,
и
часто называют первичной статистической
обработкой результатов наблюдений.
Для сравнения
различных вариационных рядов служит
коэффициент вариации
или
:
тот из рядов имеет большее рассеяние
по отношению к выборочной средней, у
которого коэффициент вариации больше.
Вычислим точечные характеристики для примеров 1 и 2 темы 8.
Пример 1 (продолжение). Составим расчетную таблицу 1.
Таблица 1
хi |
ni |
xini |
(xi- )2ni |
36 |
1 |
36 |
29,49 |
37 |
1 |
37 |
19,62 |
38 |
5 |
190 |
58,82 |
39 |
8 |
312 |
47,24 |
40 |
17 |
680 |
34,76 |
41 |
23 |
943 |
4,25 |
42 |
20 |
840 |
6,50 |
43 |
9 |
387 |
22,18 |
44 |
7 |
308 |
46,23 |
45 |
5 |
225 |
63,72 |
46 |
3 |
138 |
62,65 |
47 |
1 |
47 |
31,02 |
Сумма |
100 |
4143 |
426,49 |
Вычислим:
,
,
,
,
,
.
По расчетам видно, что для выборки объема в 100 единиц выборочный стандарт и исправленный стандарт отличаются незначительно.
Пример 2. Получено распределение людей по росту:
Таблица 1
Рост, см |
(146;152] |
(152;158] |
(158;164] |
(164;170] |
(170;176] |
(176;182] |
(182;188] |
Кол-во |
10 |
91 |
301 |
371 |
184 |
38 |
5 |
Построить гистограмму частот по данному распределению.
Определить точечные оценки параметров распределения.
Решение: Найдем плотности частот , где ширина частичных интервалов
h=152–146=6:
Таблица 2
|
(146;152] |
(152;158] |
(158;164] |
(164;170] |
(170;176] |
(176;182] |
(182;188] |
Сумма |
|
10 |
91 |
301 |
371 |
184 |
38 |
5 |
1000 |
|
1,67 |
15,67 |
50,17 |
61,83 |
30,67 |
6,33 |
0,83 |
|
Гистограмма частот.
ni/h
От интервального ряда перейдем к ряду дискретному, найдя для каждого частичного интервала середину: х1=(146+152):2=149 и т. д. Составим расчетную таблицу 2.
Таблица 2
хi |
ni |
xini |
(xi- )2ni |
149 |
10 |
1490 |
2746,3 |
155 |
91 |
14105 |
10170,8 |
161 |
301 |
48461 |
5991,9 |
167 |
371 |
61957 |
756,5 |
173 |
184 |
31832 |
10152,2 |
179 |
38 |
6802 |
6851,8 |
185 |
5 |
925 |
1887,2 |
Сумма |
1000 |
165572 |
39556,7 |
Вычислим среднее выборочное :
см
– средний рост людей данной группы;
выборочную дисперсию :
и выборочный стандарт :
cм характеризует абсолютный
разброс выборочных данных вокруг
среднего.
Коэффициент вариации :
характеризует относительный разброс
выборочных данных вокруг среднего.