
- •Теория вероятностей. Математическая статистика часть 2
- •Isbn Севмашвтуз, 2007
- •Введение
- •1. Выборки и их характеристики
- •Предмет математической статистики
- •1.2. Генеральная и выборочная совокупности
- •1.3. Статистическое распределение выборки
- •1.4. Эмпирическая функция распределения
- •1.5. Графическое изображение статистического распределения
- •2. Статистическое оценивание
- •2.1. Точечные оценки. Выборочная средняя и выборочная дисперсия
- •2.2. Метод моментов
- •2.3. Метод максимального правдоподобия
- •В случае пуассоновского распределения
- •2.4. Интервальное оценивание параметров
- •3. Проверка статистических гипотез
- •3.1. Задачи статистической проверки гипотез
- •3.2. Статистическая гипотеза. Статистический критерий
- •3.3. Проверка гипотез о законе распределения
- •4. Корреляционно-регрессионный анализ
- •Понятие о корреляционной и регрессионной связи
- •Коэффициент корреляции
- •4.3. Линейная парная регрессия.
- •Указания к выполнению контрольной работы
- •Варианты заданий для контрольной работы
- •Пример выполнения контрольной работы
- •Решение.
- •Решение.
- •Список рекомендуемой литературы
- •Продолжение приложения 2
- •Часть 2
- •164500, Г. Северодвинск, ул. Воронина, д.6
2. Статистическое оценивание
2.1. Точечные оценки. Выборочная средняя и выборочная дисперсия
Оценки параметров генеральной совокупности, полученные на основании выборки, называются статистическими. Если статистическая оценка характеризуется одним числом, она называется точечной. К числу таких оценок относятся выборочная средняя и выборочная дисперсия.
Выборочная средняя определяется как среднее арифметическое полученных по выборке значений:
,
где
варианта выборки;
частота
варианты;
объем выборки.
Выборочную среднюю можно записать и так:
,
где
частость.
Выборочная
средняя может обозначаться и без нижнего
индекса:
.
Отметим,
что в случае интервального статистического
ряда в качестве варианты
берут середины интервалов ряда, а в
качестве
- частоты соответствующих интервалов.
Выборочной
дисперсией
называется среднее арифметическое
квадратов отклонений значений выборки
от выборочной средней
:
,
или, что то же самое,
.
Для расчетов может быть использована также формула:
,
где
- выборочная средняя квадратов вариант
выборки.
Выборочное среднее квадратическое отклонение выборки определяется формулой:
.
Особенность выборочного среднего квадратического отклонения состоит в том, что оно измеряется в тех же единицах, что и изучаемый признак.
Статистическая оценка является случайной величиной и меняется в зависимости от выборки. Если математическое ожидание статистической оценки равно оцениваемому параметру генеральной совокупности, то такая оценка называется несмещенной, если не равно – то смещенной.
Выборочная средняя является оценкой математического ожидания случайной величины и представляет собой несмещенную оценку. Выборочная дисперсия оценивает дисперсию генеральной совокупности и является смещенной оценкой.
Для
устранения смещенности выборочной
дисперсии ее умножают на
и получают величину:
,
которая называется несмещенной или исправленной выборочной дисперсией.
Величина
называется исправленным выборочным средним квадратическим отклонением.
Пример 8. Имеются данные о выручке в продовольственном магазине «Оазис» соответственно по месяцам (млн. руб.):
Месяц |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Выручка |
2,2 |
2,5 |
2,3 |
2,2 |
2,3 |
2,5 |
2,2 |
2,2 |
2,4 |
2,3 |
2,4 |
2,2 |
Найти выборочную среднюю и выборочную дисперсию.
Решение.
Построим сначала статистический ряд распределения:
Выручка, |
2,2 |
2,3 |
2,4 |
2,5 |
|
Частота, |
5 |
3 |
2 |
2 |
Находим выборочную среднюю:
.
Для
вычисления выборочной дисперсии
используем формулу
.
Чтобы воспользоваться данной формулой
найдем сначала
:
,
тогда
0,039.
В качестве описательных характеристик вариационного ряда , , …, (или полученного из него статистического распределения выборки) используется медиана, мода, размах вариации (выборки).
Размахом вариации называется число:
,
где
- наибольшая,
- наименьшая варианты ряда.
Модой
вариационного ряда называется варианта,
имеющая наибольшую частоту.
Медианой
вариационного ряда называется значение
признака (варианта), приходящееся на
середину ряда.
Если
(то есть ряд
,
,
…,
,
,
,
…,
имеет четное число членов), то
.
Если
(то есть ряд имеет нечетное число членов),
то
.
Пример 9. В результате тестирования (см. пример 2) группа абитуриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Найти характеристики выборки.
Решение.
Статистическое распределение выборки (так называемый дискретный статистический ряд) имеет вид:
|
0 |
1 |
2 |
3 |
4 |
5 |
|
|
1 |
2 |
1 |
1 |
2 |
3 |
Тогда:
,
,
,
,
,
= 5, так как 5 наиболее часто встречающаяся варианта,
.
Для непрерывно распределенного признака формулы для вычисления моды и медианы имеют вид:
,
где
начало модального интервального
интервала, то есть интервала, имеющего
наибольшую частоту,
частота модального
интервального,
частота
интервала, предшествующего модальному,
частота интервала,
следующего за модальным,
интервал группировки;
,
где
начало медианного интервала, то есть
интервала содержащего серединные
значения вариационного ряда,
накопленная частота
интервала, предшествующего модальному.