- •§5. Основные статистики выборочного распределения
- •5.1. Средняя выборочная и ее свойства
- •5.2. Порядковые средние.
- •5.3. Показатели вариации
- •Найдя дисперсии всех групп, можно найти среднюю арифметическую этих дисперсий с учетом объемов групп. В этом случае получаем внутригрупповую дисперсию.
- •5.4. Упрощенный метод расчета характеристик вариационного ряда
- •5.5. Другие характеристики вариационных рядов.
- •Задачи для самостоятельного решения
5.3. Показатели вариации
Самым простым и самым приближенным показателем вариации (изменчивости) является, уже определенный выше, размах вариационного ряда. Напомним, что размах R равен разности между наибольшим и наименьшим значениями вариантов. Размах выборки – величина неустойчивая, существенно зависит от случайных обстоятельств, поэтому, по возможности, для решения практических задач не используется.
Более точными и более важными показателями вариации являются величины, которые характеризуют разброс значений вариант вокруг средней выборочной . К ним относятся: среднее линейное отклонение, дисперсия, среднеквадратическое отклонение и коэффициент вариации.
Среднее
линейное (абсолютное) отклонение
вариационного
ряда – это характеристика изменчивости,
равная средней арифметической абсолютных
величин отклонений вариантов от их
средней выборочной.
Для дискретного ряда распределения частот
Варианты хi |
x1 |
x2 |
… |
xm |
Частоты ni |
n1 |
n2 |
… |
nm |
среднее линейное отклонение находится по формуле:
(5.8)
Для интервального ряда формула для нахождения линейного отклонения почти такая же, только значения вариант в ней заменены серединами соответствующих интервалов, а именно
(5.9)
Следует обратить внимание, что если в формулах (5.8) и (5.9) в числителе не ставить знак модуля, то такая сумма отклонений всегда будет равна нулю и, следовательно, не может характеризовать разброс значений ряда.
Пример 5.6. Найти среднее линейное отклонение для дискретного ряда
Варианты хi |
2 |
3 |
5 |
8 |
Частоты ni |
1 |
4 |
3 |
2 |
Решение. Объем статистической совокупности равен n = 10. Найдем среднюю выборочную
.
Найдем по формуле (5.8) среднее линейное отклонение, получим
.■
В
формуле для нахождения среднего линейного
отклонения используется понятие модуля.
Во многих задачах стараются не использовать
это понятие, а заменять его каким-либо
другим. В частности, такое нежелание
использовать модуль, связано с тем, что
функция
не имеет производной в точке х
= 0. При замене модуля используют следующий
прием. Каждое отклонение берут не по
модулю, а возводят в квадрат, чтобы
избавиться от отрицательных знаков.
Затем находят среднюю арифметическую
полученных квадратов отклонений, т.е.
величину, называемую дисперсией. Для
определения самого среднего отклонения
извлекают квадратный корень из дисперсии
и получают величину, называемую
среднеквадратическим отклонением.
Выборочной
дисперсией
вариационного ряда
называется характеристика изменчивости,
равная средней арифметической квадратов
отклонений вариантов от их средней
выборочной.
Для дискретного ряда распределения частот
Варианты хi |
x1 |
x2 |
… |
xm |
Частоты ni |
n1 |
n2 |
… |
nm |
дисперсия находится по формуле:
(5.10)
Для интервального ряда формула для нахождения дисперсии почти такая же, только варианты в ней заменены на середины соответствующих интервалов, а именно
(5.11).
Формула (5.10) может быть легко преобразована в следующую формулу
,
(5.12)
где wi – частости интервалов.
Сравнив формулу (5.12) с формулой для нахождения дисперсии D(Х) дискретной случайной величины, видим внешнюю схожесть. Различие состоит в том, что в формулу (5.12) входит вместо математического ожидания средняя выборочная, а на месте вероятности поставлена частость.
Несмотря на эти различия, между теоретической и эмпирической дисперсиями много общего. Они обе являются мерой рассеивания. Кроме этого, как будет видно из дальнейшего, они обладают похожими свойствами. Поэтому, используя утверждения теорем Чебышева и Бернулли (см. параграф 1), можно считать дисперсию вариационного ряда при больших n приближенным значением или выборочным аналогом теоретической дисперсии, соответствующей случайной величины.
Выборочная дисперсия, также как и теоретическая, обладает одним существенным недостатком: она выражается в квадратных единицах значений вариантов. Таким образом, размерность вариантов и дисперсии не совпадает. Для того чтобы получить меру разброса значений в тех же единицах, что и значения вариантов, определяют еще одну характеристику изменчивости, называемую среднеквадратическим отклонением.
Среднеквадратическим
отклонением
вариационного ряда
называется характеристика изменчивости,
равная арифметическому квадратному
корню из дисперсии, т.е.
(5.13)
Среднеквадратическое
отклонение
вариационного
ряда называют эмпирическим или выборочным
(а в некоторых учебниках и стандартным),
чтобы показать его отличие от
среднеквадратического отклонения
(Х)
случайной величины.
Пример 5.7. Найти среднеквадратическое отклонение для дискретного ряда из примера 5.6:
Варианты хi |
2 |
3 |
5 |
8 |
Частоты ni |
1 |
4 |
3 |
2 |
Решение.
Объем статистической совокупности
равен n
= 10. При решении примера 5.6 была найдена
средняя арифметическая
.
Применим формулу (5.12) и найдем дисперсию
ряда, получим
.
Отсюда
среднеквадратическое отклонение равно
.■
Отметим основные свойства дисперсии и среднеквадратического отклонения, пояснение которых будем проводить на примере дискретного вариационного ряда:
Дисперсия и среднеквадратическое отклонение постоянной величины равны нулю.
Свойство становиться достаточно понятным, если вспомнить, что дисперсия определяет разброс значений, а постоянная величина разброса не имеет (или имеет разброс, равный нулю).
Если все варианты увеличить или уменьшить на одно и тоже число с, то дисперсия и среднее квадратическое отклонение не изменятся, т.е.
и
.
Доказательство следует из третьего свойства средней выборочной: с учетом следующих равенств:
.
Если все варианты увеличить (или уменьшить) в k раз, то дисперсия увеличиться (или уменьшиться) в k2 раз, а среднее квадратическое отклонение увеличиться (или уменьшиться) в |k| раз, т.е.
и
.
Доказательство также следует из третьего свойства средней выборочной: с учетом следующих равенств:
.
Если все частоты вариантов умножить на одно и тоже число, то дисперсия и среднеквадратическое отклонение не изменяться, а именно
Дисперсия вариационного ряда равна разности между средней арифметической квадратов вариантов и квадратом средней выборочной вариационного ряда, т.е.
.
Доказательство получается из следующих равенств:
Для дисперсии существует определенное правило, которое имеет большое значение в статистическом анализе.
Правило сложения дисперсий.
Предположим,
что вся статистическая совокупность
разделена на k
групп. Тогда каждую группу можно
рассматривать как отдельную статистическую
совокупность со своим объемом mj,
средней арифметической
-
групповой средней и дисперсией
относительно этой средней
,
так называемой групповой дисперсией,
где j=1,
2, …, k.
Групповой дисперсией называется дисперсия вариантов, принадлежащих одной группе, относительно групповой средней.
