- •Содержание
- •1 Первичная обработка статистических данных
- •Генеральная совокупность и случайная выборка
- •Сбор статистических данных
- •Закон распределения случайной дискретной
- •1.4 Функция распределения случайной величины
- •1. Функция распределения является неубывающей функцией, то есть
- •Все значения функции распределения изменяются от 0 до 1, то есть
- •Функция распределения является непрерывной слева, то есть
- •1.5 Плотность распределения вероятностей
- •1.6 Группировка статистических данных
- •1.7 Графическое представление статистических данных
- •1.8 Эмпирическая функция распределения
- •Упражнения
- •2 Числовые характеристики выборочного
- •2.1 Мода и медиана
- •2. Для каждого из этих интервалов находятся соответствующие частоты:
- •Значение моды вычисляется по формуле:
- •2. Далее медиана статистического ряда вычисляется по формуле:
- •2.2 Выборочное среднее
- •2.3 Геометрическое среднее и гармоническое среднее
- •Выборочная дисперсия и стандартное отклонение
- •2.5 Выборочные и теоретические моменты
- •2.6 Асимметрия и эксцесс
- •2.7 Процентные точки и квантили распределения
- •В выборке имеется не более k % значений, меньших числа ;
- •В выборке имеется не более % значений больших числа .
- •Упражнения
- •Приложение а (обязательное)
- •Приложение б (справочное)
- •Для вычисления числовых характеристик в ms Excel
- •246019, Г. Гомель, ул. Советская, 104
2. Далее медиана статистического ряда вычисляется по формуле:
Х
.
Подчеркнем,
что
– это нижняя граница медианного
интервала, n
– объем всей выборки,
–
сумма частот всех интервалов, расположенных
ниже медианного,
– частота медианного интервала,
– длина каждого
интервала.
Пример 2.5 Найдем медиану статистического ряда по данным о возрасте пациентов поликлиники.
Таблица 2.5 – Данные исследования о возрасте пациентов поликлиники
Возраст |
10–20 |
20–30 |
30–40 |
40–50 |
50–60 |
60–70 |
70–80 |
80–90 |
|
17 |
24 |
35 |
48 |
57 |
42 |
21 |
6 |
Объем
всей выборки n
= 250, поэтому
= 125. Последовательно
складываем частоты пока не получим
сумму, равную или большую 125:
17 + 24 + 35 + 48 = 124, но
17 + 24 + 35 + 48 + 57 = 181.
Сумма частот первых четырех интервалов меньше 125, а сумма частот пяти интервалов больше 125, поэтому именно пятый интервал [50; 60) является медианным. Вычислим медиану по данной формуле:
Х
или
Х
.
Это значение медианы показывает, что возраст половины пациентов в данной выборке не больше 50 лет и 2 месяцев.
■
Пример 2.6 Найдем медиану статистического ряда из примера 1.8, представляющего данные о высоте зданий.
Таблица 2.6 – Статистический ряд измерений высоты зданий
Высота зданий |
5–10 |
10–15 |
15–20 |
20–25 |
25–30 |
30–35 |
35–40 |
40–45 |
45–50 |
|
2 |
3 |
5 |
6 |
8 |
7 |
5 |
3 |
1 |
Объем
всей выборки
,
поэтому
= 20. Находим последовательно суммы
частот:
2 + 3 + 5 + 6 = 16 < 20,
но 2 + 3 + 5 + 6 + 8 = 24 > 20.
Поэтому пятый интервал [25; 30) является медианным.
Вычислим медиану по указанной выше формуле:
Х
.
Следовательно, Xмед = 27,5. Это значение показывает, что в исследуемой выборке половина зданий имеет высоту не более 27,5 метров.
■
Заметим, что медиана существует в любой статистической выборке. Следует подчеркнуть и такое полезное свойство медианы как её нечувствительность к месторасположению экстремальных значений в больших выборках. Наличие в выборке сильно отклоняющихся значений создает определенные проблемы при анализе, поэтому использование медианы позволяет в определенных случаях обойти некоторые трудности.
Известно, что существуют симметричные и асимметричные распределения случайных величин. В том случае, когда выборочные данные реализуют симметричное распределение, то значение медианы и моды практически совпадают. Для асимметричных распределений равенство не выполняется.
