- •6. Элементы математической статистики
- •6.1. Вариационные ряды и их графическая интерпретация
- •6.2. Количественные характеристики вариационного ряда
- •6.3. Понятие оценки параметров. Точечная оценка
- •6.4. Интервальные оценки. Доверительный интервал
- •Доверительный интервал для дисперсии нормального распределения
- •6.5. Применение метода наименьших квадратов для обработки результатов наблюдений
6.2. Количественные характеристики вариационного ряда
1. Средняя арифметическая вычисляется по формуле
,
где
– варианты ряда,
– соответствующие им частоты или
середины отрезков интервалов интервального
вариационного ряда,
– число неповторяющихся вариант или
число интервалов,
.
Для несгруппированного
ряда все частоты
(
),
а
есть «невзвешенная» средняя арифметическая.
2. Средняя
геометрическая
.
Эти средние величины называют аналитическими. В статистическом анализе используются также структурные или порядковые средние. Из них наиболее широко используются медиана и мода
3. Медиана
– это варианта
(значение величины, признака), приходящаяся
на середину ранжированного ряда
наблюдений.
Для дискретного вариационного ряда с нечетным числом членов медиана равна серединной варианте, а для ряда с четным числом членов – полусумме двух серединных вариант.
Достоинство медианы как меры центральной тенденции заключается в том, что на нее не влияет изменение крайних членов вариационного ряда. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми.
4. Мода
вариационного ряда
– это варианта,
которой соответствует наибольшая
частота.
Особенность моды как меры центральной тенденции состоит в том, что она не изменяется при изменении крайних членов ряда, т. е. обладает определенной устойчивостью к вариации признака.
Средние величины, рассмотренные выше, не отражают изменчивости (вариации) значений признака.
К показателям вариации относятся следующие характеристики.
5. Вариационный
размах
– разность
между наибольшей и наименьшей вариантами
ряда:
.
6. Среднее линейное отклонение – это средняя арифметическая абсолютных величин отклонений вариант от их средней арифметической:
7. Дисперсия
вариационного ряда – это средняя
арифметическая квадратов отклонений
вариант от их средней арифметической:
.
Дисперсию
часто называют
эмпирической
(или выборочной),
подчеркивая, что она находится по опытным
или статистическим данным.
8. Среднее
квадратическое отклонение
– это арифметическое значение корня
квадратного из дисперсии:
.
Вычисление средней
арифметической
и дисперсии
можно упростить, если использовать не
первоначальные варианты
,
а новые (обозначим их через
):
.
В последней формуле
и
– специально подобранные постоянные.
Средняя
арифметическая вариационного ряда
,
состоящего из вариант
,
согласно свойствам средней арифметической,
вычисляется по формуле:
.
Обозначим дисперсию
этого ряда символом
.
Тогда из свойств дисперсии случайной
величины следует, что
(Здесь случайная величина
связана со случайной величиной
формулой
).
Отсюда
и
.
Заменяя в этих
формулах
и
их выражениями через варианты
и упрощая полученные при этом формулы,
будем иметь
и
.
В этих формулах в качестве постоянной берут ширину интервала по , а в качестве – середину серединного интервала. Если серединных интервалов два (при четном числе интервалов), то в качестве следует взять середину одного из этих интервалов, например, имеющего большую частоту.
Задачи
1. Постройте полигон частот для данных вариационных рядов:
а)
;
б)
.
2. Постройте полигон относительных частот:
а)
;
б)
.
3. Постройте гистограмму частот и относительных частот по данному распределению выборки:
a)
-
Номер интервала
Частичный интервал
Сумма частот вариант интервала
Плотность частоты
1
[2, 7]
5
2
[7, 12]
10
3
[12, 17]
25
4
[17, 22]
6
5
[22, 27]
4
b)
-
Номер интервала
Частичный интервал
Сумма частот вариант интервала
Плотность частоты
1
[3, 5]
4
2
[5, 7]
6
3
[7, 9]
20
4
[9, 11]
40
5
[11,13]
20
6
[13,15]
4
7
[15,17]
6
с)
Интервал |
1< <5 |
5< <9 |
9< <13 |
13< <17 |
17< <20 |
|
10 |
20 |
50 |
12 |
8 |
4. Найдите выборочные средние для данных распределений выборки:
а)
;
b)
.
5. Найдите выборочную среднюю и выборочную дисперсию для данных выборки:
|
1 |
2 |
5 |
8 |
9 |
|
3 |
4 |
6 |
4 |
3 |
6. Дано распределение 50 рабочих механического цеха по тарифному разряду:
Тарифный разряд |
1 |
2 |
3 |
4 |
5 |
6 |
|
Частота (кол. раб.) |
2 |
3 |
6 |
8 |
22 |
9 |
50 |
а) Постройте полигон распределения рабочих по тарифному разряду;
б) Найдите медиану и моду данного распределения рабочих.
в) Найдите выборочную среднюю и выборочную дисперсию для данных выборки:
7. По заданным выборкам решите следующие подзадачи:
а) составьте вариационный ряд;
б) вычислите относительные частоты (частости) и накопленные частости;
в) постройте полигон и гистограмму вариационного ряда;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) найдите числовые характеристики вариационного ряда:
– среднее арифметическое,
– дисперсию,
– среднеквадратическое (стандартное) отклонение,
– моду,
– медиану.
7. 1. 2 4 2 4 3 3 3 2 0 6 1 2 3 2 2 4 3 3 5 1
0 2 4 3 2 2 3 3 1 3 3 3 1 1 2 3 1 4 3 1
7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5
3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3
.
Начало первого интервала – 0. Длина
интервалов – 1.
7.2. 0 4 2 0 5 1 1 3 0 2 2 4 3 2 3 3 0 4 5 1
3 1 5 2 0 2 2 3 2 2 2 6 2 1 3 1 3 1 5 4
5 5 3 2 2 0 2 1 1 3 2 3 5 3 5 2 5 2 1 1
2 3 4 3 2 3 2 4 2
.
Начало первого интервала – 0. Длина
интервалов – 1.
7.3. 3 7 4 6 1 4 2 4 6 5 3 2 9 0 5 6 7 7 3 1
5 5 4 2 6 2 1 5 3 3 1 5 6 4 4 3 4 1 5 5
3 4 3 7 4 5 6 7 5 2 4 6 6 7 7 3 5 4 4 3
5 5 7 6 6 1
.
Начало первого интервала – 0. Длина
интервалов – 1.
