
- •Тема 1. Вариационные ряды и их характеристики
- •1.1. Выборка и генеральная совокупность
- •1.2. Вариационные ряды и их графическое изображение
- •Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,
- •1 .3. Статистические характеристики вариационного ряда
- •Тема 2. Статистические оценки параметров распределения
- •( Число степеней свободы)
- •Тема 3. Статистическая проверка гипотез
- •Тема 4. Корреляционный и регрессионный анализ
- •4.1. Корреляционный анализ
- •Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.
- •4.2. Оценка достоверности коэффициента корреляции
- •4.3. Регрессионный анализ
-
Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,
;
;
;
.
-
Вычисляем частости интервалов. Например,
;
;
.
-
Вычисляем накопленные частости интервалов.
-
Данные вычислений заносим в табл. 2
Таблица 2
№ интервала |
Границы интервала |
Частота |
Накопленная частота |
Частость |
Накопленная частость |
1 |
5 7 |
3 |
3 |
0,06 |
0,06 |
2 |
7 9 |
9 |
12 |
0,18 |
0,24 |
3 |
9 11 |
17 |
29 |
0,34 |
0,58 |
4 |
11 13 |
10 |
39 |
0,20 |
0,78 |
5 |
13 15 |
7 |
46 |
0,14 |
0,92 |
6 |
15 17 |
4 |
50 |
0,08 |
1 |
Распределение типа сведенного в табл. 2 представляет собой интервальный вариационный ряд.
Анализ вариационных рядов упрощается при их графическом представлении. Наряду с гистограммой и полигоном частот можно построить полигон накопленных частостей (кумулята)
График получается
при соединении точек прямыми отрезками.
Координаты точек соответствуют верхним
границам интервалов и
накопленным частотам. Если по оси ординат
откладывать накопленные частости, то
полученный график называется полигоном
накопленных частостей.
Если ряд не интервальный, то по оси
откладывают значения измеряемого
признака, а по оси
соответствующие накопленные частоты
или частости. На рис.2 изображен полигон
накопленных частостей для примера 3.
На практике соседние точки чаще всего соединяют кривыми линиями (рис. 3).
1 .3. Статистические характеристики вариационного ряда
Для полноты картины анализа выборки рассматривают статистические характеристики вариационного ряда. С этой целью оценивают следующие качества ряда:
-
центральную тенденцию выборки;
-
вариацию.
Центральную тенденцию выборки оценивают такими статистическими характеристиками, как
-
мода;
-
медиана;
-
среднее арифметическое значение.
К характеристикам вариации относят:
-
размах;
-
дисперсию;
-
среднее квадратическое отклонение;
-
коэффициент вариации;
-
ошибку выборочного среднего.
Модой
называется значение признака, наиболее
часто встречающееся в выборке. Мода
обозначается
.
Если значения выборки сгруппированы в
интервальный вариационный ряд, то
выбирается модальный
интервал с
наибольшей частотой.
Медиана
это такое значение признака, при котором
одна половина значений признака меньше
ее, а другая половина
больше (медиана делит вариационный ряд
пополам). Медиана обозначается
.
Для отыскания медианы выборку ранжируют,
то есть значения признака располагают
в порядке возрастания или убывания. В
ранжированной выборке ранг (порядковый
номер в выборке)
медианы определяют по формуле:
, где
объем выборки.
При
нечетном ранг
целое число, и медианой считают следующее
значение:
.
При
четном ранг
число не целое, представимое в виде
,
где
целое. В таком случае медианой считают
значение
.
Среднее арифметическое неупорядоченной выборки вычисляют по формуле:
.
В случае интервального
вариационного ряда формула приобретает
вид:
,
где
частота
-го
интервала,
среднее арифметическое значение этого
интервала.
Размах вариации – это разность между максимальным и минимальным значениями выборки:
.
Дисперсией называется средний квадрат отклонений значений признака от среднего арифметического и вычисляется по формуле:
.
Средним квадратическим отклонением называется положительный квадратный корень из дисперсии:
,
Среднее квадратическое отклонение имеет ту же единицу измерения, что и варьирующий признак. Оно характеризует степень отклонения значений признака от его среднего арифметического значения в абсолютных единицах.
Для сравнения варьируемости двух или нескольких выборок, имеющих разные единицы измерения, используют коэффициент вариации. Коэффициент вариации это относительный показатель, равный отношению среднего квадратического отклонения к среднему арифметическому значению:
.
Принято
считать, что если
,
то варьируемость малая,
средняя,
большая.
Отклонения
выборочных коэффициентов от параметров
в генеральной совокупности называются
ошибками
параметров. Эти ошибки возникают в силу
того, что выборочная совокупность
представляет генеральную совокупность
только приближенно. Если взять несколько
вариантов выборок объемом
из одной и той же генеральной совокупности
и вычислить для каждой из них среднее
арифметическое, то окажется, что средние
арифметические выборок варьируют вокруг
среднего арифметического для генеральной
совокупности
в
раз меньше, чем отдельные варианты. На
этом основании в качестве стандартной
ошибки выборочного среднего
принимают величину
.
Чтобы
подчеркнуть точность оценки среднего
выборочного, его чаще всего записывают
в виде: .
Пример 4. В качестве оценки силовой подготовки учащихся 5 класса произведен тест на количество подтягиваний на перекладине.
Данные теста следующие: 9, 9, 10, 11, 8, 7, 10, 7, 9, 11, 7, 8, 9, 8, 9.
Требуется вычислить моду, медиану, среднее арифметическое значение, размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации и ошибку выборочного среднего данной выборки.
Решение.
Непосредственным подсчетом убеждаемся,
что значение
встречается в выборке чаще других (5
раз), следовательно,
.
Для вычисления медианы производим ранжировку заданной выборки:
7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 10, 10, 11, 11
Объем выборки
число нечетное, поэтому ранг медианы
вычисляем по формуле:
,
то есть медианой
является 8-е значение выборки),
.
Среднее арифметическое значение выборки находим, пользуясь формулой:
Крайние значения
ряда) определяют минимальное и максимальное
значения выборки
,
.
Согласно определению, размах вариации
равен:
.
Для удобства
вычисления дисперсии составляем таблицу.
Пользуясь суммой значений последней
колонки и формулой, находим: .
|
|
|
|
1 |
9 |
0,2 |
0,04 |
2 |
9 |
0,2 |
0,04 |
3 |
10 |
1,2 |
1,44 |
4 |
11 |
2,2 |
4,84 |
5 |
8 |
-0,8 |
0,64 |
6 |
7 |
-1,8 |
3,24 |
7 |
10 |
1,2 |
1,44 |
8 |
7 |
-1,8 |
3,24 |
9 |
9 |
0,2 |
0,44 |
10 |
11 |
2,2 |
4,24 |
11 |
7 |
-1,8 |
3,24 |
12 |
8 |
-0,8 |
0,64 |
13 |
9 |
0,2 |
0,04 |
14 |
8 |
-0,8 |
0,64 |
15 |
9 |
0,2 |
0,04 |
|
132 |
|
24,4 |
Вычислим среднее
квадратическое отклонение:
.
Коэффициент
вариации:
,
откуда делаем вывод
результаты тестирования имеют средний
коэффициент вариации.
Ошибку выборочного
среднего арифметического находим:
.
Наконец, записываем:
.