- •Тема 1. Вариационные ряды и их характеристики
- •1.1. Выборка и генеральная совокупность
- •1.2. Вариационные ряды и их графическое изображение
- •Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,
- •1 .3. Статистические характеристики вариационного ряда
- •Тема 2. Статистические оценки параметров распределения
- •( Число степеней свободы)
- •Тема 3. Статистическая проверка гипотез
- •Тема 4. Корреляционный и регрессионный анализ
- •4.1. Корреляционный анализ
- •Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.
- •4.2. Оценка достоверности коэффициента корреляции
- •4.3. Регрессионный анализ
-
Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,
;
;
;
.
-
Вычисляем частости интервалов. Например,
; ; .
-
Вычисляем накопленные частости интервалов.
-
Данные вычислений заносим в табл. 2
Таблица 2
№ интервала |
Границы интервала |
Частота |
Накопленная частота |
Частость |
Накопленная частость |
1 |
5 7 |
3 |
3 |
0,06 |
0,06 |
2 |
7 9 |
9 |
12 |
0,18 |
0,24 |
3 |
9 11 |
17 |
29 |
0,34 |
0,58 |
4 |
11 13 |
10 |
39 |
0,20 |
0,78 |
5 |
13 15 |
7 |
46 |
0,14 |
0,92 |
6 |
15 17 |
4 |
50 |
0,08 |
1 |
Распределение типа сведенного в табл. 2 представляет собой интервальный вариационный ряд.
Анализ вариационных рядов упрощается при их графическом представлении. Наряду с гистограммой и полигоном частот можно построить полигон накопленных частостей (кумулята)
График получается при соединении точек прямыми отрезками. Координаты точек соответствуют верхним границам интервалов и накопленным частотам. Если по оси ординат откладывать накопленные частости, то полученный график называется полигоном накопленных частостей. Если ряд не интервальный, то по оси откладывают значения измеряемого признака, а по оси соответствующие накопленные частоты или частости. На рис.2 изображен полигон накопленных частостей для примера 3.
На практике соседние точки чаще всего соединяют кривыми линиями (рис. 3).
1 .3. Статистические характеристики вариационного ряда
Для полноты картины анализа выборки рассматривают статистические характеристики вариационного ряда. С этой целью оценивают следующие качества ряда:
-
центральную тенденцию выборки;
-
вариацию.
Центральную тенденцию выборки оценивают такими статистическими характеристиками, как
-
мода;
-
медиана;
-
среднее арифметическое значение.
К характеристикам вариации относят:
-
размах;
-
дисперсию;
-
среднее квадратическое отклонение;
-
коэффициент вариации;
-
ошибку выборочного среднего.
Модой называется значение признака, наиболее часто встречающееся в выборке. Мода обозначается . Если значения выборки сгруппированы в интервальный вариационный ряд, то выбирается модальный интервал с наибольшей частотой.
Медиана это такое значение признака, при котором одна половина значений признака меньше ее, а другая половина больше (медиана делит вариационный ряд пополам). Медиана обозначается . Для отыскания медианы выборку ранжируют, то есть значения признака располагают в порядке возрастания или убывания. В ранжированной выборке ранг (порядковый номер в выборке) медианы определяют по формуле: , где объем выборки.
При нечетном ранг целое число, и медианой считают следующее значение: . При четном ранг число не целое, представимое в виде , где целое. В таком случае медианой считают значение .
Среднее арифметическое неупорядоченной выборки вычисляют по формуле:
.
В случае интервального вариационного ряда формула приобретает вид: , где частота -го интервала, среднее арифметическое значение этого интервала.
Размах вариации – это разность между максимальным и минимальным значениями выборки:
.
Дисперсией называется средний квадрат отклонений значений признака от среднего арифметического и вычисляется по формуле:
.
Средним квадратическим отклонением называется положительный квадратный корень из дисперсии:
,
Среднее квадратическое отклонение имеет ту же единицу измерения, что и варьирующий признак. Оно характеризует степень отклонения значений признака от его среднего арифметического значения в абсолютных единицах.
Для сравнения варьируемости двух или нескольких выборок, имеющих разные единицы измерения, используют коэффициент вариации. Коэффициент вариации это относительный показатель, равный отношению среднего квадратического отклонения к среднему арифметическому значению:
.
Принято считать, что если , то варьируемость малая, средняя, большая.
Отклонения выборочных коэффициентов от параметров в генеральной совокупности называются ошибками параметров. Эти ошибки возникают в силу того, что выборочная совокупность представляет генеральную совокупность только приближенно. Если взять несколько вариантов выборок объемом из одной и той же генеральной совокупности и вычислить для каждой из них среднее арифметическое, то окажется, что средние арифметические выборок варьируют вокруг среднего арифметического для генеральной совокупности в раз меньше, чем отдельные варианты. На этом основании в качестве стандартной ошибки выборочного среднего принимают величину
.
Чтобы подчеркнуть точность оценки среднего выборочного, его чаще всего записывают в виде: .
Пример 4. В качестве оценки силовой подготовки учащихся 5 класса произведен тест на количество подтягиваний на перекладине.
Данные теста следующие: 9, 9, 10, 11, 8, 7, 10, 7, 9, 11, 7, 8, 9, 8, 9.
Требуется вычислить моду, медиану, среднее арифметическое значение, размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации и ошибку выборочного среднего данной выборки.
Решение. Непосредственным подсчетом убеждаемся, что значение встречается в выборке чаще других (5 раз), следовательно, .
Для вычисления медианы производим ранжировку заданной выборки:
7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 10, 10, 11, 11
Объем выборки число нечетное, поэтому ранг медианы вычисляем по формуле:
,
то есть медианой является 8-е значение выборки), .
Среднее арифметическое значение выборки находим, пользуясь формулой:
Крайние значения ряда) определяют минимальное и максимальное значения выборки , . Согласно определению, размах вариации равен:
.
Для удобства вычисления дисперсии составляем таблицу. Пользуясь суммой значений последней колонки и формулой, находим: .
1 |
9 |
0,2 |
0,04 |
2 |
9 |
0,2 |
0,04 |
3 |
10 |
1,2 |
1,44 |
4 |
11 |
2,2 |
4,84 |
5 |
8 |
-0,8 |
0,64 |
6 |
7 |
-1,8 |
3,24 |
7 |
10 |
1,2 |
1,44 |
8 |
7 |
-1,8 |
3,24 |
9 |
9 |
0,2 |
0,44 |
10 |
11 |
2,2 |
4,24 |
11 |
7 |
-1,8 |
3,24 |
12 |
8 |
-0,8 |
0,64 |
13 |
9 |
0,2 |
0,04 |
14 |
8 |
-0,8 |
0,64 |
15 |
9 |
0,2 |
0,04 |
|
132 |
|
24,4 |
Вычислим среднее квадратическое отклонение: .
Коэффициент вариации: , откуда делаем вывод результаты тестирования имеют средний коэффициент вариации.
Ошибку выборочного среднего арифметического находим: .
Наконец, записываем: .