2.2.Первичная статистическая совокупность, её упорядочение
Если наблюдаемая
случайная величина Х дискретна, то
статистическим аналогом ряда распределения
является статистический ряд, полностью
аналогичный ряду распределения случайной
величины Х, с той разницей, что вместо
вероятностей
в нём стоят частоты соответствующих
событий:
.
На этом вопросе мы больше не будем
останавливаться. Гораздо сложнее (и
чаще на практике встречается) задача
обработки опытов над непрерывной
случайной величиной Х. Первым этапом
является описание результатов серии
из n независимых опытов,
в каждом из которых зарегистрировано
значение непрерывной случайной величины
Х, и простейшей обработкой этих
результатов.
Первым документом
полевых измерений является протокол,
в котором зарегистрировано значение
непрерывной случайной величины
и номер опыта k.Такой
протокол называют первичной
статистической совокупностью. Этот
материал является совершенно
необработанным.
Пример
Измерено n=100 сопротивлений определённого вида. В таблице 2.1 приведены: номер опыта k и соответствующее значение сопротивления (в Омах).
Рассмотрение и осмысление таблицы такого типа (особенно при большом числе n) затруднительно, и по ней практически нельзя представить себе характер случайной величины Х. Первый этап обработки полученных материалов – это упорядочение полученных данных, расположение в порядке возрастания значений случайной величины. Протокол результатов опыта, в котом они перенумерованы и расположены в порядке возрастания, называют упорядоченной статистической совокупность или вариационным рядом.
Определение 2.5. Вариационным рядом называется последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются.
Запись вариационного ряда: x(1),x(2),…,x(n). Элементы вариационного ряда называются порядковыми статистиками. Минимальный и максимальный элементы называются крайними, иначе - экстремальными элементами вариационного ряда: x min =x(1). x max=x(n). (2.2)
Разность между максимальным и минимальным элементами называется размахом, или широтой выборки: R = xmax-xmin. (2.3)
Определение 2.6. Средний элемент вариационного ряда, если n - нечетное, или полусумма двух средних элементов, если п - четное, называется медианой выборки и обозначается теd:
med= x(l+1) при т=2l+1; med=(x(l)+x(l+1))/2 при n=2l. (2.4)
Определение 2.7. Элементы вариационного ряда, на четверть отстоящие от краёв, называются соответственно нижней и верхней квартилями и обозначаются z1/4 и z3/4.
Математически квартили определяются по формулам:
z1/4=x(i); z3/4=x(n-i+1), где i=[n/4]+1 при n/4 дробном, n/4 при n/4 целом (2.5)
[a]-целая часть числа а, наибольшее целое число, не превосходящее а.
Числа xmin, z1/4, med, z3/4, xmax дают сжатую информацию о выборке, а значит и о генеральной совокупности. Они могут быть изображены в виде так называемого ящика с усами.
Определение 2.8. Статистическим рядом называется последовательность элементов zi вариационного ряда с указанием частот ni повторения элементов
Статистический ряд может быть получен из вариационного ряда и записан в виде таблицы или графически в виде полигона (многоугольника), откладывая по оси абсцисс элементы статистического ряда, а по оси ординат – частоты (или относительные частоты). Полученные точки на плоскости соединяются отрезками. Полигон частот (или относительных частот) даёт хорошее представление о распределении частот в выборке. Элемент, соответствующий наибольшей частоте по сравнению с соседними элементами статистического ряда, называется выборочной модой (mod).
В таблице 2.1 приведён пример первичной статистической совокупности, а в таблице 2.2 приведены те же данные, что в таблице 2.1, но расположенные в порядке возрастания значений случайной величины Х. Здесь номер значения обозначен i (в отличие от номера опыта k). Если в таблице 2.2 одно и то же значение встречается несколько раз, его пишут столько раз, сколько оно встретилось.
Таблица 2.1 Первичная статистическая совокупность
k |
xk |
k |
xk |
k |
xk |
k |
xk |
k |
xk |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
87 85 91 94 102 80 75 102 99 101 100 120 122 101 88 80 97 92 91 94 |
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 |
82 111 115 99 96 101 115 100 97 91 87 116 121 101 123 97 95 88 104 111 |
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 |
88 90 101 95 93 92 88 94 98 99 102 101 122 99 97 95 105 112 116 118 |
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 |
108 95 99 92 100 118 103 102 89 90 94 106 112 122 100 92 93 82 111 102 |
81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 |
84 105 110 102 104 107 120 108 107 98 96 106 110 115 95 109 111 103 88 108 |
Таблица 2.2 Упорядоченная статистическая совокупность
k |
|
k |
|
k |
|
k |
|
k |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 |
|
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 |
|
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 |
|
81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 |
|
