- •5 Место математической статистики в медико-биологических исследованиях. Генеральная и выборочная совокупности
- •6.6 Статистическое распределение выборки
- •6.7 Статистические параметры для оценки распределения
- •Для расчетов составим таблицу 6.1.
- •6.8 Доверительные вероятности и доверительные границы. T-распределение (Стьюдента)
- •6.9 Полигон и гистограмма
Для расчетов составим таблицу 6.1.
N п/п |
Значения вариант xi (млн.)
|
Частота ni
|
Отклонения от среднего арифметического: D
= xi
-
|
Квадрат отклонения D2 = (xi - )2 (млн2) |
1. 2. 3. 4. |
4,0 4,2 5,0 5,5 |
1 1 2 1 |
- 0,74 - 0,54 0,26 0,76 |
0,5476 0,2916 0,0676 0,5776 |
В данном случае объем выборки n
=
=
5 (значение хi
= 5,0 встречается два раза). Из таблицы
видно, что наибольшее значение признака
х1 = 4,0, а наибольшее х4
= 5,5; поэтому размах вариации равен: 5,5 -
4,0 = 1,5 млн. Среднее арифметическое
определим по формуле [6.2]:
=
=
4,74.
Найдем отклонения вариант от среднего
арифметического: D1
= x1 -
= 4,0 - 4,74 = - 0,74. Аналогично: D2
= - 0,54; D3 = 0,26; D4
= 0,76. Эти результаты приведены в третьем
столбце таблицы. Возводя полученные
отклонения в квадрат, получим пятый
столбец таблицы и, суммируя полученные
результаты, получаем:
=
0,5476 + 0,2916 + 20,0676 +
0,5776 = 1,552. С помощью формулы [6.4] определим
дисперсию:
DB =
=
0,39
Среднее квадратичное отклонение рассчитаем с помощью формулы [6.6]:
sB
=
=
0,62.
Ошибка средней арифметической m
=
=
0,28.
6.8 Доверительные вероятности и доверительные границы. T-распределение (Стьюдента)
Рассмотренные выше параметры вариационного ряда (среднее арифметическое, среднее квадратическое, ошибка среднего арифметического) достаточны для общего описания рядов, а некоторые из них - и для сравнения рядов разных величин. Эти параметры позволяют заменить сырой материал (список результатов наблюдений) несколькими числами, которые по возможности характеризуют всю совокупность наблюдений. Однако сами эти параметры не дают возможности некоторого “предвидения” возможных результатов будущих наблюдений случайной величины. Такое “предвидение” может заключаться в вычислении вероятности того, что значения величины будут находиться в заданных границах. Считают, что такое указание границ можно считать практически достоверными, если вероятность события (вероятность попадания случайной величины в эти границы) близка к единице.
Доверительной вероятностью того,
что случайная величина примет какое-нибудь
значение в некоторых границах, называется
такое значение этой вероятности, которое
по соглашению считается достаточно
близко к единице. Обычно в медицине при
определении средней арифметической
больших выборов (с n >
30) принимают вероятность Р нахождения
истинного значения средней арифметической
за пределами интервала
2m,
равной 0,05. Интервал, в котором с заданным
уровнем вероятности находится истинное
значение средней арифметической,
называют доверительным интервалом,
а его границы - доверительными границами.
Таким образом, при больших выборках
нижней доверительной границей можно
считать
2m,
а верхней доверительной границей:
2m
.
При малых выборках доверительный
интервал становится более широким. Он
находится между границами
-
tm и
+ tm, где t
- величина, зависящая от объема выборки,
т.е. количества наблюдений, из которых
вычислена средняя арифметическая, и от
допускаемой вероятности Р выхода
истинного значения средней арифметической
за пределы доверительного интервала.
Значение t находят с
помощью специальных таблиц (см. Таблицу
6.2).
В левой колонке, озаглавленной буквой f , обозначены степени свободы; над остальными колонками поставлены значения Р. Если необходимо найти значение t для вычисления доверительных границ средней арифметической, пользуются строчкой таблицы со значениями f = n - 1, где n - количество наблюдений, из которых вычислена средняя арифметическая. Искомое значение находят в колонке, над которой проставлено допускаемое экспериментальное значение вероятности Р. Обычно пользуются колонкой, которой соответствует значение Р = 0,05.
Таблица 6.2. Критические точки распределения Стьюдента.
Р
0,5 0,25 0,1 0,05 0,02 0,01
f
1 0,00 2,41 6,31 12,7 31,82 63,7
2 0,816 1,6 2,92 4,30 6,97 9,92
3 0,765 1,42 2,35 3,18 5,54 5,84
4 0,741 1,34 2,13 2,78 3,75 4,60
5 0,727 1,30 2,01 2,57 3,37 4,03
6 0,718 1,27 1,94 2,45 3,14 3,71
7 0,711 1,25 1,89 2,36 3,00 3,50
8 0,706 1,24 1,86 2,31 2,90 3,36
9 0,703 1,23 1,83 2,26 2,82 3,25
10 0,700 1,22 1,81 2,23 2,76 3,17
11 0,697 1,21 1,80 2,20 2,72 3,11
12 0,695 1,21 1,78 2,18 2,68 3,05
13 0,694 1,20 1,77 2,16 2,65 3,01
14 0,692 1,20 1,76 2,14 2,62 2,98
15 0,691 1,20 1,75 2,13 2,60 2,95
16 0,690 1,19 1,75 2,12 2,58 2,95
17 0,689 1,19 1,74 2,11 2,57 2,92
18 0,688 1,19 1,73 2,10 2,55 2,90
19 0,688 1,19 1,73 2,09 2,54 2,88
20 0,687 1,18 1,73 2,09 2,53 2,86
Пример 6. В результате измерения СОЭ (скорости оседания эритроцитов) у 10 пациентов получены значения, приведенные во втором столбце таблицы 6.3.
Таблица 6.3.
N
|
СОЭ (мм/ч)
|
х - |
(х - )2
|
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. |
2 3 4 5 5 6 6 7 8 10 |
- 3,6 - 2,6 - 1,6 - 0,6 - 0,6 0,4 0,4 1,4 2,4 4,4 |
12,96 6,76 2,56 0,36 0,36 0,16 0,16 1,96 5,76 19,36 |
Среднее арифметическое значение СОЭ
=
= 5,6 мм/ч. В третьем столбце приведены
отклонения от средней арифметической,
а в четвертом столбце - квадраты
отклонений. Тогда ошибка средней
арифметической определим с помощью
формулы 7:
m =
=
0,75.
Вычислим доверительного интервала с вероятностью Р = 0,05. Для этого определим число степеней свободы: f = n – 1 = 9. С помощью таблицы 6.2 найдем значение параметра t, которое располагается в строке со степенью свободы 9 и в столбце с вероятностью Р = 0,05. Искомое значение t = 2,26. Следовательно нижняя граница доверительного интервала - tm = 5,6 - 2,260,75 = 3,9, а верхняя граница равна + tm = 5,6 + 2,260,75 7,3. Полученные результаты говорят о том, что с вероятностью 0,05 истинное значение средней арифметической находится вне доверительного интервала 3,9 7,3 мм/ч (или с вероятностью Р = 0,95 истинное значение заключено в рассчитанном доверительном интервале).
