Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка4.docx
Скачиваний:
14
Добавлен:
13.03.2016
Размер:
57.11 Кб
Скачать

Практическая работа № 4 по основам медико-биологической статистики.

Задание 1. Выучить, описать словами порядок действий, задаваемый формулами.

Техника построения вариационного ряда.

Собирают исходные данные для статистического анализа.

Далее призводится группировка исходных данных в статистические ряды – ряды числовых значений признака, расположенных в определённом порядке.

Статистические ряд:

1) атрибутивный;

(число людей с группой крови)

2) вариационный (или ряд распределения);

Двойной ряд чисел, показывающий, каким образом числовые значения признака () связаны с их повторяемостью (– частота или вес (веса) вариант(а),Относительные частоты или частости).

3) временной.

Находят:

1. ;

2. По формуле Старджеса (1926): К = ,(15-20)!

3. величина классового интервала ,

а) Если значения признак выражены целыми числами и классовый интервал окажется равным единице или может быть приравнён (приравнен) к единице, выборка распределяется в безынтервальный вариационный ряд.

б) , выборку следует распределять в интервальный вариационный ряд,

, если

При построении классового интервала следует добиваться того, чтобы минимальная варианта попадала в середину первого классового интервала., где– нижняя граница первого классового интервала.

Разнести варианты по классам. Допустимо в один и тот же класс помещать варианты, которые больше нижней, но меньше или равны его верхней границе.

Средние величины, показатели вариации вычисляются на безынтервальных рядах, то интервальный ряд приходится превращать в ряд безынтервальный. Это достигается заменой классовых интервалов центральными или срединными значениями они определяются по полу сумме нижних границ предыдущего и последующего классов.

Медиана (Ме). Значение относительно которого ряд распределения делится на две половины. Число членов ряда нечётное, то (Ме) — центральная варианта. Чётное число членов ряда — (Ме) (полусумма) полу сумма двух соседних вариант в центре ряда.

Если выборка распределена в интервальный вариационный ряд, то:

1. находят класс или интервал, где находится медиана. Кумулируют частоты ряда в направлении от меньших к большим до величины превосходящей . — нижняя граница медианного интервала.

(1)

Мода (Мо) — величина , которая встречается в данной совокупности наиболее часто.

, (2)

где — нижняя граница модального класса, т.е. класса с наибольшей частотой;

частота класса, предшествующего модальному;— частота класса, следующего за модальным;— величина классового интервала

Квантили – отсекают в пределах ряда определённую часть его членов.

Квартиль — величина, отсекающая членов ряда. Три квартиля делят ряд на четыре равночисленные части (кварты).

Дециль — величина, определяющая всех члены ряда. Девять децилей делят рядна десять равных частей.

Сотые доли числа вариант — называетсяперцентилемилипроцентилем.

99 Перцентилей делят всю совокупность наблюдений на 100 равночисленных частей.

Любой перцентиль определяется рядом последовательных действий, которые модно выразить в виде следующей формулы:

(3)

— нижняя граница класса, содержащего перцентиль; она определяется по величине

, превосходящей (или равной) числув ряду накопленных частот.

Здесь — выбранный перцентиль;частота класса, содержащего перцентиль;

— величина классового интервала;общее число наблюдений, или объём выборки.

Формула (3) применима и в случаях, когда выборочная совокупность распределяется в безынтервальный вариационный ряд, т.е. непосредственно по ранжированным значениям признака.

Значение квантилей.

1. Квантили, медиана – ценные характеристики варьирующих объектов, особенно при резко выраженных асимметрии в распределении частот по классам вариационного ряда.

2. Независимо от закона распределения квантили используются

1.как структурные средние;

2.как показатели вариации;

3. используются для установления границ тех или иных нормативов (при оценке физического развития человека, спортивных достижений отдельных индивидов

Задание 2.

Разобрать два примера.

Пример 1. Данные, полученные в конце 60-ч годов в СССР при исследовании ритмов сердечных сокращений у 861-ого спортсмена (в покое), количественно охарактеризовали длительность TP-сегмента ЭКГ, Результаты исследования сведены в таблицу №1.

х, с

30-

35-

40-

45-

50-

55-

60-

65-

70-

75-

80-

85-

90-95

8

20

41

54

50

101

61

152

150

123

74

24

3

8

28

69

123

173

274

335

487

637

760

834

858

861

В таблице №1:

х, с - длительностьTP-сегмента ЭКГ;

- число случаев («частоты»);

- «накопленные частоты», кумулированное число случаев от меньших к большим значениям классов.

Найдите, используя, представленные в таблице №1 данные, 50-й процентиль (перцентиль) сердечных сокращений у спортсменов по показателям длительности TP-сегментов ЭКГ.

Решение:

Определим

Величина К находится между = 335 и= 487. Нижняя граница этого интервала, содержащего перцентиль, равна 65.

Берём разность =430,5 – 335 = 95,5 и относим её к частоте класса, содержащего искомый перцентиль, т.е. к частоте

Учитывая величину классового интервала , подставляем известные значения в формулу:

.

Эта величина соответствует медиане данного распределения.

Она оказалась несколько больше средней арифметической, равной 65,87.

Если принять за норму сердечных сокращений у спортсменов величину, равную 50% всех членов ряда, то её границы определятся по и.

Найдём эти границы.

Сначала вычислим и.

Отсюда и

Пример 2. Измерены длинны= 100 иголок на ветви ели в миллиметрах. По этим данным определена средняя длина иголок (хвоинок)и их отклонения от среднего значения. Минимальное и максимальное отклонения составили соответственно -2,5 и 5,0. В соответствии с формулой Старджеса (1926){} диапазон отклонений разбит на= 8 ){} равных интервалов и подсчитано количество наблюдений, попавших в каждый интервал. Данные представлены (сведены в) в таблице:

Границы

интервалов

-3-2

-2-1

-10

01

12

23

34

45

3

10

15

24

25

13

7

3

Требуется при уровне значимости α = 0,01 проверить гипотезу о том, что отклонения длины иголочки ели от среднего значения согласуются с нормальным законом распределения.

Решение: Поскольку число наблюдений в крайних интервалах мало, объединим крайние интервалы с соседними.

В результате объединения получим таблицу:

Границы

интервалов

-3-1

-10

01

12

23

35

13

15

24

25

13

10

Для получения теоретических вероятностей попадания случайных отклоненийXв соответствующие интервалы необходимо знать параметры предполагаемого нормального распределения: математическое ожидание и дисперсию.

Оценки параметров генеральной совокупности сделаем по выборке (сведена в таблицу), воспользовавшись формулами:

где — середины соответствующих интервалов. В формулах предполагается Что интервалы имеют одинаковую длину, поэтому следует воспользоваться первоначальной таблицей. Расчёты дают:;;1,6.

Произведём вычисления вероятностей .

Для первого интервала:

.

По таблице интеграла вероятностей(и) находим:

,

Отсюда .

Аналогично:

1

2

3

4

5

6

Границы

интервалов

-3-1

-10

01

12

23

35

13

15

24

25

13

10

0,1933

0,2467

0,2119

0,1296

0,06338

Вычислим величину :

.

Число интервалов равно 6. По выборке оценивались два параметра, следовательно, число степеней свободы l=6-1-2=3. По таблице распределениянаходим

.

Поскольку , то нет оснований отвергать проверяемую гипотезу.

Задание 3. Провести самостоятельное статистическое исследование:

«Статистическое исследование длины хвоинки с ветки Picea abies ели обыкновенной»

«Проверка статистической гипотезы о том, что распределение в генеральной совокупности является нормальным (гауссовым законом распределения)»

Формулировка задачи исследования. Жизненный опыт говорит о том, что окружающие нас люди, животные и растения характеризуются некоторым разнообразием однородных признаков. Различные антропометрические данные, существование различных размеров обуви, головных уборов, одежды, перчаток и т.п. являются проявлением общей биологической закономерности. Наследуется не признак, а норма реакции. Есть все основания предполагать, что количественная характеристика признака (рост, масса) в однородной популяции должна содержать некоторое среднее значение и меру разброса около этого среднего.

Для нашего статистического исследования выберем веточку ёлки (Picea abies) и будем измерять длину иголок с этой ветки. В силу действия разнонаправленных, хаотически меняющихся факторов, которые могут повлиять на длину иголки, выглядят логичными предположение о том, что длина распределена на ветке ели по нормальному закону.