- •Б.Л. Козловский, о.Ю. Ермолаева задачник по биометрии
- •Введение
- •Условные обозначения
- •Модуль 1 составление вариационных рядов
- •Рубежный контроль
- •Модуль 2. Расчет точечных характеристик выборочной совокупности
- •Вычислите , σ2 и σ.
- •Вычислите , σ2 и σ. Определите ошибку средней, ошибку дисперсии.
- •Вычислите , σ2 и σ. Определите ошибку средней, ошибку дисперсии.
- •В результате определения массы зерен пшеницы-ежовки (в мг) был построен следующий вариационный ряд:
- •Вычислите , σ2 и σ для следующей выборочной совокупности:
- •Имеются следующие данные о росте (в см) взрослых мужчин:
- •Было сделано 5 определений содержания кальция в крови (в усл. Единицах): 11,27; 11,36; 11,09; 11,16; 11,47. Вычислите и σ.
- •На свиноферме зарегистрировано 64 опороса. Количество поросят, полученных от каждой свиноматке, варьировало следующим образом:
- •В 1932 г. В г. Москве масса мальчиков при рождении составила:
- •Результаты промеров длины хвоста (в см) курдючных валахских овцематок в возрасте 4,5 года и старше распределились в следующий ряд:
- •Результаты промеров обхвата хвоста 775 курдючных валахских овцематок в возрасте 4 и старше лет было следующее:
- •Определите среднюю длину хвоста оленьих мышей Peromyscus maniculatus, взятых из разных мест сша по следующим трем выборкам:
- •Определить среднее число поросят в пометах 60 свиноматок и вычислить показатели вариации для этой выборочной совокупности:
- •На летней экскурсии учащимся было предложено подсчитать число лепестков в отобранных случайным способом 100 цветках цикория. Результаты измерений были следующими:
- •В отобранных случайным способом 50 колосьях двухрядного ячменя были подсчитаны зерна, содержащиеся в каждом колосе. Результаты оказались следующими:
- •В таблице приведены годовые удои коров холмогорской породы и удои коров – дочерей, рожденных от разных отцов. Дайте статистически обоснованную оценку племенных качеств этих быков.
- •Годовой удой и жирность молока 206 коров распределились следующим образом:
- •Рубежный контроль
- •Модуль 3. Вычисление доверительных интервалов статистических параметров
- •Рубежный контроль
- •Модуль 4. Сравнение выборок и статистических параметров
- •Были получены следующие данные о массе тушканчиков (Dipus aegiptis):
- •Рубежный контроль
- •Модуль 5 расчет показателей корреляции
- •Рубежный контроль
- •Модуль 6 основы ДисперсионнОго анализА
- •Рубежный контроль
В таблице приведены годовые удои коров холмогорской породы и удои коров – дочерей, рожденных от разных отцов. Дайте статистически обоснованную оценку племенных качеств этих быков.
Удои коров-матерей, кг
Удои коров-дочерей, кг
отец 1
отец 2
3039
4107
2750
3224
3478
3890
3444
3763
3568
3441
3836
3891
3629
3507
2695
Годовой удой и жирность молока 206 коров распределились следующим образом:
Удой (х1) |
850 – 1049 |
1050 – 1249 |
1250 – 1449 |
1450 – 1649 |
1650 – 1849 |
1850 – 2049 |
2050 – 2250 |
Жирность молока (x2) |
4,0 |
3,8 |
3,4 |
3,6 |
3,7 |
3,2 |
3,1 |
Частота (fi) |
6 |
13 |
89 |
70 |
15 |
9 |
4 |
Определите, какой из этих признаков более изменчив и с какой точностью, определяются средние арифметические этих признаков.
Рубежный контроль
Цена одной задачи – 5 баллов
Оценка освоения материала студентами в зависимости от количества набранных баллов
Количество баллов |
Оценка |
Менее 55 |
Неудовлетворительно (2) |
От 55 до 90 |
Удовлетворительно (3) |
От 90 до 130 |
Хорошо (4) |
Свыше 130 |
Отлично (5) |
Модуль 3. Вычисление доверительных интервалов статистических параметров
Цель – познакомить студентов с алгоритмом вычисления доверительных интервалов статистических параметров.
При статистической обработке данных вычисленные средние, коэффициенты вариации, коэффициенты корреляции, критерии различия и другие показатели получают количественные границы доверия, которые обозначают возможные колебания показателя в меньшую и большую стороны в пределах доверительного интервала.
Пример 3.1. Распределение кальция в сыворотке крови обезьян, как было установлено ранее, характеризуется следующими выборочными показателями: = 11,94 мг%; = 0,127 мг%; n = 100. Требуется определить доверительный интервал для генеральной средней ( )при доверительной вероятности P = 0,95.
Генеральная средняя находится с определенной вероятность в интервале:
, где – средняя арифметическая; t – критерий Стьюдента; – ошибка средней арифметической.
По таблице «Значения критерия Стьюдента» находим значение при доверительной вероятности 0,95 и числе степеней свободы k = 100-1 = 99. Оно равно 1,982. Вместе со значениями среднего арифметического и статистической ошибки подставляем его в формулу:
или 11,69 12,19
Таким образом, с вероятностью 95%, можно утверждать, что генеральная средняя данного нормального распределения находится между 11,69 и 12,19 мг%.
Пример 3.2. Определите границы 95%-ного доверительного интервала для генеральной дисперсии ( ) распределения кальция в крови обезьян, если известно, что = 1,60, при n = 100.
Для решения задачи можно воспользоваться следующей формулой:
, где – статистическая ошибка дисперсии.
Находим ошибку выборочной дисперсии по формуле: . Она равна 0,11. Значение t- критерия при доверительной вероятности 0,95 и числе степеней свободы k = 100–1 = 99 известно из предыдущего примера.
Воспользуемся формулой и получим:
или 1,38 1,82
Более точно доверительный интервал генеральной дисперсии можно построить с применением (хи-квадрат)-критерия Пирсона. Критические точки для этого критерия приводятся в специальной таблице. При использовании критерия для построения доверительного интервала применяют двусторонний уровень значимости. Для нижней границы уровень значимости рассчитывается по формуле , для верхнего – . Например, для доверительного уровня = 0,99 = 0,010, = 0,990. Соответственно по таблице распределения критических значений , при рассчитанных доверительных уровнях и числе степеней свободы k = 100 – 1= 99, найдем значения и . Получаем равно 135,80, а равно70,06.
Чтобы найти доверительные границы генеральной дисперсии с помощью воспользуемся формулами: для нижней границы , для верхней границы . Подставим данные задачи найденные значения в формулы: = 1,17; = 2,26. Таким образом, при доверительной вероятности P = 0,99 или 99% генеральная дисперсия будет лежать в интервале от 1,17 до 2,26 мг% включительно.
Пример 3.3. Среди 1000 семян пшеницы из поступившей на элеватор партии обнаружено 120 семян зараженных спорыньей. Необходимо определить вероятные границы генеральной доли зараженных семян в данной партии пшеницы.
Доверительные границы для генеральной доли при всех возможных ее значениях целесообразно определять по формуле:
,
Где n – число наблюдений; m – абсолютная численность одной из групп; t – нормированное отклонение.
Выборочная доля зараженных семян равна или 12%. При доверительной вероятности Р = 95% нормированное отклонение (t-критерий Стьюдента при k = ) t = 1,960.
Подставляем имеющиеся данные в формулу:
0,122± 0,041
Отсюда границы доверительного интервала равны = 0,122–0,041 = 0,081, или 8,1%; = 0,122 + 0,041 = 0,163, или 16,3%.
Таким образом, с доверительной вероятностью 95% можно утверждать, что генеральная доля зараженных семян находится между 8,1 и 16,3%.
Пример 3.4. Коэффициент вариации, характеризующий варьирование кальция (мг%) в сыворотке крови обезьян, оказался равным 10,6% или 0,106. Объем выборки n = 100/ Необходимо определить границы 95%-ного доверительного интервала для генерального параметра Cv.
Границы доверительного интервала для генерального коэффициента вариации Cv определяются по следующим формулам:
и , где K промежуточная величина, вычисляемая по формуле .
Зная, что при доверительной вероятности Р = 95% нормированное отклонение (критерий Стьюдента при k = ) t = 1,960, предварительно рассчитаем величину К:
.
или 9,3%
или 12,3%
Таким образом, генеральный коэффициент вариации с доверительной вероятностью 95% лежит в интервале от 9,3 до 12,3%. При повторных выборках коэффициент вариации не превысит 12,3% и не окажется ниже 9,3% в 95 случаях из 100.
Вопросы для самоконтроля:
Что такое вероятность?
Какие вероятности считаются доверительными?
Дайте определение терминов «доверительные границы» и «доверительный интервал».
Каков доверительный интервал при нормальном распределении с вероятностью 0,95; 0,99?
Что такое уровень значимости? Какая связь между уровнем значимости и вероятностью? Можно ли выражать уровень значимости в процентах?
На что указывает процентная величина уровня значимости?
В каких пределах по отношению к выборочной совокупности может находиться средняя арифметическая генеральной совокупности? С какой вероятностью?
Изменяются ли доверительные границы и доверительный интервал для μ при разных величинах n? Когда надо пользоваться t – распределением Стьюдента?
Задачи для самостоятельного решения.
Средний процент жира в молоке за лактацию коров холмогорских помесей был следующим: 3,4; 3,6; 3,2; 3,1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4,1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3,8. Определите , σ и ошибку средней. Установите доверительные интервалы для при вероятности 0,95.
На 400 растениях гибридной ржи первые цветки появились в среднем на 70,5 дня после посева. Среднее квадратическое отклонение было 6,9 дня. Определите среднюю ошибку для и доверительные интервалы для генеральной средней и дисперсии при W = 0,05 и W = 0,01.
При изучении длины листьев садовой земляники были получены = 7,86 см; σ = 1,32 см. Так как n = 502, то и sσ2=± 0,06 см. Определите доверительные интервалы для средней арифметической генеральной совокупности с уровнями значимости 0,01; 0,02; 0,05.
При обследовании 150 взрослых мужчин средний рост был равен 167 см, а σ = 6 см. В каких пределах находится средняя арифметическая генеральной совокупности с вероятностью 0,99? 0,95? В каких пределах находится 2 с вероятностью 0,99? 0,95?
Распределение кальция в сыворотке крови обезьян характеризуется следующими выборочными показателями: = 11,94 мг%, σ = 1,27, n = 100. Постройте 95%-ный доверительный интервал для генеральной средней (μ) этого распределения, рассчитайте коэффициент вариации.
Было изучено общее содержание азота в плазме крови крыс-альбиносов в возрасте 37 и 180 дней. Результаты выражены в граммах на 100 куб. см плазмы. В возрасте 37 дней 9 крыс имели: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. В возрасте 180 дней 8 крыс имели: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1,12. Установите доверительные интервалы для разницы с вероятностью 0,95.
Определить границы 95%-ного доверительного интервала для генеральной дисперсии и генеральной средней распределения кальция (мг%) в сыворотке крови обезьян. Для этого распределения n = 100, sσ2 = 1,60.
Определить границы 95%-ного доверительного интервала для генеральной средней и дисперсии распределения 40 колосков пшеницы (σ2 = 40, 87 мм2).
Определить границы 95%-ного и 99%-ного доверительного интервала для генеральной средней и дисперсии численности поросят в 64 опоросах, если sσ2 = 8, 25, = 1,85.
Известно, что средний вес кроликов составляет 2,1 кг. Определить границы 95%-ного и 99%-ного доверительного интервала для генеральной средней и дисперсии при n = 30, sx = 0,56.
У 100 колосьев измеряли озерненность колоса (Х), длину колоса (Y) и массу зерна в колосе (Z). Найти доверительные интервалы для генеральной средней и дисперсии при P1 = 0,95, P2 = 0,99, P3 = 0,999, если = 18, 52 шт., = 6,766 см, = 0,554 г.
В отобранных случайным образом 100 колосьях озимой пшеницы подсчитывалось число колосков. Выборочная совокупность характеризовалась следующими показателями: = 14,67 колосков и σ = 2,28. Определите, с какой точностью получен средний результат ( ) и постройте доверительный интервал для генеральной средней и дисперсии при 95% и 99% уровнях значимости.
Число ребер на раковинах ископаемого моллюска Orthambonites calligramma:
32
34
31
31
30
26
26
26
31
26
26
26
26
26
25
19
20
20
22
Известно, что n = 19, σ = 4,14 ребер. Определите границы доверительного интервала для генеральной средней и для дисперсии при W = 0,01.