
- •Материалы для практического занятия.
- •Переводим шифр частот в числа, сумма которых должна быть равна объему данной выборки,
- •Если каждую варианту совокупности уменьшить или увеличить на одно и то же постоянное числоА, то дисперсия не изменится:
- •Параметрические показатели связи
- •Параметрические критерии
- •Кг живой массы тела. За время опыта животные дали следующие прибавки живой массы тела (табл. 35).
- •Приближенные оценки основных статистических показателей.
-
Кг живой массы тела. За время опыта животные дали следующие прибавки живой массы тела (табл. 35).
Таблица 35
Средние
арифметические привесов: в опыте
=
.
в контроле
Разница
Чтобы установить, достоверна или
случайна эта разница, нужно определить
ошибку разности средних по формуле
(74):
Отсюда
По табл. V Приложений для 1%-ного уровня
значимости и числа степеней свободы 6
= 9 + 8—2=15 находим
Так
как
нулевая
гипотеза опровергается на высоком
уровне значимости (Р<0,01). Разница между
средними величинами опыта и контроля
оказалась в высшей степени достоверной.
Пример
2.
На двух группах лабораторных мышей —
опытнойи
контрольной
—
изучали воздействие на организм нового
препарата. После месячных испытаний
масса тела животных, выраженная в
граммах, варьировала следующим
образом:
Разница
между среднимиДля
определения ошибки этой разности
предварительно рассчитаем девиаты:
и
Отсюда ошибка разности средних выразится
величиной
и
Критерий
Для k=9+11—2=18
и 5%-ного уровня значимости в табл. V
Приложений находим
Так
как
нулевая
гипотеза остается в силе.
НеопровержениеHо-гипотезы нельзя рассматривать как доказательство равенства между неизвестными параметрами совокупностей, из которых извлечены сравниваемые , выборки. В таких случаях вопрос о преимуществе одной статистической совокупности перед другой остается открытым. Ведь не исключено, что при повторных испытаниях H0-гипотеза может оказаться несостоятельной. Более того, и в тех случаях, когда Hо-гипотеза опровергается, не следует спешить с окончательным выводом.
Следует
заметить, что вышеизложенное применение
t-критерия
предполагает, что дисперсии сравниваемых
групп одинаковы:
Если это не так, то величину критерия
находят по формуле
а число степеней свободы — по следующим формулам:
а) при
б) при
Так,
при изучении влияния кобальта на массу
тела кроликов (см. пример 1) дисперсии
равныи
(см.
табл. 35). Видно, что
Следовательно,
величину критерия необходимо определять
с учетом неравенства дисперсий.
Предварительно найдеми
Величина
t-критерия
равна
Затем
определяем .
и
В результате
Для
и
в
табл. V Приложений находим
Так
както
H0-гипотеза
отвергается.
Правильное применение t-критерия предполагает нормальное распределение совокупностей, из которых извлечены сравниваемые выборки, и равенство генеральных дисперсий. Если эти условия не выполняются, то t-критерий применять не следует. В таких случаях более эффективными будут непараметрические критерии.
Оценка
средней разности между выборками с
попарно связанными вариантами.
Сравниваемые выборки нередко представляют
собой ряды попарно связанных вариант,
т. е. являются зависимыми
выборками.В
таких случаяхоценкой разности между
генеральными средствамибудет
средняя
разность,
определяемая из суммы разностей
между попарно связанными вариантами
сравниваемых групп, т. е.
Оценкой
генеральной дисперсииразности
средних
будет
выборочная
дисперсия
В
формулах (77) и (78) п
— число парных наблюдений;величина
идентична
разности средних, т. е.
Ошибку
средней разностиобозначаемую
символом
определяют по формулам
или
Если
члены генеральной совокупности
распределяются нормально, то и
разности между нимибудут распределяться
нормально и случайная величинабудет
иметь
распределение Стьюдента с
степенями
свободы. Hо-гипотеза
сводится к предположению, что
Отсюда
/-критерий выразится в
виде
отношения средней разности к своей
ошибке, т. е.
Если
для
принятого уровня значимости и числа
степеней свободы k
= n—1,
то нулевая гипотеза должна быть
отвергнута.
Пример 3. На протяжении ряда лет в условиях Одесской опытной станции изучали влияние черного и апрельского пара на урожай ржи. Результаты опыта учитывали по массе 1000 зерен (табл. 36).
Таблица Зв
В
табл. 36 приведены выборки с попарно
связанными вариантами: несомненно,
что каждый год имел свои специфические
условия, которые одинаково влияли на
урожай ржи, посеянной как по черному,
так и по апрельскому пару. Поэтому
обрабатывать полученные данные нужно
с учетом тех условий, в которых проводили
эксперимент. Из табл. 36 видно, что урожай
ржи по апрельскому пару несколько выше,
чем по черному. Средняя разностьОпределяем
ошибку этой разности:
КритерийДля
и
(см. табл. V Приложений). Так как
то
Н0-гипотезу
отвергают на высоком уровне значимости
Следовательно, с вероятностью
можно
утверждать, что
разница между сравниваемыми выборками статистически достоверна.
Пример 4. В результате семилетних исследований урожайности ячменя и овса в условиях нечерноземной зоны РСФСР были получены следующие данные (табл. 37).
Таблица 37
Разница
между средним урожаем ячменя и овса
составила 8,54—7,56 = 0,98 ц/га. Ошибка этой
разницы=
Отсюда
Эта
величина не превышает критический
уровень
для
5%-ного уровня
значимости и числа степеней свободы k= (7—1)=6. Следовательно, нулевую гипотезу здесь отбросить нельзя.
Оценку
средней разности можно произвести по
доверительномуинтервалу, построенному
на основании полученной разностии
ее ошибки
Если
нижняя граница доверительного интервала
окажется с положительным знаком, это
будет свидетельствовать о достоверности
разницы. Если же нижняя граница
доверительного интервала будет с
отрицательным знаком, это будет
служить указанием на случайный характер
наблюдаемой средней разности.
Так,
в примереНижняя
граница
95%-ного доверительного интервала
(0,52—0,24 = 0,28) оказалась с положительным
знаком, тогда как в примере 4
и
нижняя граница доверительного
интервала (0,98—1,04= —0,06) оказалась с
отрицательным знаком, что не дает
основания для отклонения нулевой
гипотезы.
Оценка
разности между долями.
Выборочная доля зависит от числа единиц
в выборке, имеющих учитываемый
признак, а общее число таких единиц в
генеральной совокупности определяет
генеральнуюдолюОценкой
разности между генеральными долями
служит
разность между выборочными долями
Отношение
этой разностик своей ошибке дает
случайную величину
котораяследует t-распределению
Стьюдента. H0-гипотезу,
или предположение о том, что
отвергают,
если
для
k
= п1
+ п2—2
и принятого уровня значимости
Ошибка
разности между долями, взятыми из
приблизительно равновеликих выборок
(когда численности групп различаются
не более чем на 25%), вычисляют по формуле
гдеЕсли
доли выражены в процентах от общего
числа наблюдений, ошибку разности между
ними определяют по формуле
Сопоставляемые группы п1и п2 могут быть выражены абсолютными числами т1и m2. Ошибка наблюдаемой между ними разности определяется по следующей формуле:
но
так както
формулу (81) можно представить и в таком
виде:
Когда
сравнивают доли из неравновеликих
выборок и приошибку
разности между ними определяют по
формуле
р
определяют как средневзвешенную из
и
долей, или же из абсолютных численностей
групп:
В
этих формулах n1
и n2
— численности групп, на которых определяют
долии
Если доли выражают в процентах от п,
то вместо
нужно брать
Если
же неравновеликие группы выражены
абсолютными числамии
ошибку
разности между ними определяют по
формуле
Тема № 7.Регрессионный анализ.
Цель– познакомиться с регрессионным анализом.
Краткое содержание.
График корреляционной зависимости по уравнению функции ỹx=f(x) или ẍy,=f(у). Условные средние. Регрессия как изменение функции в зависимости от изменений одного или нескольких аргументов. Уравнения регрессии, эмпирические и теоретически вычисленные ряды регрессии, их графики, линии регрессии, коэффициенты линейной и нелинейной регрессии. Задача регрессионного анализа - предвидеть возможные изменения одного признака Y на основании известных изменений другого X, связанного с первым корреляционно. Основная характеристика коэффициента регрессии. Расчет коэффициентов регрессии, составление уравнений регрессии. Работа в среде Ехсеl. Расчет коэффициентов регрессии, составление уравнений регрессии с помощью средств электронных таблиц и функций Ехсеl, а также при использовании пакета «Анализ данных».
Тема № 8.Дисперсионный анализ.
Цель– познакомиться с дисперсионным анализом.
Краткое содержание. Результативные признаки. Факторы как причины изменения величины результативного признака. Регулируемые или организованные факторы и нерегулируемые. Градации регулируемого фактора. Дисперсионный анализ - разложение общей изменчивости признака на составные части: вариацию, определяемую действием изучаемого конкретного фактора, и вариацию, вызываемую случайными факторами. Дисперсионный однофакторный комплекс - действие на признак одного регулируемого фактора. Дисперсионные комплексы равномерные, пропорциональные (ортогональные) и неравномерные (неортогональные). Группировка совокупности по признаку-фактору. Выявление степени влияния признака-фактора на признак-результат по расчету нескольких видов дисперсий: общей, межгрупповой и внутригрупповой. Правило сложения дисперсий. Отношение межгрупповой дисперсии (факториальной дисперсии) к внутригрупповой, или остаточной, дисперсии - критерий оценки влияния, регулируемых в опыте факторов на результативный признак. Двух-, трех-и многофакторный анализ - действие на признак двух, трех или большего числа регулируемых факторов. Общие схемы дисперсионного анализа двухфакторных ортогональных комплексов. Анализ двухфакторных комплексов - действие каждого фактора в отдельности и их совместное действие на результативный признак. Неортогональные комплексы. Работа в среде Ехсеl. Анализ однофакторных и двухфакторных комплексов - действие каждого фактора в отдельности и их совместное действие на результативный признак с помощью средств электронных таблиц и функций Ехсеl, а также при использовании пакета «Анализ данных». Расчет силы влияния факторов.
Тема № 9.Вопросы планирования исследования
Цель– изучить вопросы планирования исследования.
Задачи. Приближенные оценки основных статистических показателей. Определение необходимого объема выборки.
Краткое содержание. Классические работы Р. Фишера открыли новую страницу в истории биометрии: они показали, что планирование экспериментов и обработка их результатов — это две тесно связанные между собой задачи статистического анализа. Это открытие легло в основу разработки теории планирования экспериментов, которая в настоящее время находит применение не только при проведении сельскохозяйственных опытов, на базе которых она возникла, но и в различных областях биологии, медицины, антропологии, в сфере других научно-практических дисциплин, включая и социально-экономические исследования.
Планирование экспериментов, как уже отмечалось в предисловии к этой книге, стало самостоятельным разделом биометрии, которому посвящена огромная литература. В начальном курсе биометрии невозможно осветить все аспекты теории экспериментов. Здесь будут рассмотрены лишь некоторые общие положения, относящиеся к этой сложной и многогранной проблеме.
Термин «эксперимент» (от лат. experimentum — опыт) означает искусственно организуемый комплекс условий, в которых испытывают воздействие того или иного фактора или одновременно нескольких факторов на результативный признак. В земледелии это полевые опыты; в животноводстве — опыты по кормлению животных, по уходу за ними; в педагогике — опыты по проверке новых методов обучения и воспитания учащихся; в фармакологии — испытание эффективности новых лечебных препаратов; в медицине— проверка разных способов лечения больных и т. д.
Исследовательская работа не только сводится к экспериментам; ее проводят и вне их на основе непосредственных наблюдений. Так что выражение «планирование исследований» оказывается более емким, а следовательно, и более подходящим, чем введенный Р. Фишером (1930) термин «планирование экспериментов». Конечно, и термин «эксперимент» можно применять в более широком смысле, понимая под ним любые испытания, проводимые исследователем в отношении изучаемого объекта. При всем разнообразии методов исследовательской работы задача планирования сводится к тому, чтобы при возможно минимальных объемах наблюдений получать достаточно полную информацию об изучаемых объектах.
С варьированием результатов наблюдений связана повторность вариантов опыта, позволяющая повысить точность оценок генеральных параметров, надежность выводов, которые делает исследователь на основании выборочных.показателей. Под повторностью в полевом опыте понимают число одноименных делянок для каждого варианта опыта. В лабораторных условиях повторность может выражаться числом одинаковых проб серий одновременных испытаний, измерений и т. п. повторений одного и того же варианта опыта. Очевидно, чем шире диапазон варьирования признака, тем больше должна быть и повторность опыта, и, наоборот, при слабом варьировании учитываемого признака число вариантов опыта, т. е. их повторность, уменьшается. В такой же зависимости от размаха варьирования признаков находится и организация планирования минимально допустимого числа испытаний.