- •Типовая учебная программа дисциплины (приложение 1)
- •Рабочая учебная программа дневного отделения
- •Программа обучения по дисциплине (syllabus)
- •3.2 Пререквизиты:
- •3.4 Краткое описание дисциплины:
- •График выполнения и сдачи заданий по дисциплине
- •Карта учебно-методической обеспеченности дисциплины
- •Лекционный комплекс (тезисы лекций)
- •Тема 1. Введение. Изменчивость и пути ее изучения.
- •Тема 2
- •Тема 3. Вычисление арифметического среднего, основного (квадратического) отклонения, коэффициента вариации.
- •Тема 5. Среднее квадратическое отклонение (сигма). Ошибка среднего арифметического.
- •Тема 6. Определение достоверности различий между средними.
- •Тема 7. Учение о корреляциях.
- •Тема 8. Вычисление коэффициента корреляции.
- •7. Планы семинарских занятий.
- •Тема 1. Введение. Изменчивость и пути ее изучения.
- •Тема 2. Разбивка вариант на классы. Составление гистограмм, замена гистограмм кривыми. Двухвершинные и многовершинные кривые, протуберанцы ошибок.
- •Тема 4. Показатели разнообразия признаков.
- •Тема 5. Среднее квадратическое отклонение (сигма). Ошибка среднего арифметического.
- •Тема 6. Определение достоверности различий между средними.
- •Тема 7. Учение о корреляциях.
- •Тема 8. Вычисление коэффициента корреляции.
- •9. Методические рекомендации по изучению дисциплины
- •10. Методические рекомендации и указания по выполнению расчетно-графических, курсовых проектов:
- •11. Планы занятий в рамках самостоятельной работы студентов под руководством преподавателя Форма проведения срсп
- •Тема 1 Введение. Изменчивость и пути ее изучения.
- •Методические рекомендации
- •Тема 2. Разбивка вариант на классы. Составление гистограмм, замена гистограмм кривыми. Двухвершинные и многовершинные кривые, протуберанцы ошибок.
- •Методические рекомендации
- •Тема 3. Вычисление арифметического среднего, основного (квадратического) отклонения, коэффициента вариации.
- •Методические рекомендации
- •Тема 4. Показатели разнообразия признаков.
- •Методические рекомендации
- •Тема 5. Среднее квадратическое отклонение (сигма). Ошибка среднего арифметического.
- •Методические рекомендации
- •Тема 6. Определение достоверности различий между средними.
- •Тема 7. Учение о корреляциях.
- •Тема 8. Вычисление коэффициента корреляции.
- •Планы занятий в рамках самостоятельной работы студентов
- •Тема 1 Введение. Изменчивость и пути ее изучения
- •2.По написанию аннотации
- •Тема 2. Разбивка вариант на классы. Составление гистограмм, замена гистограмм кривыми. Двухвершинные и многовершинные кривые, протуберанцы ошибок.
- •Методические рекомендации
- •Тема 3. Вычисление арифметического среднего, основного (квадратического) отклонения, коэффициента вариации.
- •Методические рекомендации
- •Тема 4. Показатели разнообразия признаков.
- •Методические указания
- •Тема 5. Среднее квадратическое отклонение (сигма). Ошибка среднего арифметического.
- •Методические рекомендации
- •Тема 6. Определение достоверности различий между средними.
- •Тема 7. Учение о корреляциях.
- •Тема 8. Вычисление коэффициента корреляции.
- •Темы рефератов
- •Информация по оценке
- •15.Тестовые задания для самоконтроля
- •16.Экзаменационные вопросы по курсу.
- •17.Программное и мультимедийное сопровождение учебных занятий
- •100012, Караганда, ул. Гоголя, 38
Тема 2
. Разбивка вариант на классы. Составление гистограмм, замена гистограмм кривыми. Двухвершинные и многовершинные кривые, протуберанцы ошибок.
Различают прерывное варьирование и непрерывное. Прерывное варьирование изучается путем подсчетов и называется так потому, что разница между отдельными особями всегда выражается в целых числах и не может быть меньше единицы. (В колосе пшеницы может быть 10, 15, 46 и т.д. зерен, но не может быть 10,5 зерна).
Непрерывное варьирование определяется путем измерения, взвешивания, химических анализов. В этих случаях изучаемые количественные признаки выражаются как целыми, так и дробными числами. Чем больше точность измерения, тем меньше возможная разница между близкими объектами. (Например, расстояние между двумя точками мы можем измерять километрами, метрами, сантиметрами, миллиметрами, и чем точнее будет измерение, тем меньше разница между соседними измерениями). Переход от минимального к максимальному значению постепенный.
Отбор выборок без преднамеренного подбора, случайно, называется рендомизированным отбором. К этой же категории отбора выборок относится взятие для анализа каждого 10-го, 20-го и т. д. экземпляра, например, при изучении изменчивости рыб или анализе початков кукурузы, а также в ряде других случаев.
Рассмотрим конкретный пример. Нам надо определить число колосков в колосьях пшеницы данного сорта. Размер выборки - 50 колосьев. Отобрав рендомизированно необходимое количество (50) колосьев, мы приступаем к подсчетам (табл. 1). Сначала пишем: «Число колосков и колосе (Казахстанской 126 или другого изучаемого сорта)».
Поскольку мы растения брали без выбора, то в таблице 1 цифры расположены без каких-либо закономерностей и из нее нельзя сделать никаких выводов.
Количественное выражение признака называется вариантой или (у некоторых авторов) датой и изображается буквами V или х. Варианты, расположенные в восходящем или нисходящем порядке, образуют вариационный ряд. Чтобы составить вариационный ряд, найдем и отметим максимальную и минимальную варианты. В нашем примере минимальная варианта - 12, максимальная - 20. Разность между минимальной и максимальной вариантами называется размахом варьирования или амплитудой изменчивости.
Для составления вариационного ряда расположим варианты в восходящем порядке и определим, сколько раз каждая варианта встречается в нашей выборке.
Число, показывающее, сколько раз встречается в данной выборке каждая варианта, называется частотой и изображается буквами f или р. Для определения частот произведем разноску: зачеркиваем первую цифру таблицы 2 и против варианты 18 ставим точку, затем зачеркиваем вторую цифру – 13, ставим точку против варианты 13, зачеркиваем третью цифру и ставим точку против варианты 20 и т. д. Числа 1, 2, 3, 4 изображаются точками; 5 и 6 - диагоналями, 7, 8, 9, 10 - сторонами квадрата. Закончив разноску наших данных, заменим точки и черточки цифрами - узнаем частоты. Сумма частот должна быть равна количеству взятых для исследования объектов. В нашем примере 2+6+8+12+8...+1 = 50, следовательно, разноска произведена правильно. Правильность разноски обязательно надо проверять, иначе допущенная и незамеченная своевременно ошибка при разноске сделает неверной всю дальнейшую работу. Сумма в вариационной статистике изображается заглавной буквой «сигма» греческого алфавита - Σ, количество объектов исследования — латинской буквой n. Запишем первую формулу:
Изобразим наш вариационный ряд графически (рис.1); на горизонтальной оси отложим варианты, на вертикальной - частоты. Рабочие графики удобно делать на клетчатой или миллиметровой бумаге.
Таблица 2
Графическое изображение вариационного ряда называется вариационной кривой, наиболее часто встречающаяся в вариационном ряду варианта - модой. В нашем примере мода равна 15. Варианта, расположенная в середине вариационного ряда, называется медианой. Мода изображается Мо, медиана - Me. В биологических исследованиях мода имеет большое значение.
Рис. 1. Число колосков в колосс пшеницы Казахстанская 126.
Разбивка вариант на классы. составление гистограмм. замена гистограмм кривыми. Двухвершинные и многовершинные кривые, протуберанцы ошибок.
Исследуя непрерывную изменчивость, а также анализируя данные, полученные при изучении npеpывной изменчивости при большом размахе варьирования, необходимо разбивать варианты на классы. Например, число икринок у рыб одного вида и возраста нередко изменяется более чем на 500. Совершенно ясно, что выписывать столбиком все варианты невозможно. При непрерывной изменчивости варианты чаще всего представлены смешанными числами: высота растений - 1,25; 2,15; 3,45 м и т. д. Содержание белка в зерне пшеницы - 15,2; 16,01; 16,5% и т. д. Между двумя целыми числами может располагаться 100 вариант, различающихся на 0,01 м или 0,01%.
В этих случаях варианты разбиваются на классы. При этом следует соблюдать следующие правила:
1. Границы классов должны быть такими, чтобы каждая варианта могла быть отнесена только к одному классу: 5-9, 10-14, 15-19 т.д., но не 5-10, 10-15,15-20 и т.д.
2. Размеры всех классов должны быть равными.
3. Первый и последний классы могут быть неполными. Например, при размере класса 10 и амплитуде изменчивости 76, размер последнего класса 70-79, хотя варианты 77-79 в нашем примере отсутствуют.
4. Количество классов должно быть не более 10-15 и не менее 6-7.
5. Для определения размера классов находят минимальную и максимальную варианты, определяют амплитуду изменчивости и делят ее на установленное количество классов, округляя полученное число до целого. Например: измерения высоты стеблей кукурузы 25/VIII 1972 г. дало результаты, приведенные в таблице 3.
Таблица 3
Амплитуда варьирования 100-179 = 79 см. Если примем размер класса за 10, то 79:10 = 7,9=8 классов. Наметим границы классов и составим таблицу 4.
При разноске мы зачеркиваем в нашей таблице очередную цифру и ставим точку или черточку против соответствующего класса. Так, в класс 100-109 мы отнесем варианты 100, 102, 103, 105, 106, 108. Мы получили вариационный ряд. Мода его - класс 130-139.
Графическое изображение вариационного ряда, разбитого на классы, называется гистрограммой. При составлении гистрограммы на горизонтальной оси наносятся размеры классов, на вертикальной — частоты. Гистрограмму можно превратить в вариационную кривую. Для этого надо соединить прямыми линиями середины классов. Изобразим при помощи гистрограммы полученные нами данные по высоте растений кукурузы (рис.2).
При анализе количественных данных исследователь обычно получает много чисел. Построение гистограмм и вариационных кривых помогает осмыслить эти числа, наметить определенные закономерности. Графики чисто помещают в печатных изданиях и в отчетах научно-исследовательской работе. Для удобства сравнения на одном чертеже помещают несколько кривых. На рабочих чертежах удобно эти кривые чертить цветной тушью или карандашами. Для печати кривые обычно чертят черной тушью, но разными шрифтами. Каждый чертеж сопровождается экспликацией, показывающей, как изображен тот или другой вариант опыта. Например, мы провели измерение высоты пяти гибридов кукурузы. Экспликация будет выглядеть следующим образом:
Гибрид ВИР156 (контроль) Юбилейный, Днепровский 56, Краснодарский 4, Южный 3
На одном чертеже неудобно располагать больше 5-6 вариантов опыта, поэтому если сравнивается большее количество вариантов опыта, то составляется несколько графиков, причем вариант, служащий контролем, помещается на каждом чертеже. Чтобы на одном чертеже можно было поместить несколько кривых, при разбивке вариант на классы надо границы классов устанавливать не по минимальной варианте каждого варианта опыта, а брать границы классов, общие для всех вариантов. Например, если минимальная высота растений в одном варианте опыта 100, в другом - 113, в третьем - 98 см, а размер класса принят за 10 см, то границы классов должны быть 90-99, 100-109, 110-119 и т.д. То, что первые классы могут отсутствовать или быть неполными, не имеет значения.
Для большинства признаков сельскохозяйственных и биологических объектов характерно нормальное распределение. Его отличительной чертой является то, что, чем больше отклоняется значение отдельной варианты от средней, тем реже она наблюдается. Например, большинство людей имеет средний рост. Великаны (более 200 см) и карлики (менее 100 см) встречаются крайне редко.
Наиболее часто отклоняются от нормального скошенное (асимметрия), крутовершинное (эксцесс), двух- и многовершинное распределения (рис. 3).
Рис. 3. Типы распределений. Пунктиром показано нормальное распределение.
В практической работе иногда наблюдается резкое снижение или возрастание частоты отдельных вариант. Такие выступы на кривых называются протуберанцами ошибок. Причины их возникновения:
1. Недостаточное количество объектов исследования.
2. Слишком мелкие градации изучаемых признаков.
3. Допущенные ошибки в измерениях или подсчетах.
Например, изучая количество зерен в колосьях пшеницы определенного сорта, мы получили данные, представленные в таблице 5. Если мы объединим количество зерен в классы по два, то кривая примет нормальный вид (рис. 5). Это естественно, так как разница в одно зерно может быть случайной.
Основная литература: [1-7]
Дополнительная литература: [8-14; 15-17]
