
- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
20.2Коэффициент вариации
Стандартное отклонение – величина именованная, выраженная в тех же единицах измерения, как и средняя арифметическая.
Поэтому для сравнения разных признаков, выраженных в разных единицах измерения, используется не абсолютное, а относительное значение среднего квадратического отклонения в форме коэффициента вариации:
, (7.5)
где:
V – коэффициент вариации;
σ – стандартное отклонение;
μ – средняя арифметическая.
Коэффициент вариации есть сигма, выраженная в процентах от средней арифметической. Этот показатель неименованный, поэтому он и пригоден для сравнения разных признаков или одного и того же признака, но в группах с резко различной средней величиной признака.
Пример
Если в стаде коров сводные показатели по удою за первую лактацию равны μ1 = 3000 кг, σ1 = 600 кг, а по живому весу μ2 = 400 кг, σ2 = 20 кг, то коэффициенты вариации будут иметь следующую величину:
по удою
;
по живому весу
Сопоставление коэффициентов вариации указывает на сильное разнообразие первотелок изученного стада по удою и слабое разнообразие их по живому весу.
В соответствии с этими характеристиками можно заключить, что в исследованном стаде имеются большие возможности отбора по удою (лучших – на племя, худших – на мясо), но слабые перспективы для подобного же отбора по живому весу.
20.3Лимиты и размах
Для быстрой и примерной оценки степени разнообразия часто применяются простейшие показатели:
lim = {min max} – лимиты, т. е. наименьшее и наибольшее значения признака,
p = (max – min) – размах, или разность между лимитами.
Для группы данных 1, 2, 3, 4, 5 лимиты и размах могут быть обозначены так:
lim = l 5.
Иногда характеристика разнообразия группы в форме лимитов имеет столь большое производственное значение (например, при упаковке яблок, помидор и т. д., при оценке партии беконных тушек), что кладется в основу денежной оценки продукта.
При проведении параллельных анализов лимиты результатов и их размах служат показателем качества работы лаборанта.
В некоторых случаях лимиты могут служить единственной характеристикой признака.
20.4Приближенные значения μ и
Если не требуется особой точности, то на основе лимитов можно быстро определить приближенные значения средней арифметической и сигмы.
Средняя арифметическая примерно равна полусумме лимитов:
. (7.6)
Стандартное отклонение примерно равно разности лимитов, деленной на число K, зависящее от численности группы (n):
(7.7)
Число K можно находить по таблице 7.1.
Таблица 7.1 – Числа K, на которые надо разделить размах значений признака, чтобы получить примерное значение среднего квадратического отклонения
n |
2 - 5 |
6 - 15 |
16 - 49 |
50 - 200 |
201 - 1000 |
> 1000 |
K |
2 |
3 |
4 |
5 |
6 |
7 |
Пример
Среди 20 выловленных волков максимальный вес животного оказался 42 кг, минимальный – 30 кг.
кг;
кг.
Перечисленные свойства лимитов и размаха показывают, что эти простейшие показатели разнообразия представляют вполне реальный интерес даже при наличии и более точных показателей.