
- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
34Репрезентативность при изучении качественных признаков
Качественные признаки обычно не могут иметь градаций проявления: они или имеются, или не имеются у каждой из особей, например пол, комолость, наличие или отсутствие каких-нибудь особенностей, уродств, выдающихся качеств, хромосомных перестроек, точечных мутаций, заболеваний, исходов болезней и т. д.
Принципиальной разницы между количественными и качественными признаками нет. Степень проявлений большинства качественных признаков при более тщательном исследовании может быть измерена, и тогда качественный признак становится количественным. И, наоборот, любой количественный признак может быть выражен в альтернативной форме (например, больше средней и меньше средней) и тогда он для исследователя превратится в качественный признак.
При изучении групповых свойств по качественным признакам характеристика группы заключается в указании числа плюсовых и минусовых объектов, т. е. объектов, имеющих и не имеющих признак.
Основные сводные показатели: средняя величина и стандартное отклонение качественных признаков имеют, конечно, свои специфические особенности и по технике их расчета и по способам использования в биологических работах.
Средняя величина качественного признака в группе – это доля плюсовых объектов, определяемая по формуле:
; (10.21)
где р – выборочная доля плюсовых объектов (имеющих изучаемый качественный признак);
а – количество плюсовых объектов в группе;
n – объем группы.
Если группа состоит из 200 особей, из которых 120 самок, то доля самок в группе:
.
Если долю умножить на 100, то получится характеристика, выраженная в процентах.
В генеральной совокупности доля плюсовых объектов выражается такой формулой:
, (10.22)
где Р – доля плюсовых объектов в генеральной совокупности;
А – количество плюсовых объектов;
N – объем генеральной совокупности.
Сумма квадратов центральных отклонений или дисперсия качественных признаков определяется по формулам:
В выборках – C = npq; (10.23)
В генеральных
совокупностях –
; (10.24)
где q = 1 – p; Q = 1 – P – доля минусовых объектов в выборке и в генеральной совокупности.
При n = 200, а = 120, p = 0,6, q = 0,4
С = 200 0,6 0,4 = 48.
Стандартное отклонение качественных признаков определяется по формулам:
; (10.25)
. (10.26)
Стандартное отклонение качественных признаков имеет принципиальное отличие от сигмы количественных признаков. Произведение pq = p (1 – р) не может быть больше одной четверти:
max [pq] = 0,25 (10.27)
Эта максимальная величина произведения доли на свое дополнение до единицы получается при р = 0,5 и равна 0,5 0,5 = 0,25. Всякое другое произведение дает уже меньшую величину, например при р = 0,4; рq = 0,40,6 = 0,24.
Поэтому и стандартное отклонение качественных признаков не может быть больше определенного предела: в выборках:
. (10.28)
В генеральных совокупностях:
(10.29)
Наличие верхнего предела сигмы значительно упрощает планирование достаточной численности выборки при изучении качественных признаков.
Ошибка репрезентативности доли аналогична ошибке средней и определяется по формуле:
, (10.30)
Например: при n = 200, а = 120, p = 0,6, q = 0,4
.
Максимально возможное значение ошибки:
.
Если в выборке получены крайние значения доли (или 0 или 1, т. е. когда в выборке нет ни одного плюсового объекта или, наоборот, вся выборка состоит из одних плюсовых объектов), то ошибка таких долей определяется по формуле:
,
(10.31)
Если в выборке из 9 объектов не оказалось ни одного плюсового, то р = 0, а sр = 1/10 = 0,1.
В некоторых биологических исследованиях генеральные доли известны или предполагаются известными и все же требуется определить ошибку выборочной доли для выборок разного объема. В таких случаях ошибка доли определяется по точной формуле:
, (10.32)
где в числителе подкоренного выражения стоит произведение генеральной доли на ее дополнение до единицы, а в знаменателе – полный объем выборки (а не число степеней свободы).
Оценка генеральной доли, или определение ее доверительных границ, производится так же, как и оценка генеральной средней:
Р = р ± ; = t sp (10.33)
где Р, р – генеральная и выборочная доли;
= tst sp – возможная максимальная погрешность при прогнозе генерального параметра;
tst – критерий надежности для трех порогов вероятности безошибочных прогнозов (1=0,95, 2=0,99, 3=0,999) устанавливается так же как и при оценке генеральной средней; или по таблице стандартных значений критерия Стьюдента или по приближенным формулам;
sр – ошибка репрезентативности выборочной доли (показатель точности).
Пример
При исследовании 200 особей одного вида у 60 из них сказалась повышенная способность выдерживать сильное понижение температуры среды обитания. Как часто такие особи могут встретиться среди всей популяции?
Для решения этого
вопроса достаточно определить
доверительные границы генеральной
доли; при сходных данных
n = 200, a
= 60,
;
;
1
= 0,95; =
199; tst = 2,0; =
tst
sp=2,0
0,033=0,066;
p = 0,3 ± 0,066 [не более 0.3 + 0,066 = 0,366 ~ 37%; не менее 0.3 – 0,066 = 0,234 ~ 24%.