- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
32.3Недостоверная и достоверная оценка средней разности
Такие результаты выборочных исследований, по которым нельзя получить никакой определенной оценки генерального параметра (или он больше нуля, или меньше, или равен нулю), называются недостоверными.
Следует твердо усвоить, что недостоверные результаты выборочного исследования не дают никакого определенного ответа: ни положительного (А > В, новый сорт лучше стандартного), ни отрицательного (А < В, новый сорт хуже стандартного), ни нулевого (А = В, новый сорт не отличается от стандартного, или «разницы между сортами нет»). Ни один из трех возможных ответов не может быть принят, если результаты исследования оказались недостоверными.
Очевидно, что достоверными результатами следует называть такие результаты выборочного исследования, которые совершенно определенно оценивают генеральный параметр. Например, если повторить предыдущее сортоиспытание на 100 парах параллельных делянок и лучить такие же сводные показатели μ = + 1,0, =2,5, то оценка реальной средней разности урожаев будет вполне определенной и достоверной:
n = 100; = 99;
+ 1,0; = 2,5; s = 2,5/100 = 0,25;
2 = 0,99; t2 ( = 99) = 2,6; = 2,60,25 = 0,65
– не более + 1,0 + 0,65 = + 1,65 (A > В);
не менее +1,0 – 0,65 = + 0,35 (A > В).
Сортоиспытание выявило с надежностью β = 0,99 преимущество нового сорта перед стандартным.
32.4Оценка разности генеральных средних
В биологических исследованиях особое значение имеет разность двух величин. По разности ведется сравнение разных популяций, рас, пород, сортов, линий, семейств, опытных и контрольных групп (метод групп). По разности ведется сравнение одной группы особей в разном возрасте, в разных сезонах года, в разных условиях (метод периодов). По разности выявляются результаты различных воздействий на биологические объекты. И во всех этих случаях возникает основной вопрос: насколько правильно выборочные данные отражают генеральные соотношения.
Если проведено сплошное исследование двух генеральных совокупностей, то разность между соответствующими средними определяется без какой бы то ни было ошибки репрезентативности: всякая генеральная разность полностью достоверна. Все другие категории ошибок такая разность может иметь.
Например, если в одном совхозе средний суточный привес каждого из откормочников за год был 810 г, а в другом – 800 г, то не может быть никакого сомнения в том, что в первом совхозе привес за данный год больше, чем во втором, и при том на полную величину полученной разности: 810 – 800 = + 10 г.
Совершенно по-другому оценивается разность между двумя выборочными средними. При анализе такой разности всегда возникает вопрос о ее достоверности, т. е. о том, правильно ли разность между двумя выборочными средними характеризует ту генеральную разность средних, которая имеется между двумя соответствующими генеральными совокупностями.
Например, в совхозе, разводящем одну породу свиней, при оптимальных условиях средний суточный привес за, год составляет 810 г. В соседнем совхозе, разводящем другую породу, при таких же оптимальных условиях средний суточный привес за год составляет 800 г. Можно ли на основании полученной разности (810 – 800= +10 г) заключить, что все откормочники первой породы при данных условиях будут давать привесы, большие на 10 г в сутки по сравнению с откормочниками второй породы? Такого заключения сделать пока нельзя.
В данном случае каждая из сравниваемых групп – это серийные выборки: первая из первой породы, вторая из второй породы.
Каждая из полученных средних (μ1 = 810 г и μ2 = 800 г) есть выборочная средняя и имеет свою ошибку репрезентативности. Поэтому и разность между ними также имеет ошибку репрезентативности. Выборочная разность характеризует различие между обеими генеральными совокупностями по изучаемому признаку всегда с ошибкой репрезентативности.
Предположим, в выборочном исследовании получилось, что выборочная средняя в опытной группе больше выборочной средней в контроле. Если при этом проверялось действие какого-нибудь агента, повышающего хозяйственную продуктивность особей, превышение опыта над контролем имеет большое производственное значение.
Но тут же возникает сомнение: а можно ли считать, что и во всей генеральной совокупности таких особей изученный агент будет оказывать такое же благоприятное действие. Как показала практика, положительные результаты при выборочном испытании любых воздействий далеко не всегда повторяются и при массовом их применении.
Многочисленные удовлетворения и разочарования при массовой проверке результатов выборочных исследований выявили особое свойство разности выборочных показателей. Свойство это заключается в том, что разность между двумя любыми выборочными показателями в некоторых случаях может совершенно правильно отражать по знаку генеральную разность, (разность между двумя соответствующими генеральными параметрами), что можно выразить следующей формулой:
(10.18)
Формула иллюстрирует соответствие того, что получилось в выборках (первая выборочная средняя оказалась больше второй), тому, что имеется в соответствующих генеральных совокупностях (в них тоже первая средняя больше второй).
Свойство выборочной разности правильно, с заданной надежностью оценивать генеральную разность можно обозначить термином достоверность выборочной разности.
В указанном смысле выборочная разность может быть достоверна или недостоверна.
Легко понять, что значит «разность достоверна». Если в выборочном исследовании оказалась разница между выборочными показателями, то такая же разница по знаку будет и между соответствующими генеральными параметрами. В таких случаях основной вывод выборочного исследования имеет не только частное значение для изученной группы объектов, но может быть обобщен и перенесен на соответствующие генеральные совокупности.
Труднее понять, что значит «разность недостоверна». Очень распространено ошибочное мнение, что наличие в выборках недостоверной разности свидетельствует об отсутствии разницы между генеральными параметрами. Такое правило не имеет никаких ни теоретических, ни практических оснований.
Если получена недостоверная разность между выборочными показателями, то это значит, что не получено никакого определенного ответа о разности между соответствующими генеральными параметрами. Это можно показать следующей формулой:
или или (10.19)
Если получена благоприятная по смыслу исследования разность между, например, двумя выборочными средними, но эта разность оказалась (на основе специального анализа) недостоверной, то это значит, что между соответствующими генеральными средними могут быть любые соотношения, а какие именно – неизвестно, но это не может служить доказательством отсутствия разницы между генеральными средними.
Имеется и другое неправильное толкование понятий достоверная и недостоверная разность. Некоторые авторы считают, что достоверная разность между выборочными показателями свидетельствует якобы о том, что выборки взяты из разных генеральных совокупностей, а недостоверная разность – о том, что выборки взяты из одной генеральной совокупности. Легко понять неприемлемость таких указаний для биологов.
Биолог всегда сравнивает различные, неодинаковые для него генеральные совокупности: разные виды, сорта, породы, разные совокупности по полу, возрасту, разные совокупности, подвергавшиеся и не подвергавшиеся воздействиям, разные совокупности по времени их исследования.
То, что это разные совокупности, определено еще до исследования и уже не требует выяснения. Что бы ни получилось в результате выборочного исследования, генеральные совокупности всегда останутся разными, только в одних случаях будет установлено их достоверное различие по изучаемому параметру, а в других случаях ничего не будет установлено: ни того, что эти разные генеральные совокупности имеют различные параметры (например, средние), ни того, что эти разные генеральные совокупности по данному параметру не различаются.