- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
29Репрезентативность
Непосредственное изучение группы отобранных объектов дает, прежде всего, первичный материал и характеристику самой выборки.
Все выборочные данные и сводные показатели имеют значение в качестве первичных фактов, вскрытых исследованием и подлежащих тщательному рассмотрению, анализу и сопоставлению с результатами других работ. Но этим не ограничивается процесс извлечения информации, заложенный в первичных материалах исследования.
То обстоятельство, что объекты отбирались в выборку специальными приемами и в достаточном количестве, делает результаты изучения выборки показательными не только для самой выборки, но также и для всей генеральной совокупности, из которой взята эта выборка.
Выборка при определенных условиях становится более или менее точным отражением всей генеральной совокупности. Это свойство выборки называется репрезентативностью, что означает представительность с определенной точностью и надежностью.
Как и всякое свойство, репрезентативность выборочных данных может быть выражена в достаточной или в недостаточной степени. В первом случае в выборке получаются достоверные оценки генеральных параметров, во втором – недостоверные. Важно помнить, что получение недостоверных оценок не умаляет значения выборочных показателей для характеристики самой выборки. Получение же достоверных оценок расширяет область применения достижений, полученных при выборочном исследовании.
30Ошибки репрезентативности и другие ошибки исследований
Оценка генеральных параметров по выборочным показателям имеет свои особенности.
Часть никогда не может полностью охарактеризовать все целое, поэтому характеристика генеральной совокупности на основе выборочного исследования всегда будет неточной, всегда будет иметь некоторую большую или меньшую ошибку.
Такие ошибки являются ошибками обобщения, ошибками, связанными с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность и называются ошибками репрезентативности.
Ошибки репрезентативности в оценке генеральных параметров нельзя путать с другими видами ошибок, которые могут появиться в биологических работах.
Вообще могут встретиться пять категорий ошибок в выборочных и сплошных исследованиях. Из них первые четыре не могу быть вскрыты при анализе уже полученного материала биометрическими методами.
Надо отбросить необоснованные надежды на то, что методические ошибки, ошибки точности, ошибки внимания и ошибки типичности, допущенные при сборе первичного материала, могут каким-то образом быть обезврежены или учтены последующим применением математических методов. Эта возможность имеется только по отношению к пятой категории ошибок – к ошибкам репрезентативности.
Краткое описание ошибок всякого исследования можно представить в следующем виде.
А) Ошибку, которые нельзя учесть статистическими методами, но избежать или свести их к минимуму можно хорошей организацией исследования.
Ошибки методические возникают при применении неправильной методики сбора и обработки материалов, при неточном проведении химических анализов, при невыравненности общих условий жизни для контрольной и опытной групп и т. п.
Ошибки точности – это пороки первичной регистрации фактов, измерение непроверенными, испорченными инструментами, расчеты с недостаточной, а также и с избыточной ненужной точностью.
Ошибки внимания – описки, просчеты, перепутывание материалов, опечатки.
Ошибки типичности (иногда их неправильно называют ошибками репрезентативности) возникают главным образом в начальных стадиях экспериментов и наблюдений. Это особенно опасный вид ошибок, происходящих оттого, что в выборку отбирается группа объектов, нетипичная для всей генеральной совокупности, и по такой выборке делаются прогнозы на всю генеральную совокупность, вследствие чего получается сильно искаженная характеристика всей массы объектов изучаемой категории.
Ошибки типичности могут быть допущены бессознательно, при непонимании того, что в выборку должны привлекаться объекты без учета у них величины изучаемого признака, в случайном порядке – рендомизированно.
Ошибки типичности могут быть причиной совершенно ложных генеральных выводов, если они применяются сознательно, при тенденциозном подборе первичных данных в соответствии с тем, что хочет получить во что бы то ни стало недобросовестный автор исследования. Такие ошибки не могут быть вскрыты или учтены статистикой; ликвидация их целиком лежит на совести авторов биологических исследований.
Б) Ошибки, учитываемые статистическими методами, но неустранимые при проведении любого биологического исследования.
Ошибки репрезентативности возникают всегда, когда требуется по части охарактеризовать целое. Это неизбежные ошибки, вытекающие из самой сущности выборочного исследования: вся генеральная совокупность может быть охарактеризована по одной своей части только с некоторой ошибкой, с определенной погрешностью. Ошибки репрезентативности не могут быть устранены при любой организации работ (за исключением перехода на сплошное изучение).
Законен вопрос: зачем проводить исследование, которое безнадежно обречено на получение ошибочных результатов? Ответ на этот вопрос содержится в особых свойствах этих ошибок.
Во–первых, ошибки репрезентативности можно свести к достаточно малой величине, к величине допустимой погрешности, практически приемлемой при оценке генеральных параметров в конкретных условиях. Делается это путем привлечения в выборку достаточного количества объектов.
Во–вторых, возможную величину ошибок репрезентативности можно определить на основе анализа выборочных данных и учесть при оценке генеральных параметров.
Математическая статистика дает способы определения ошибок репрезентативности (ошибок выборочных показателей) средней арифметической s, доли sр, разности двух выборочных показателей sd, коэффициента корреляции sr и др.
Понимание сущности ошибок репрезентативности предохранит от необоснованного их применения. Определять величину ошибок репрезентативности требуется только для выборочных показателей, так как генеральные параметры не имеют ошибок репрезентативности.
Предположим, две отары овец исследуются в порядке серийного отбора как выборки из двух различных генеральных совокупностей, например из двух пород, для характеристики этих пород. В этом случае расчет ошибок репрезентативности средних показателей совершенно необходим для получения правильных выводов и для правильного сравнения обеих генеральных совокупностей – пород по изучаемому признаку.
Если же исследуются не выборки, а генеральные совокупности, определять ошибки репрезентативности не нужно. Например, определяется, в отаре какого чабана получен больший настриг шерсти за год. Для этой цели, исследуются две отары и по каждой определяется требуемая средняя годовая величина настрига. В данном случае расчет ошибок репрезентативности не будет иметь ни теоретического, ни практического применения. Обе отары в этом случае являются генеральными совокупностями, сравниваемыми на основе сплошного исследования. Поэтому любой статистический показатель по этим стадам определяется без ошибок репрезентативности. Такие невыборочные показатели могут иметь все другие категории ошибок, не учитываемых математической статистикой, но ошибок репрезентативности они не имеют.
Определять величину ошибок репрезентативности следует только в тех случаях, когда организация исследования исключает все другие виды ошибок или когда все они сведены к минимуму. Например, изучается вес рыб, идущих косяком, в котором впереди – самки, за ними – молодь и сзади – самцы. Если в выборку попали рыбы главным образом из головной части косяка, то при определении среднего веса для всего косяка будет допущена ошибка типичности: в выборку попали особи только из одной части генеральной совокупности, отличающейся от остальных частей. Очевидно, что в данном случае расчет ошибок репрезентативности уже не поможет, так как отбор особей в выборку произведен неправильно.