
- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
Оценка генеральных параметров
10.1 Общий порядок оценки
10.2 Критерий достоверности разности
10.3 Репрезентативность при изучении качественных признаков
10.4 Достоверность разности долей
32Общий порядок оценки
Три величины,
необходимые для оценки генерального
параметра, – выборочный показатель
(
),
критерий надежности (t) и показатель
точности (
)
– определяются следующим образом.
Выборочный показатель ( ) рассчитывается по выборочным материалам способом, изложенным при описании этого показателя.
Критерий надежности (t) определяется заранее, при планировании исследования, исходя из представления о большей или меньшей ответственности возможных результатов работы. Критерий надежности – это показатель вероятности безошибочных прогнозов.
Практика биологических работ выработала три основных порога вероятности безошибочных прогнозов: при обычной ответственности 1 = 0,95, при повышенной ответственности 2 = 0,99 и при высокой ответственности 3 = 0,999.
Критерий надежности (t) связан с этими тремя порогами вероятности безошибочных прогнозов () при достаточно больших выборках так, как это показано в таблице 10.1.
Таблица 10.1 – Три порога надежности (вероятности безошибочных прогнозов)
Порог |
Применение |
Вероятность безошибочных прогнозов |
Критерий надежности |
Объем выборок |
1 |
Обычные требования надежности |
β1 = 0,95 |
t1= 1,960 |
n1 > 30 |
2 |
Повышенные требования |
β2 =0,99 |
t2=2,576 |
n2 > 100 |
3 |
Высокие требования надежности |
β3 = 0,999 |
t3 = 3,291 |
n3 > 200 |
Для выборок, объем которых меньше указанного в таблице 10.1, и вообще для выборок любого объема значение t определяется по таблице критериев Стьюдента, в которых критерии надежности приводятся для любого объема выборок в зависимости от числа степеней свободы данного показателя, для каждого из трех порогов вероятности безошибочных прогнозов. Таблицы критериев Стьюдента приведены в учебниках по математической статистике.
При отсутствии таблицы критериев Стьюдента стандартные значения критерия надежности можно определить с достаточным приближением по формуле:
; (10.1)
tst – стандартное значение критерия при числе степеней свободы ;
– критерий
надежности для достаточно больших
выборок
(t1 = 2.0; t2 = 2,6; t3
= 3,3);
Для обычных требований надежности ( = 0.95) эта формула приобретает более простой вид:
; (10.2)
Показатель точности или ошибка репрезентативности выборочного показателя определяется на основе выборочных данных по формулам математической статистики.
Ошибка средней арифметической:
; (10.3)
Ошибка среднего квадратического отклонения:
; (10.4)
Ошибка коэффициента вариации:
; (10.5)
Ошибка разности средних:
а) при некоррелированных выборках:
; (10.6)
б) при коррелированных выборках:
; (10.7)
(r – коэффициент корреляции)
Ошибка показателя асимметрии:
; (10.8)
Ошибка показателя эксцесса:
; (10.9)
Средняя ошибка суммы нескольких средних:
; (10.10)
Средняя ошибка произведения двух выборочных средних:
; (10.11)
Средняя ошибка частного двух выборочных средних:
; (10.12)
Средняя ошибка разности выборочных средних двух независимых распределений.
При n1 = n2:
; (10.13)
При n1 ≠ n2:
; (10.14)
Объединенная дисперсия двух выборок:
; (10.15)
Средняя ошибка разности в парных опытах:
; (10.16)
Di – разности между вариантами сопряженных рядов X1 и X2;
; (10.17)
n – общее число парных наблюдений.
Итак, для того чтобы оценить генеральный параметр для количественных признаков в форме доверительных границ необходимо:
Проверить на нормальность распределения исходных данных.
Установить число степеней свободы по правилам, приведенным при описании оценки каждого параметра.
Установить, исходя из ответственности исследования (таблица 10.1), порог вероятности безошибочных прогнозов (β1 = 0,95, β2= 0,99, β3= 0,999).
В соответствии с числом степеней свободы найти значение критерия надежности t по таблице стандартных значений критерия Стьюдента. При отсутствии таблицы показатель надежности для данного исследования можно приближенно определить по приведенным формулам. Если объем выборки превышает нижние пределы больших выборок (n > 30, n > 100, n > 200), то показатели надежности берутся постоянные для каждого порога вероятности: t1 = 2.0; t2 = 2.6; t3 = 3,3.
Рассчитать ошибку выборочного показателя по формулам, приведенным выше и указанным при описании оценки каждого параметра.
Определить возможную погрешность оценки генерального параметра, помножив критерий надежности на ошибку репрезентативности
.
Установить доверительные границы генерального параметра; возможный максимум:
и гарантированный минимум:
.