- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
20Стандартное (среднеквадратическое) отклонение
Степень разнообразия особей в группе по изучаемому признаку измеряется несколькими показателями, из которых наибольшее значение имеет стандартное отклонение или стандартное отклонение:
(7.1)
(7.2)
– стандартное отклонение;
x2 – сумма квадратов центральных отклонений, т. е. квадратов разностей между каждым значением и средней арифметической;
Xi – значение признака у каждого объекта в группе;
μ – средняя арифметическая признака для данной группы;
n – 1 – число степеней свободы, равное числу объектов в группе без одного.
20.1Число степеней свободы
Число степеней свободы равно числу элементов свободного разнообразия в группе. Оно равно числу всех имеющихся элементов изучения без числа ограничений разнообразия.
Например, для исследования требуется взять три объекта с любым развитием изучаемого признака. В данном случае величина признака не имеет никаких ограничений, поэтому число степеней свободы n= 3 – 0 = 3.
Если требуется взять три числа с условием, что сумма их должна быть равна определенной величине, например: 100, то первое число может быть любой величины: 80, 800 и т. д., второе число также может быть выбрано свободно без всяких ограничений, например 10, 1269 и т. д., то третье же число может иметь только одно значение, такое, чтобы оно вместе с двумя предыдущими составило бы в сумме 100. Если два первых числа были 80 и 10, то третье должно быть 10; если два первых числа 800 и 1269, то третье должно быть отрицательным: –1969 (800+1269–1969 = 100).
В данном случае, при одном ограничении (сумма чисел должна быть равна 100), два числа выбираются свободно, а третье не имеет свободы выбора: для трех чисел имеются две степени свободы = 3 – 1 = 2.
Для n значений при k ограничениях имеется = n–k степеней свободы.
При вычислении средней арифметической никаких ограничений величины значений признака не имеется. Поэтому число элементов, образующих среднюю арифметическую, равно числу вариантов.
При вычислении среднего квадратического отклонения имеется одно ограничение. Сигма вычисляется для определенной группы, имеющей определенную среднюю арифметическую. Поэтому разнообразие элементов, образующих стандартное отклонение, ограничено этим одним условием и в данном случае число степеней свободы равно числу вариантов без одного = n–1.
Определение критерия достоверности разности двух средних величин производится при числе степеней свободы = n1+n2–2. Это связано с тем, что ошибка разности определяется на основе ошибок обеих средних, каждая из которых имеет число степеней свободы (для соответствующей сигмы) n–1. В сумме число степеней свободы:
n1–1+n2–1 = n1+n2–2
Для критерия достоверности разности двух коэффициентов корреляции число степеней свободы равно для первого коэффициента n1–2; для второго коэффициента n2–2; для их разности:
d n1–2+n2–2 = n1+n2–4
По приведенным формулам можно рассчитывать стандартное отклонение для групп любого объема.
Стандартное отклонение служит основным показателем разнообразия значений признака в группе. Используется сигма и как самостоятельный показатель, и как основа для построения многих других показателей статистики: коэффициента вариации, ошибок репрезентативности, различных показателей распределения, коэффициентов корреляции и регрессии, элементов дисперсионного анализа, формул регрессии.
Основное свойство всякой группы – разнообразие входящих в нее объектов по изучаемому признаку – измеряется несколькими показателями. К ним относятся: лимиты и размах, стандартное отклонение, коэффициент вариации, квартили, децили, перцентили.
Следует иметь в виду, что формула сигмы с числом степеней свободы в знаменателе подкоренного количества применяется только для выборок:
(7.3)
Сигма генеральной совокупности вычисляется по формуле:
, (7.4)
где:
– генеральная сигма;
– генеральная средняя;
N – объем генеральной совокупности
Пример
На сельскохозяйственной выставке сравниваются экспонаты двух хозяйств, представивших лучшие экземпляры тыквы со своих огородов. Первое хозяйство представило 6 тыкв, весивших 33, 37, 32, 38, 34, 36 кг, второе представило 5 тыкв, весивших 33, 37, 34, 36, 35 кг.
Так как средний вес экспонатов оказался одинаковым у обоих экспонатов (μ1 = 35, μ2 = 35), было решено провести сравнение стандартности тыкв по среднему стандартному отклонению.
В данном случае сравнивались не выборки, а генеральные совокупности, так как оценка проводилась по выставочным экземплярам, которые целиком исчерпывали всю требующуюся в данном случае информацию.
Дисперсии и средние стандартные отклонения (сигмы):
(а не );
(а не ).
;
Коэффициенты вариации:
; .
Оказалось, что второй совхоз представил более стандартную партию тыкв.
Так как сравнение в данном случае проводилось по генеральным параметрам, то разность сигм заведомо достоверна и не нуждается в определении достоверности. Обычные методы определения достоверности разности в данном случае не нужны и неприменимы, так как сравниваемые группы выбирались не так, как это требуется при организации выборок (не рендомизированно).
Сравнение стандартности двух партий тыкв характеризует более благоприятно второе хозяйство, которое смогло подобрать более выровненную группу экспонатов.