![](/user_photo/2706_HbeT2.jpg)
- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
17.3Средняя квадратическая
Средняя квадратическая вычисляется по формуле:
, (6.5)
Она равна корню квадратному из суммы квадратов данных, деленной на их число.
Например, если имеется пять вариантов: 1, 4, 5, 5, 5, то средняя квадратическая:
.
Употребляется средняя квадратическая при расчете средних радиусов окружностей.
Пример
Измерения диаметров колоний, полученных от посева микробов определенного вида, дали следующие результаты (в мм): 15; 20; 10; 25; 30.
Для сравнения этого посева с другими требуется определить средний диаметр колоний. Применив формулу средней квадратической, имеем
.
Средняя арифметическая диаметров:
дает неправильную
характеристику группы.
Это можно проверить по правилу единства суммарного действия.
Общая площадь всех пяти колоний была:
3,14× (7,52+102+52+12,52+152) = 1766,25 мм2.
Если взять пять кругов с одинаковым диаметром, равным средней арифметической μ = 20, то общая площадь составит 5×З,14×102 = 1570 мм2, что гораздо меньше общей фактической площади.
Если же взять пять кругов с одинаковым диаметром, равным средней квадратической S = 21,22 мм2, то общая площадь будет 5×З,14× 10,612 = 1767,4 мм2, т. е. практически той же суммарной площади, которую имели пять измеренных колоний.
17.4Мода
Модой, или модусом, называется такая варианта или класс распределения вариант, который в исследуемой группе особей встречается наиболее часто. В качестве примера рассмотрим распределение, представленное в таблице 6.2.
Таблица 6.2 – Пример распределения
Классы |
100 – 119 |
120 – 139 |
140 – 159 |
160 – 179 |
180 – 199 |
200 – 219 |
220 – 239 |
240 – 259 |
260 – 279 |
280 – 299 |
300 – 319 |
Частоты |
2 |
20 |
60 |
160 |
250 |
240 |
180 |
70 |
15 |
2 |
1 |
В этом распределении наиболее многочисленным является пятый класс (180 – 199) с частотой 250. Это модальный класс.
В качестве первого приближения можно принять за моду средину модального класса, т. е. 190.
Более точное значение моды можно получить по формуле:
, (6.6)
где:
М0 – мода;
Wα – начало модального класса;
k – величина классового промежутка;
f1 – частота класса, предшествующего модальному;
f2 – частота модального класса;
f3 – частота класса, следующего за модальным.
Для приведенного распределения Wα = l80, k = 20, f1 = 160, f2 = 250, f3 = 240 (таблица 6.3).
Следовательно, мода этого распределения
Обычно, если классы взяты не слишком мелкие, имеется всего один модальный класс.
В некоторых распределениях встречаются два или три модальных класса. Иногда это может быть следствием того, что в изучаемую группу попал разнородный материал, относящийся к разным категориям (более крупной и менее крупной) по изучаемому признаку.
17.5Медиана
Медианой называют такое значение признака, которое разделяет всю группу на две равные части: одна часть имеет значения признака меньшее, чем медиана, а другая – большее.
Например, если имеется группа из 9 значений признака; 1, 2, 3, 4, 5, 6, 7, 8, 9, то медианой этой группы будет 5.
Для многочисленных групп медиану можно рассчитать по формуле:
, (6.7)
где:
Ме – медиана;
Wα – начало того класса, в котором находится медиана;
k – величина классового промежутка; n – общее число данных в группе;
– сумма частот
классов (начиная с меньшего), предшествующих
классу, в котором находится медиана;
f – частота класса, в котором находится медиана.
Нахождение медианы можно показать для распределения, представленного в таблице 6.3.
Таблица 6.3 – Пример нахождения медианы
Номера классов |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
|
Начала классов |
100–120 |
120–140 |
140–160 |
160–180 |
180–200 |
200–220 |
220–240 |
240–260 |
260–280 |
280–300 |
300–320 |
|
Частоты |
2 |
20 |
60 |
160 |
250 |
240 |
180 |
70 |
15 |
2 |
1 |
n=1000 |
Накопленные частоты |
2 |
22 |
82 |
242 |
492 |
732 |
912 |
982 |
997 |
999 |
1000 |
|
Судя по ряду накопленных частот, медиана находится в шестом классе, так как в первых пяти классах имеется 492 варианта, а меньше медианы должна быть половина всей группы, т. е. 500 вариантов. Недостающие до 500 восемь вариантов находятся в шестом классе.
Для данного
распределения Wα = 200, k =20,
=
492, f = 240, а медиана равна:
.
Медиана, обладая в полной мере всеми общими свойствами средних величин, дает начало целой серии показателей разнообразия, которые носят общее название квантилей. Квантиль – это такое значение признака, которое отсекает в распределении определенную часть вариантов больше себя и определенную часть вариантов меньше себя. К таким показателям относятся кроме медианы (средней величины) показатели, разнообразия: квартили, децили и перцентили.
Три квартиля разделяют группу на четыре равночисленные части. Второй квартиль равен медиане, а расстояние между третьим и первым квартилями является одним из показателей степени разнообразия значений признака в группе.
Девять децилей разделяют группу на десять равночисленных частей. Пятый дециль равен медиане, а расстояние между девятым и первым децилями служит одним из показателей разнообразия.
Девяносто девять перцентилей делят группу на сто равночисленных частей. Пятидесятый перцентиль равен, медиане; девяносто девятый и первый перцентиль используются иногда в качестве максимума и минимума группы; расстояние между девяносто девятым, и первым перцентилями служит показателем размаха признака и разнообразия вариантов в этой группе.