
- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
7Моменты
Большое значение в математической статистике имеют так называемые моменты распределения случайной переменной. В математическом ожидании большие значения случайной величины учитываются недостаточно. Дополнительной числовой характеристикой случайной величины, которая детальнее характеризует ее, являются моменты различных порядков. Не вдаваясь в подробное изложение теории моментов, приведем определение двух основных типов моментов.
Начальным моментом
k-го порядка случайной переменной
X называется математическое ожидание
k-ой степени ее: μk =
Е(Хk). Центральным моментом
k-го порядка случайной переменной
X называется математическое ожидание
k-ой степени отклонения X от ее
математического ожидания:
.
Если X – непрерывная случайная
переменная, плотность вероятности
которой есть f(х), то моменты μk
и ηk вычисляют по формулам:
(2.13)
В этих формулах (с, d), как и ранее, обозначает интервал, в границах которого случайная переменная X меняет свое значение. Принимается, что моменты μk и ηk случайной переменной существуют тогда и только тогда, когда интегралы в формулах (2.13) являются абсолютно сходящимися. Если X – дискретная переменная, то для вычисления μk и ηk необходимо заменить интегралы соответствующими рядами, причем моменты существуют тогда и только тогда, когда эти ряды абсолютно сходятся.
Следует отметить, что математическое ожидание и дисперсия суть частные случаи моментов. Математическое ожидание Е(Х) есть первый начальный момент μ1, а дисперсия D2(X) есть второй центральный момент η2. В статистическом анализе большое значение имеют также центральные моменты третьего и четвертого порядков. Третьи центральные моменты служат для оценки степени скошенности распределения (асимметрия). О центральных моментах четвертого порядка говорят, что они измеряют степень сглаженности (эксцесс) кривой плотности вероятности.
Вопросы для самоконтроля
Каким образом можно представить распределение дискретной случайной переменной?
Дайте определение случайной переменной.
Дайте определение дискретной и непрерывной случайной переменной.
При каких условиях случайная переменная называется непрерывной?
Дайте определение математического ожидания и дисперсии.
Чему равно значение математического ожидания при одинаковой вероятности величин случайной переменной?
Могут ли две случайные величины обладать одинаковым математическим ожиданием и различной дисперсией? Приведите практические примеры.
Какова размерность среднего квадратического отклонения?
Моментам какого порядка соответствуют математическое ожидание и дисперсия? Приведите формулы.
Моментам какого порядка соответствуют степени скошенности распределения и степени сглаженности кривой плотности вероятности.
Дискретные распределения
3.1 Биномиальное распределение и измерение вероятностей
3.2 Распределение редких событий (Пуассона)
8Биномиальное распределение и измерение вероятностей
В этой теме рассмотрим основные типы распределения дискретных случайных переменных. Предположим, что вероятность наступления некоторого случайного события А при единичном испытании равно р. Производится серия испытаний в каждом из которых случайное событие А может наступить с этой вероятностью р, причем следует отметить, что испытания независимы друг от друга.
Примеры исчисления вероятностей можно обобщить на основе следующей ниже иллюстрации.
Если подбрасываются одновременно 2 монеты (а, b), то существуют 4 возможных случая выпадения герба Т и цифры Н:
аb аb аb аb
ТТ ТН НТ НН
В первом исходе
имеем 2 герба. Принимая это за 2 благоприятных
исхода, получим вероятность каждого из
них р, а сложного события (ТТ)
.
В данном случае, при р = 1/2;
p2
= 1/4.
Четвертый из возможных исходов НН представляет 2 неблагоприятных исхода с вероятностью q q = q2 = 1/4.
Каждый из двух других исходов является комбинацией одного благоприятного и одного неблагоприятного случаев.
Вероятность каждого из этих исходов равна p q = 1/2 1/2 =1/4, а обоих вместе ТН и НТ равна их сумме, т. е. 2 р q = 1/2.
Обобщенным выражением процесса получения вероятностей различных сочетаний независимых событий, когда вероятности их известны, являются последовательные члены разложения бинома.
Для рассматриваемого примера из двух событий имеем: (р +q)2 = p2 + 2pq + q2. , При p = 1/2 получим (1/2 + 1/2)2 = 1/4+1/2+1/4.
Если 3 монеты а, b, с подбрасываются одновременно, получим 8 возможных комбинаций:
abс abc abc abc abc abc abc abc
ТТТ ТТН ТНН ТНТ НТТ НТН ННТ ННН
Вероятность выпадения 3 гербов составит 1/8, 2 гербов (в сочетании с одним случаем цифры) равна 3/8, одного герба и 2 цифр – 3/8, ни одного герба – 1/8. При 3 независимых событиях степень бинома равна 3.
Вероятности отдельных возможных исходов даются последовательными членами разложения:
(р + q)3 = p3 + 3p2q + 3pq2 + q3.
При p = q = 1/2 имеем (1/2 + 1/2)3 = 1/8 + 3/8 + 3/8 + 1/8, т. e. то же, что и непосредственным подсчетом.
Если число независимых случайных событий n, то вероятность n, n–1, n–2 и т. д. благоприятных исходов равна последовательным членам разложения:
(р + q)n
Если желаем получить вероятные численности разных исходов при данном числе испытаний n, применяем выражение:
N (p+q)n
Например, при числе испытаний N = 200 и двух независимых событиях n в каждом испытании вероятные численности будут равны 200(p+q)2 = 200(р2+2рq+q2). Если p = q = 1/2, имеем последовательные вероятные численности: 50 + 100 + 50.
При подбрасывании монеты 200 раз (N = 200) выпадения герба следует ожидать в 50 случаях, герба или цифры – в 100 случаях и цифры – 50 случаях.
При тех же р и N, но n = 3 получим последовательные вероятные численности: 25 + 75 + 75 + 25, которые означают 3, 2, 1 наступление события и ненаступление его, причем сумма всех численностей равна N.
При 200 бросаниях трех монет ожидаем в 25 случаях выпадения 3 гербов (ТТТ), в 75 случаях выпадения 2 гербов и одной цифры (ТТН), в 75 случаях выпадения 2 цифр и одного герба (ННТ) и в 25 случаях – 3 цифр.
Итак, когда вероятности независимых событий известны априори, то можно определить вероятные численности любого данного числа n, n–1, n–2.... наступления события и ненаступления его. При этом неважно, равны или не равны р и q, лишь бы они оставались при испытаниях постоянными. Этот факт имеет большое значение в теории статистики.
При изучении природных явлений выделение элементарных событий и вообще расчленения причинного процесса, в результате которого происходят случайные события, обычно невозможно. Классический подход к определению вероятности здесь бессилен. Проблему определения вероятностей таких событий решают на основе статистического подхода.
Однако классический подход к определению вероятностей событий лежит в основе теории анализа случайных событий и теоретических (модельных) распределений исходов испытаний. В свою очередь теория математического анализа случайных событий и модели распределений исходов испытаний являются базой статистических методов, в частности, базой статистических заключений.
Альтернативные, дискретно варьирующие признаки, как было показано выше, распределяются так, что вероятные численности их появления могут быть найдены по формуле бинома Ньютона:
(3.1)
где n – число независимых исходов в одном испытании; р – вероятность благоприятного исхода одного случая; q – вероятность неблагоприятного исхода; N – общее число испытаний (исходов).
При n = 6 возможны 26 = 64 исходов. При равной вероятности альтернатив, т. е. при условии р = q = 0,5, получим следующий ряд вероятных численностей:
64(0,5 + 0,5)6 = 64 [1/64 + 6/64 + 15/64 + 20/64 + 15/64 + 6/64 + 1/64] = 1+6+15 + 20 + 15 + 6+1
Откладывая значения числа наступления благоприятных исходов m по оси абсцисс, а значения вероятных численностей – по оси ординат, получим многоугольник численностей распределения (рисунок 3.1). Ломаная линия, соединяющая точки на графике, называется кривой распределения.
Найденные по формуле бинома численности или биномиальные коэффициенты (при p = q = 0,5) можно получить также при помощи треугольника Паскаля (таблица 3.1). Числовые значения коэффициентов построены так, что любой из них получается суммированием двух стоящих над ним строкой выше значений, справа и слева.
Значения коэффициентов, начиная с единицы, закономерно возрастают до определенного уровня, а затем в той же последовательности уменьшаются. Кривые, изображающие биномиальные распределения с р = q = 0,5, симметричны. При любой степени бинома п число коэффициентов равно n+1, например при n = 1 оно равно 2 и т. д. Сумма биномиальных коэффициентов равна 2n, как в нашем примере, n = 6; N = 26 = 64.
Если р и q не равны, распределение будет асимметрично, причем тем в большей степени, чем меньше n. При большом n, например 30 и более, оно симметрично и малоступенчато. Характер распределения остается тем же, независимо от того, выражено оно в значениях вероятности или в значениях частоты m ожидаемого события.
Рисунок 3. 1 – Кривая распределения
Таблица 3.1 – Треугольник Паскаля
n |
Биномиальные коэффициенты |
N=2n |
||||||||||
0 |
1 |
|
|
|
|
|
|
|
|
|
|
1 |
1 |
1 |
1 |
|
|
|
|
|
|
|
|
|
2 |
2 |
1 |
2 |
1 |
|
|
|
|
|
|
|
|
4 |
3 |
1 |
3 |
3 |
1 |
|
|
|
|
|
|
|
8 |
4 |
1 |
4 |
6 |
4 |
1 |
|
|
|
|
|
|
16 |
5 |
1 |
5 |
10 |
10 |
5 |
1 |
|
|
|
|
|
32 |
6 |
1 |
6 |
15 |
20 |
15 |
6 |
1 |
|
|
|
|
64 |
7 |
1 |
7 |
21 |
35 |
35 |
21 |
7 |
1 |
|
|
|
128 |
8 |
1 |
8 |
28 |
56 |
70 |
56 |
28 |
8 |
1 |
|
|
256 |
9 |
1 |
9 |
36 |
84 |
126 |
126 |
84 |
36 |
9 |
1 |
|
512 |
10 |
1 |
10 |
45 |
120 |
210 |
252 |
210 |
120 |
45 |
10 |
1 |
1024 |
Для вычисления вероятностей у события (появиться m раз в n независимых испытаний) наряду с формулой бинома применяют также формулу Якоба Бернулли:
(3.2)
Здесь
– число сочетаний из n элементов по
m, или биномиальный коэффициент;
р – вероятность ожидаемого события (благоприятного исхода);
q = 1 – р – вероятность противоположного события; m – частота появления ожидаемого события; n –число испытаний; n! и m! –факториалы, т. е.: 123...n и 123...m.
Совокупность вероятностей при m = 1, 2, 3, ...n называется биномиальным распределением вероятностей.
Так, для предыдущего примера, при p = q = 0,5, n = 6 и m = 0, 1, 2, ..., 6 вероятности будут:
m = 0
m = 1
m = 2
при m = 3, 4, 5, 6 вероятности соответственно будут равны:
20/64; 15/64; 6/64; 6/64 т. е. такие, какие получены по формуле бинома.
Биномиальное
распределение определяется двумя
параметрами: средней величиной μ
= np и дисперсией
или квадратическим отклонением
.
Для рассматриваемого примера имеем среднюю частоту ожидаемого случайного события = nр = 6 – 0,5 = 3 и дисперсию 2 = npq = 6 0,5 0,5 = 1,5.