- •Казанский кооперативный институт (филиал)
- •Теория вероятностей и математическая статистика конспект лекций
- •Общие организационно-методические рекомендации преподавателю
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Предмет и задачи теории вероятностей
- •2. Основные понятия теории вероятностей. События и соотношения между ними. Классификация событий
- •3. Частота и вероятность события. Способы определения вероятности
- •Аксиомы теории вероятностей
- •Лекция 2 Основные формулы для вычисления вероятностей
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Основные формулы для вычисления вероятностей
- •6. (Рисунок 4).
- •7. (Рисунок 5).
- •Задание на самостоятельную работу
- •Лекция 3 Основные теоремы теории вероятностей: сложение, умножение, формула полной вероятности
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Правила сложения вероятностей
- •2. Правила умножения вероятностей
- •3. Формула полной вероятности
- •1. Формула Байеса, вероятность появления хотя бы одного события
- •Лекция 5 Основные законы распределения дискретных случайных величин. Формула Бернулли
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Понятие о случайной величине и законе её распределения
- •Р исунок 1
- •Р исунок 3
- •2. Формы закона распределения случайной величины: ряд распределения, функция распределения, функция плотности распределения
- •3. Формула Бернулли
- •Задание на самостоятельную работу
- •Лекция 6 Основные законы распределения дискретных случайных величин. Локальная теорема Муавра-Лапласа, формула Пуассона
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Локальная теорема Муавра-Лапласа
- •2. Распределение Пуассона
- •Задание на самостоятельную работу
- •Лекция 7 Основные законы распределения дискретных случайных величин. Интегральная теорема Лапласа
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1.1 Определение вероятности попадания случайной величины х с использованием приведенной табличной функции распределения
- •1.2 Определение вероятности попадания случайной величины на заданный интервал с использованием табличной функции плотности распределения
- •1.3 Определение вероятности попадания случайной величины на заданный интервал с использованием таблиц приведенной функции Лапласа
- •Текст лекции
- •1. Понятие случайной величины
- •2. Законы распределения дискретных случайных величин
- •Задание на самостоятельную работу
- •Лекция 9 Числовые характеристики: математическое ожидание, дисперсия, среднеквадратическое отклонение
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Понятие о числовых характеристиках случайной величины
- •2. Числовые характеристики положения: математическое ожидание и его основные свойства
- •3. Числовые характеристики рассеивания: дисперсия, среднеквадратическое отклонение. Основные свойства дисперсии
- •Задание на самостоятельную работу
- •Лекция 10 Непрерывные случайные величины: функция распределения случайной величины
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Функция распределения непрерывной случайной величины для определения вероятности попадания случайной величины на интервал
- •1.1. Функция распределения непрерывной случайной величины
- •1.2. Свойства функции распределения
- •Задание на самостоятельную работу
- •Лекция 11 Плотность вероятности. Числовые характеристики. Моменты случайных величин
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Плотность распределения непрерывной случайной величины для определения вероятности попадания случайной величины на интервал
- •1.1. Плотность распределения
- •1.2. Свойства плотности распределения
- •2.5. Медиана
- •2.6. Начальный момент
- •2.7. Центральный момент
- •2.8. Коэффициент асимметрии
- •2.9. Эксцесс
- •Задание на самостоятельную работу
- •Лекция 12 Законы распределения непрерывных величин: нормальное, равномерное, показательное
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Равномерное распределение
- •2. Показательное распределение
- •2.1. Функция надёжности
- •3. Нормальный закон распределения
- •3.1. Функция Лапласа
- •3.2. Правило трёх сигм
- •Задание на самостоятельную работу
- •Лекция 13 Понятие закона больших чисел
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •Закон больших чисел
- •1.1. Неравенство Чебышева
- •1.2. Теорема Чебышева
- •1.3. Теорема Бернулли
- •1.4. Теорема Пуассона
- •1.5. Предельные теоремы
- •1.6. Теорема Муавра – Лапласа
- •Текст лекции
- •1. Генеральная и выборочная совокупности
- •1.1. Статистическое описание результатов наблюдений
- •Текст лекции
- •1. Интервальные оценки параметров распределения. Непрерывное и дискретное распределения признаков
- •1.2. Интервальные оценки.
- •Текст лекции
- •1. Вариационные ряды
- •2. Построение интервального вариационного ряда
- •3. Графическое изображение вариационных рядов
- •4. Средние величины
- •5. Медиана и мода
- •6. Показатели вариации
- •7. Свойства эмпирической дисперсии
- •8. Эмпирические центральные и начальные моменты
- •9. Эмпирические асимметрия и эксцесс
- •Текст лекции
- •1. Доверительные вероятности, доверительные интервалы
- •Текст лекции
- •1. Корреляционный анализ
- •1.1. О связях функциональных и статистических
- •1.2. Определение формы связи. Понятие регрессии
- •1.3. Основные положения корреляционного анализа
- •1.4. Свойства коэффициента корреляции
- •1.5. Поле корреляции. Вычисление оценок параметров двумерной модели
- •1.6. Проверка гипотезы о значимости коэффициента корреляции
- •1.7. Корреляционное отношение
- •1.8. Понятие о многомерном корреляционном анализе
- •1.9. Ранговая корреляция
- •2. Регрессионный анализ
- •2.1. Основные положения регрессионного анализа
- •2.2. Линейная регрессия
- •2.3. Нелинейная регрессия
- •2.4. Оценка значимости коэффициентов регрессии. Интервальная оценка коэффициентов регрессии
- •2.5. Интервальная оценка для условного математического ожидания
- •2.6. Проверка значимости уравнения регрессии
- •2.7. Многомерный регрессионный анализ
- •2.8. Факторный анализ
- •Приложения
- •Функция Лапласа
- •Задание на самостоятельную работу
1.9. Ранговая корреляция
В некоторых случаях встречаются признаки, не поддающиеся количественной оценке (назовём такие признаки объектами). Попытаемся, например, оценить соотношение между математическими и музыкальными способностями группы учащихся. «Уровень способностей» является переменной величиной в том смысле; что он варьирует от одного индивидуума к другому. Его можно измерить, если выставлять каждому индивидууму отметки. Однако этот способ лишен объективности, так как разные экзаменаторы могут выставить одному и тому же учащемуся разные отметки. Элемент субъективизма можно исключить, если учащиеся будут ранжированы. Расположим учащихся по порядку, в соответствии со степенью способностей и присвоим каждому из них порядковый номер, который назовем рангом. Корреляция между рангами более точно отражает соотношение между способностями учащихся, чем корреляция между отметками.
Тесноту связи между рангами измеряют так же, как и между признаками. Рассмотрим уже известную формулу коэффициента корреляции
Пусть
тогда, учитывая, что
можно
записать
(1.22)
В
зависимости от того, что принять за меру
различия между величинами
можно получить различные коэффициенты
связи между рангами. Обычно используют
коэффициент корреляции рангов Кэнделла
(τ) и коэффициент корреляции рангов
Спирмэна ρ.
Введём
следующую меру различия между объектами:
будем считать
,
если
,
и
,
если
.
Поясним сказанное на примере. Имеем две
последовательности:
X |
2 4 5 1 3 |
Y |
1 5 3 4 2 |
Рассмотрим отдельно каждую из них. В последовательности X первой паре элементов —2; 4 припишем значение +1, так как i<j; второй паре 2; 5 также припишем значение +1, третьей паре 2; 1 припишем значение —1, поскольку i>j, и т.д. Последовательно перебираем все пары, причём каждая пара должна быть учтена один раз. Так, если учтена пара 2; 1, то не следует учитывать пару 1; 2. Аналогичные действия проделаем с последовательностью Y, причём порядок перебора пар должен в точности повторять порядок перебора пар в последовательности X. Результаты этих действий представим в виде табл. 1.3.
Таблица 1.3
Х |
|
Y |
|
|
2;4 |
+1 |
1;5 |
+1 |
+1 |
2;5 |
+1 |
1;3 |
+1 |
+1 |
2;1 |
-1 |
1;4 |
+1 |
-1 |
2;3 |
+1 |
1;2 |
+1 |
+1 |
4;5 |
+1 |
5;3 |
-1 |
-1 |
4;1 |
-1 |
5;4 |
-1 |
+1 |
4;3 |
-1 |
5;2 |
-1 |
+1 |
5;1 |
-1 |
3;4 |
+1 |
-1 |
5;3 |
-1 |
3;2 |
-1 |
+1 |
1;3 |
+1 |
4;2 |
-1 |
-1 |
∑ |
|
|
|
+2 |
Рассмотрим
формулу (1.22). В нашем случае
и равна количеству пар, участвовавших
в переборе. Каждая пара встречается
только один раз, поэтому их общее
количество равно числу сочетаний из п
по 2, т.е.
.
Обозначая
,
получаем формулу коэффициента корреляции
рангов Кэнделла:
(1.23)
Теперь
рассмотрим другую меру различия между
объектами. Если обозначить через
средний ранг последовательности X,
через
—
средний ранг последовательности Y,
то
.
Поскольку ранги последовательности X
и Y
есть числа натурального ряда, то их
сумма равна 7
,
а средний ранг
.
Тогда
Сумма
квадратов чисел натурального ряда равна
.
Тогда
Введём
новую величину d,
равную разности между рангами: d=X—Y,
и определим через неё величину
.
Имеем:
Коэффициент
корреляции рангов Спирмэна
.
(1.24)
У
коэффициентов τ
и ρ
разные масштабы, они отличаются шкалами
измерений. Поэтому на практике нельзя
ожидать, что они совпадут. Чаще всего,
если значения обоих коэффициентов не
слишком, близки к 1, ρ
по абсолютной величине примерно на 50%
превышает τ. Выведены неравенства,
связывающие ρ
и τ.
Например, при больших п
можно пользоваться следующим приближённым
соотношением: —1≤3τ—2ρ≤1,
или
.
Коэффициент ρ
легче рассчитать, однако с теоретической
точки зрения больший интерес представляет
коэффициент τ.
При вычислении коэффициента корреляций рангов Кэнделла для подсчёта s можно использовать следующий приём: одну из последовательностей упорядочивают так, чтобы её элементы были числами натурального ряда; соответственно изменяют и другую последовательность. Тогда сумму можно подсчитывать лишь по последовательности Y, так как все равны +1.
Если
нельзя установить ранговое различие
нескольких объектов, говорят, что такие
объекты являются связанными. В этом
случае объектам приписывается средний
ранг. Например, если связанными являются
объекты 4 и 5, то им приписывают ранг 4.5;
если связанными являются объекты 1, 2,
3, 4 и 5, то их средний ранг (1+2+3+4+5)/5=3. Сумма
рангов связанных объектов должна быть
равна сумме рангов при ранжировании
без связей. Формулы коэффициентов
корреляции для ρ
и τ
в этом случае также можно вывести из
формулы обобщённого коэффициента
корреляции, только знаменатель выражения
(1.21) в этом случае не равен n(n—1)/2.
Если t
последовательных членов связаны, то
все оценки, относящиеся к любой вобранной
из них паре, равны нулю; число таких пар
t(t—1),
Следовательно,
Соответственно для другой последовательности
где t и u—число связанных пар в последовательностях.
Обозначая
получаем
Общие организационно-методические рекомендации преподавателю 3
Рисунок 1 61
Рисунок 2 61
X 146
1.1. Статистическое описание результатов наблюдений 155
Если имеется несколько последовательностей, то возникает необходимость определить общую меру согласованности между ними. Такой мерой является коэффициент конкордации.
Пусть m — число последовательностей, п — количество рангов в каждой последовательности. Тогда коэффициент конкордации
(1.25)
где d — фактически встречающееся отклонение от среднего значения суммы рангов одного объекта.
Коэффициент корреляции рангов может быть использован для быстрого оценивания взаимосвязи между признаками, не имеющими нормального распределения, и полезен в тех случаях, когда признаки поддаются ранжированию, но не могут быть точно измерены.
