
- •Раздел 1. Элементы теории вероятностей и математической статистики 2
- •Раздел 2. Основы проверки статистических гипотез 65
- •Раздел 1. Элементы теории вероятностей и математической статистики
- •1. Основные определения и теоремы
- •1.1. Предмет теории вероятности
- •1.2. Событие как результат испытания
- •1.3. Частость и вероятность. Классическое определение вероятности
- •1.4. Теорема сложения вероятностей
- •1.5. Теорема умножения вероятностей
- •2. Повторные независимые испытания
- •2.1. Биномиальное распределение вероятностей
- •2.2. Наивероятнейшее число появлений события
- •2.3. Асимптотическая формула биномиального распределения (локальная терема Лапласа). Формула Пуассона
- •2.4. Интегральная теорема Лапласа
- •Упражнения.
- •3. Случайная величина и ее числовые характеристики
- •3.1. Случайная величина и ее распределение
- •3.2. Математическое ожидание и его свойства
- •3.3. Дисперсия и среднее квадратическое отклонение
- •3.4. Нормальный закон распределения и понятие о теореме Ляпунова
- •4. Закон больших чисел
- •4.1. Неравенства Маркова и Чебышева
- •4.2. Теорема Чебышева
- •5. Основные сведения из математической статистики
- •5.1. Генеральная совокупность и выборка
- •5.2. Устойчивость выборочных средних
- •5.3. Определение параметров выборки с помощью теоремы Ляпунова
- •5.4. Понятие о доверительных границах для средних
- •5.5. Примеры математической обработки данных выборочного наблюдения
- •5.6. Понятие о критериях согласия
- •6. Элементы теории корреляции
- •6.1. Функциональная и корреляционная зависимости
- •6.2. Линейная корреляция.
- •6.3. Коэффициент корреляции
- •6.4. Упрошенный способ вычисления коэффициента корреляции
- •6.5. Простейшие случаи криволинейной корреляции
- •6.6. Понятие о множественной корреляции
- •Упражнения
- •Раздел 2. Основы проверки статистических гипотез
- •1. Статистические модели
- •2. Проверка статистических гипотез (общие положения)
- •3. Примеры статистических моделей и гипотез, ранги и ранжирование
- •4. Проверка статистических гипотез (прикладные задачи)
- •4.1. Схема испытаний Бернулли
- •4.2. Критерий знаков для одной выборки
- •5. Проверка гипотез в двухвыборочных задачах
- •5.1. Критерий Манна-Уитни
- •5.2. Критерий Уилкоксона
- •6. Парные наблюдения
- •6.1. Критерий знаков для анализа парных повторных наблюдений
- •6.2. Анализ повторных парных наблюдений с помощью знаковых рангов (критерий знаковых ранговых сумм Уилкоксона)
- •Список использованной литературы
- •Список рекомендуемой литературы
6.2. Анализ повторных парных наблюдений с помощью знаковых рангов (критерий знаковых ранговых сумм Уилкоксона)
Если можно дополнительно предположить, что случайные величины из предыдущего пункта непрерывны и одинаково распределены, то для проверки гипотезы однородности можно применить более мощный критерий, основанный на статистике Т знаковых ранговых сумм Уилкоксона.
Метод. 1.
Вычислим абсолютные разности
.
Пусть Ri
обозначает ранг
в совместном упорядочении
от меньшего к большему.
2. Определим переменные
,
где
3. Вычислим наблюденное
значение
,
далее мы будем называть его
.
4. Для одностороннего
критерия для проверки
против правосторонней альтернативы
на уровне значимости :
• отклонить Н, если
• принять Н, если
где критическое значение
удовлетворяет уравнению
и может быть найдено по соответствующей
таблице.
Для одностороннего критерия для проверки
той же гипотезы против левосторонней
альтернативы
на уровне значимости :
• отклонить Н, если
• принять Н, если
Для двустороннего критерия для проверки
той же гипотезы Н против двусторонних
альтернатив
на уровне значимости 2:
• отклонить Н, если
или
• принять Н, если
Замечание.
Поскольку распределение статистики Т
дискретно, уравнение, определяющее
имеет точное решение не для всех значений
(при фиксированном п).
Поэтому либо в качестве
придется взять приближенное решение,
либо изменить
так, чтобы уравнение можно было решить
точно.
Приближение для большой выборки. При выполнении гипотезы Н статистика
имеет асимптотическое (при
)
распределение N(0,
1). Приведем приближение нормальной
теории для проверки Н, для
определенности, против правосторонней
альтернативы: Н отклоняется, если
,
в противном случае Н принимается.
Здесь
— квантиль уровня
стандартного нормального распределения
N(0, 1).
Остальные правила трансформируются
аналогично.
Совпадения. Если среди значений
есть нулевые, то их следует отбросить,
соответственно уменьшив п до
количества ненулевых значений zi.
Если среди ненулевых значений
есть равные, то для вычисления Т
надо использовать средние ранги для
величин
и далее использовать те же методы, что
и без совпадений. Для приближения для
больших выборок рекомендуется в формуле
для вычисления T*
значение DT заменить
на
где g
— число
связок,
— их
размеры. Определение связок смотри в
разделе
5.2 при
обсуждении статистики W*.
Список использованной литературы
Курс высшей математики с элементами теории вероятностей и математической статистике. Маркович Э. С. – М., «Высш. школа», 1972.
Статистический анализ данных на компьютере. Тюрин Ю. Н. и Макаров А. А. – М., «ИНФРА-М», 1998.
Список рекомендуемой литературы
Что могут дать обществоведам современная статистика и статистическая логика? Григорьян Э. Р. – М., // Статистические методы в общественных науках. С. 5 – 29., 1982.
Математические методы в социальных науках: Сб. статей / Под ред. П. Лазарсфельд и Н. Генри. - М.: Прогресс, 352 с., 1973.
Логика прикладного статистического анализа. Елисеева И. И., Руковишников В. О. – М.: Статистика, 192 с., 1982.
Как правильно пользоваться статистикой. Г. Кимбл. – М.: Финансы и статистика., 295 с., 1982.
Математические методы в социологическом исследовании. М.: Наука., 335 с., 1981.
Проверка статистических гипотез. Э. Леман. – М.: Наука., 408 с., 1979.
Достоверность статистических показателей. Эдельгауз Г. Е. – М.: Статистика, 278 с., 1977.
Математические методы обработки обработки статистической информации с помощью ЭВМ. Репин С. В., Шеин С. А.: Пособие для исследователей гуманит. спец. – Мн.: Университетское, 128 с., 1990.
1) Игральной костью называется кубик с круглоотточенными вершинами, на каждой грани которого помещены кружочки. На одной грани этого кубика находится один кружок, на другой — 2, на третьей — 3, на четвертой — 4, на пятой — 5 и на шестой — 6.
1) Имеется в виду, что эта система удовлетворяет условиям, установленным в предыдущем параграфе.
1)
По смыслу вероятности совместного
наступления двух событий ясно, что она
должна быть симметрична относительно
А и В. Поэтому
,
или
Это свойство легко проверить на примере 8, если искать вероятность появления белого и небелого шаров. В самом деле, обозначая через А появление белого шара и через В — небелого, имеем;
а) при появлении сначала белого шара
б) при появлении сначала небелого шара
1) Здесь Р2,3 обозначает вероятность появления события А два раза при трех повторных испытаниях. Соответственно Рm,n будет обозначать вероятность появления т раз события А при п повторных испытаниях.
1) Если при таком же значении п=5 требуется найти вероятность того, что число взошедших семян меньше 4, т. е. вычислить Р(m < 4), то непосредственное суммирование связано с отысканием по формуле Бернулли четырех слагаемых, что является слишком громоздкой операцией. Использование того, что Р(т < 4)+Р(m 4) = 1, позволяет проще найти искомую вероятность с помощью вычитания: Р(т < 4) = 1 Р(m 4). Такой прием вычисления выгоден в ряде примеров.
1) Эта формула называется асимптотической, так как она тем точней, чем больше .
2
2) Впервые формула такого вида
была получена для случая
в 1730 г. Муавром, а
обобщение ее для любого
было проведено Лапласом. Поэтому
правильней было бы называть эту формулу
локальной теоремой Муавра
— Лапласа.
3)
При наличии специальных таблиц с
логарифмами факториалов отпадает
необходимость преобразования выражения
.
1) Здесь для большей наглядности приняты различные масштабы по осям.
1) Практически вместо непосредственного вычисления по этой формуле следует пользоваться таблицей значений функции Пуассона.
1) Эти соотношения между a и b и соответствующими им числами и будут применяться ниже при решении задач с помощью этой теоремы.
1) Иногда говорят также «интегральный закон распределения»
1)
Действительно
1) Нумерация значений случайной величины обычно дается в порядке их возрастания.
1)
Случайные величины
называются попарно независимыми,
если для любых i и
j (от 1
до п) случайные величины
и
независимы.
1) Рамки настоящего курса не позволяют дать полное содержание этого закона, но и изложенные предложения могут быть использованы для их практического приложения.
1) Вместо здесь использован символ , принятый для обозначения ошибки репрезентивности как предела отклонения .
2) Здесь — средняя ошибка репрезентативности при определении средней признака в случае повторной выборки.
1)
Полученное из наблюдения распределение
случайной величины Х позволяет
определить для каждого значения х
частость всех значений Х
< х. Обозначая эту частость
в виде
[здесь т(х) — число
наблюдений, в которых Х < х, а
п — число всех
наблюдений], можно выразить эмпирическую
функцию распределения в виде
.
1)
При вычислении значений
для точности и удобства подсчетов
исходим из того, что
.
1)
При вычислении значений
для большей точности и удобства подсчетов
исходим из того, что
.
1) К слову сказать, теория движения Луны должна быть очень точной, ибо у нас (у человечества) есть очень мощные возможности ее проверки — Лунные и Солнечные затмения, сведения о которых сохранились в истории за многие тысячелетия. Теория должна не только достаточно точно предсказывать даты близящихся затмений (что относительно нетрудно), но и рассчитывать эти даты на много веков назад и получать при этом верные результаты. Такой точности добиться нелегко.