- •Введение
- •1Теоретическая часть
- •1.1Первичная обработка статистических данных.
- •1.1.1Упорядочение данных наблюдения
- •1.1.2Способ равных интервалов
- •1.1.3Способ равных частот
- •1.1.4Группировка данных наблюдения над дискретной случайной величиной
- •1.2Порядковые статистики и ранги
- •1.2.1Статистическая процедура “Ранг и персентиль”
- •1.3.3Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с известными дисперсиями (двухвыборочный z- критерий)
- •1.3.4Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с равными неизвестными дисперсиями (двухвыборочный t- критерий, равные дисперсии)
- •1.3.5Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с различными неизвестными дисперсиями (двухвыборочный t- критерий, различные дисперсии)
- •1.3.6Проверка гипотезы о равенстве дисперсий двух независимых нормальных случайных величин (f-критерий)
- •1.3.7Проверка гипотезы о равенстве дисперсий нескольких независимых нормальных случайных величин (критерии Бартлета и Кокрена)
- •2.1.3Способ равных частот
- •2.1.4Группировка данных наблюдения над дискретной случайной величиной
- •2.1.5Эмпирическая функция распределения
- •2.1.6Эмпирическая плотность вероятности
- •2.1.7Эмпирический ряд распределения
- •2.1.8Статистическая процедура «Описательная статистика»
- •2.2Порядковые статистики и ранги
- •2.2.1Статистическая процедура “Ранг и персентиль”
- •2.2.2Функция ранг
- •2.3Проверка параметрических гипотез
- •2.3.1Проверка гипотезы о значении математического ожидания нормальной случайной величины с известной дисперсией (одновыборочный z-критерий)
- •2.3.2Проверка гипотезы о значении математического ожидания нормальной случайной величины с неизвестной дисперсией (одновыборочный t-критерий)
- •2.3.3Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с известными дисперсиями (двухвыборочный z- критерий)
- •2.3.4Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с равными неизвестными дисперсиями (двухвыборочный t- критерий, равные дисперсии)
- •2.3.5Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с различными неизвестными дисперсиями (двухвыборочный t- критерий, различные дисперсии)
- •2.3.6Проверка гипотезы о равенстве дисперсий двух независимых нормальных случайных величин (f-критерий)
- •2.3.7Проверка гипотезы о равенстве дисперсий нескольких независимых нормальных случайных величин (критерии Бартлета и Кокрена)
- •2.4Проверка гипотезы о законе распределения случайной величины (критерии согласия)
- •2.4.1Критерий Крамера-Мизеса-Смирнова
- •2.4.2Критерий Андерсона-Дарлинга
- •2.4.3Критерии w Шапиро-Уилка
- •2.4.4Критерий согласия хи-квадрат Пирсона
- •2.4.5Критерий согласия Колмогорова
- •Заключение Список литературы
- •Приложение а
1.3.7Проверка гипотезы о равенстве дисперсий нескольких независимых нормальных случайных величин (критерии Бартлета и Кокрена)
Наиболее распространенными критериями проверки гипотезы H0: о равенстве дисперсий k независимых нормальных случайных величин X1,X2,…,Xk являются критерии Бартлета и Кокрена.
Критерий Бартлета
В основе этого критерия лежит статистика
(32)
где k – число сравниваемых дисперсий (число выборок)
– объем i-ой выборки
n – суммарный объем всех k выборок
– выборочная дисперсия i-ой выборки
– взвешенное среднее k выборочных дисперсий
(33)
где – выборочное среднее i-ой выборки
– j-й элемент i-ой выборки
Критерий Кокрена
Этот критерий применяется в тех случаях, когда объемы всех k выборок одинаковы (то есть когда n1=n2=…=nk=n). В его основе лежит статистика
(35)
где – наибольшая из k сравниваемых дисперсий
1.4Проверка гипотезы о законе распределения случайной величины (критерии согласия)
1.4.1Критерий Крамера-Мизеса-Смирнова
В этом критерии используется “весовая” функция ψ≡1 (то есть отклонения имеют одинаковый “вес”). При этом статистика принимает вид
1.4.2Критерий Андерсона-Дарлинга
1.4.3Критерии W Шапиро-Уилка
Эти критерии зависят от распределения. Они используются для проверки гипотез о том, что элементы выборки x1,x2,…,xn малого объема n являются реализациями нормальной случайной величины X или случайной величины X, имеющей показательное распределение.
А. При проверке гипотезы о том, что исследуемая случайная величины X имеет нормальное распределение, используется статистика
(37)
где – постоянные, значения которых приведены в таблице ПА.1 приложения А.
– i-ый упорядоченной выборки
– несмещенная выборочная оценка дисперсии исследуемой случайной величины Х и k
1.4.4Критерий согласия хи-квадрат Пирсона
1.4.5Критерий согласия Колмогорова
2Практическая часть
2.1Исходные данные
Исходные данные были взяты с сайта Википедии – свободной энциклопедии. Они предоставлены в форме числовых значений и являются непрерывными величинами. Данные взяты с интернет ресурса [Error: Reference source not found] , помещены на листе Excel «исходные данные» и показаны на рисунке 2.1
Рисунок 2.1 – Исходные данные
2.1.1Упорядочение данных наблюдения
Для выполнения данного этапа была взята часть данных, представляющая собой процент голосов за Единую Россию
Результат представлен на листе Excel «по возрастанию», а также на рисунке 2.1
Рисунок 2.1 – Упорядочение данных наблюдения
2.1.2Способ равных интервалов
Для выполнения данного этапа была взята часть данных, представляющая собой процент голосов за Единую Россию.
В Excel для реализации этого способа использовалась процедура Гистограмма. Результат представлен на листе Excel «Способ равных интервалов», а также на рисунке 2.2
Рисунок 2.1 – Способ равных интервалов
Так же мы можем самостоятельно задать границы интервалов. Число интервалов группировки найдено по формуле =ОКРУГЛ(КОРЕНЬ(85)-0,013*85;0) (ячейка C7) . Результат представлен на листе Excel «сп. равн инт. с зад. границами», а также на рисунке 2.3
Рисунок 2.3 – Способ равных интервалов, заданных пользователем