
- •Содержание
- •4.1 Построение эмпирической функции распределения, гистограммы и полигона частот 19
- •5.1 Смещенные и несмещенные оценки числовых характеристик 24
- •I. Эмпирические распределения случайной величины
- •1.1 Построение эмпирической функции распределения, гистограммы и полигона частот
- •1.2 Предположение о виде закона распределения, о рвз
- •II. Оценки числовых Характеристик случайной величины
- •2.1 Смещенные и несмещенные оценки числовых характеристик
- •III. Проверка выборки на резко выделяющиеся значения
- •3.1 Проверка выборки на рвз по классическому правилу
- •3.2 Проверка выборки на рвз по робастному правилу
- •3.3 Выводы по проверке выборки на резко выделяющиеся значения
- •IV. Эмпирические распределения случайной величины для выборки без рвз
- •4.1 Построение эмпирической функции распределения, гистограммы и полигона частот
- •4.2 Предположение о виде закона распределения, о рвз
- •V. Оценки числовых характеристик случайной величины для выборки без рвз
- •5.1 Смещенные и несмещенные оценки числовых характеристик
- •5.2 Относительные ошибки между смещенными и несмещенными оценками
- •VI. Проверка гипотезы о законе распределения случайной величины
- •6.1 Подходящий закон распределения
- •6.2 Критерий Пирсона
- •6.3 Критерий Колмогорова
- •6.4 Критерий
- •6.5 Выражения для функции нормального распределения и плотности нормального распределения
- •VII. Доверительные интервалы
- •7.1 Доверительные интервалы для математического ожидания и дисперсии
- •7.1.1 По исходным данным
- •7.1.2 По второй строке исходных данных
- •7.2 Сравнение доверительных интервалов
- •7.3 Доверительные интервалы для функции распределения
- •VIII. Теоретические числовые характеристики распределения
- •8.1 Числовые характеристики случайной величины
- •8.2 Сравнение теоретических числовых характеристик с их оценками
- •IX. Однофакторный дисперсионный анализ
- •9.1 Проверка выхода на нормальный закон распределения
- •9.2 Средние и дисперсии по уровням
- •9.3 Проверка однородности дисперсий по партиям
- •9.4 Общая дисперсия, дисперсия фактора, дисперсия помехи
- •9.5 Проверка значимости входного фактора
- •X. Гипотезы о числовых характеристиках
- •Проверка гипотезы
- •Проверка гипотезы
- •Проверка гипотезы
- •Проверка гипотезы
- •Список использованной литературы
3.2 Проверка выборки на рвз по робастному правилу
Когда закон распределения заметно отличается от нормального, применяются робастные правила удаления резко выделяющихся значений. Робастные правила основаны на робастных оценках центра данных.
Алгоритм удаления РВЗ по робастному правилу:
Находим выборочную медиану
, которая делит вариационный ряд на две равные части по количеству элементов, по формуле:
Находим медиану абсолютных отклонений (МАО) -
, где
Рассчитываем интервал, за пределом которого данные будут считаться резко выделяющимися значениями:
Данный алгоритм нужно повторять до тех пор, пока все элементы выборки не войдут в интервал.
Проверим заданную выборку на РВЗ по данному правилу.
Находим выборочную медиану , которая делит вариационный ряд на две равные части по количеству элементов:
- - четное
Находим медиану абсолютных отклонений - :
Сортируем полученную выборку по возрастанию
Рассчитываем интервал:
В данный интервал не вошли 13 элементов
выборки, т.е. можно считать эти элементы
резко выделяющимися значениями. Новый
объем выборки составляет
.
Данный алгоритм пришлось повторить 7
раз, прежде чем все элементы выборки
вошли в рассчитанный интервал. Объем
выборки без РВЗ составил
:
- - нечетное
- все 95 элементов вошли в данный интервал.
Следовательно, по робастному правилу получили, что объем выборки без РВЗ составляет .
3.3 Выводы по проверке выборки на резко выделяющиеся значения
Сравним результаты, полученные при использовании классического правила для проверки выборки на РВЗ и робастного правила.
Проверка выборки на резко выделяющиеся значения по классическому правилу показала, что в исходной выборке есть РВЗ, выборка без РВЗ составила . Проверка по робастному правилу также показала, что в исходной выборке есть РВЗ, но выборка без РВЗ составила . В итоге получили два различных объема выборки без резко выделяющихся значений.
Так как по классическому правилу мы не
достигли такого значения
,
при котором бы выполнялось условие
,
а лишь можем предположить, что при
значение
- не РВЗ, то можем сделать вывод, что
классическое правило дало только
приблизительные результаты. Робастное
правило, как упоминалось выше, применяется
когда закон распределения заметно
отличается от нормального, что можно
без труда заметить на рисунке, где
изображена гистограмма частот исходной
выборки (см. рис. 2.). Также важно отметить,
что робастное правило дало более точный
результат по объему выборки.
Исходя из этих размышлений, я предпочла использовать далее объем выборки, полученный из проверки на РВЗ по робастному правилу, т.е. .
Так как в исходной выборке после проверок были обнаружены резко выделяющиеся значения, необходимо вновь уже для выборки без РВЗ ( ) построить эмпирическую функцию распределения, гистограмму, полигон частот, найти оценки числовых характеристик случайной величины.
IV. Эмпирические распределения случайной величины для выборки без рвз
4.1 Построение эмпирической функции распределения, гистограммы и полигона частот
Для построения эмпирической функции распределения случайной величины, гистограммы и полигона частот для заданной выборки объемом выполним следующие расчеты:
Отсортированная выборка без РВЗ представлена в таблице 3.
Таблица 3
Выборка без РВЗ, отсортированная по возрастанию
-16,22 |
-14,69 |
-13,91 |
-11,87 |
-11,01 |
-10,98 |
-10,56 |
-10,22 |
-9,65 |
-9,29 |
-9,21 |
-8,89 |
-8 |
-7,38 |
-7,37 |
-7,37 |
-6,34 |
-6,28 |
-6,23 |
-5,97 |
-5,95 |
-5,09 |
-4,65 |
-4,56 |
-4,26 |
-4,13 |
-4,07 |
-3,95 |
-3,73 |
-3,42 |
-3,28 |
-3,1 |
-2,91 |
-2,68 |
-2,35 |
-1,81 |
-1,77 |
-1,6 |
-1,6 |
-1,45 |
-1,44 |
-1,42 |
-1,09 |
-1,07 |
-0,86 |
-0,85 |
-0,85 |
-0,81 |
-0,73 |
-0,68 |
-0,58 |
-0,42 |
-0,34 |
-0,25 |
-0,04 |
0 |
0,08 |
0,11 |
0,14 |
0,17 |
0,28 |
0,95 |
0,97 |
1,03 |
1,16 |
1,21 |
1,5 |
1,51 |
1,52 |
1,65 |
1,68 |
1,86 |
2,69 |
3,16 |
3,4 |
3,63 |
4,08 |
4,16 |
4,67 |
5,13 |
5,14 |
5,71 |
5,82 |
6,47 |
6,6 |
7,11 |
7,15 |
9,75 |
10,09 |
10,28 |
11,65 |
12,48 |
12,72 |
13,29 |
16,56 |
|
|
|
|
|
Разобьем весь диапазон наблюдаемых значений на интервалы. Рассчитаем количество интервалов по следующей формуле:
Так как
,
то
Определим размах выборки . Для данной выборки (см. таблицу 3)
,
, тогда:
Находим ширину интервалов (шаг) по формуле:
Так как
,
,
то
Границы интервалов найдем по формулам:
Находим количество точек, попавших в i-ый интервал - частоты .
Находим середину i-ого интервала .
Для каждого интервала находим накопленные частоты:
Определим относительную частоту i-ого интервала по формуле:
Для каждого интервала находим относительные накопленные частоты по следующей формуле:
Для i-ого интервала находим оценку плотности вероятности:
Результаты расчетов приведены в таблице 4.
Таблица 4
Результаты расчетов для построения ЭФР, гистограммы и полигона частот
№ |
|
|
|
|
|
|
|
1 |
[-16,22; -11,5371) |
4 |
-13,87855 |
4 |
0,0421 |
0,0421 |
|
2 |
[-11,5371; -6,8542) |
12 |
-9,19565 |
16 |
0,1263 |
0,1684 |
|
3 |
[-6,8542; -2,1713) |
19 |
-4,51275 |
35 |
0,2 |
0,3684 |
|
4 |
[-2,1713; 2,5116) |
37 |
0,17015 |
72 |
0,3895 |
0,7579 |
|
5 |
[2,5116; 7,1945) |
15 |
4,85305 |
87 |
0,1579 |
0,9158 |
|
6 |
[7,1945; 11,8774) |
4 |
9,53595 |
91 |
0,0421 |
0,9579 |
|
7 |
[11,8774; 16,5603] |
4 |
14,21885 |
95 |
0,0421 |
1 |
|
Графиком эмпирической функции распределения (ЭФР) случайной величины является ступенчатая функция. График полученной ЭФР показан на рис. 4.
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии . Гистограмма частот для данной выборки изображена на рис. 5.
Для построения полигона частот на оси абсцисс откладывают варианты , а на оси ординат – соответствующие им частоты . Точки соединяют отрезками прямых и получают полигон частот. Полигон частот заданной выборки показан на рис. 6.