- •1 Представление выборки. Вариационный ряд
- •2 Точечные оценки параметров распределения
- •2.1 Меры центральной тенденции
- •2.2 Абсолютные и средние показатели вариации данных
- •2.3 Показатели относительного рассеивания
- •2.4 Показатели асимметрии и эксцесса
- •3 Интервальные оценки математического ожидания и дисперсии
- •4 Графическое представление выборки
- •4.1 Эмпирическая плотность распределения, полигон, гистограмма
- •4.2 Эмпирическая функция распределения и кумулята
- •5 Проверка гипотезы о нормальном распределении генеральной совокупности
- •6 Пример выполнения индивидуального задания
- •6.1 Задание
- •6.2 Решение
4 Графическое представление выборки
Выборку
группируют по интервалам следующим
образом. Весь диапазон значений вариант
разбивают на разумное число интервалов
одинаковой, как правило, ширины h.
Чтобы не было недоразумений при подсчете
числа вариант выборки, попавших в каждый
интервал, левый конец каждого интервала
считают закрытым, а правый - открытым,
так что интервалы имеют вид
.
Частотой i-го
интервала ni
называется
число, равное количеству вариант выборки,
попавших в этот интервал. Все значения
признака в пределах интервала
приравниваются его срединному значению,
считая, что частоты ni
относятся к середине интервала
(4.1)
Соответствующая таблица {xi, ni} называется интервальным вариационным рядом. Число интервалов (классов) k выбирается по эмпирическим правилам, одним из которых является правило Штюргеса
(4.2)
Число классов рекомендуется выбирать нечетным.
4.1 Эмпирическая плотность распределения, полигон, гистограмма
Для построения полигона относительных частот на оси абсцисс откладываются варианты хi, им соответствуют значения wi на оси ординат, строится ломаная, соединяющая указанные точки.
График эмпирической плотности распределения представляется также гистограммой. Для построения гистограммы на оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, высота которого равна wi/h.
4.2 Эмпирическая функция распределения и кумулята
Аналитическая формула для эмпирической функции распределения определяется множеством относительных накопленных частот и соотношением
(4.3)
Для построения кумуляты на оси абсцисс откладываются варианты хi, им соответствуют значения сi на оси ординат, строится ломаная, соединяющая указанные точки.
5 Проверка гипотезы о нормальном распределении генеральной совокупности
Проверка соответствия результатов измерения закону нормального распределения является важным моментом предварительной обработки данных. Можно предположить, что значение случайной величины изменяется под влиянием большого числа факторов, примерно равнозначных по силе. Поэтому можно предположить, что распределение случайной величины является нормальным. Если эта гипотеза неприемлема, то следует определить, какому закону распределения подчиняются опытные данные и, если это возможно, преобразовать данное распределение к нормальному. Только после выполнения перечисленных выше операций можно перейти к построению эмпирических формул, применяя, например, метод наименьших квадратов.
5.1 Проверка по оценке среднего линейного отклонения
Для не очень больших выборок (n < 120) проверку гипотезы нормальности распределения можно провести по среднему линейному отклонению. Для выборки, имеющей приближенно нормальный закон распределения, должно быть справедливо выражение
Некоторое представление о близости эмпирического распределения к нормальному может дать анализ показателей асимметрии и эксцесса.
Критерием нормальности распределения случайной величины является равенство нулю асимметрии и эксцесса. Если выполняются условия
5.3 Проверка по правилу трех сигм
Проверку гипотезы нормальности распределения можно провести по правилу трех сигм, согласно которому при нормальном распределении признака
5.4 Проверка по критерию согласия Пирсона (критерий 2)
Нормализуем случайную величину Х, т.е. перейдем к случайной величине:
(5.1)
Вычислим концы интервалов
,
, i = 1,…, k, (5.2)
где ɛi – границы интервалов, причем значение z1 полагаем равным -∞, а наибольшее значение zk+1 полагаем равным +∞ (k – число интервалов).
Вычислим теоретические частоты:
,
(5.3)
где n – объем выборки, Pi = Ф(zi+1) - Ф(zi), Ф(z) – функция Лапласа:
(5.4)
Вычислим наблюдаемое значение критерии Пирсона:
.
(5.5)
По таблице критических точек распределения χ2, по уровню значимости α и числу степеней свободы υ = k – 3 находим критическую точку правосторонней критической области.
(5.6)
Здесь
– квантиль распределения Пирсона на
уровне q
c
υ
степенями
свободы.
Если
– принимаем гипотезу о нормальном
распределении генеральной совокупности
Х.
