- •Министерство культуры российской федерации
- •«Санкт-петербургский государственный университет кино и телевидения»
- •Введение
- •Исходные данные
- •Вычисление основных выборочных характеристик.
- •Ранжирование выборочных данных и вычисление моды и медианы.
- •Вычисление интервальных оценок для математического ожидания и дисперсии.
- •Параметрическая оценка функции плотности распределения.
- •Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона.
- •Список литературы
Вычисление основных выборочных характеристик.
Первоначальная обработка выборки:
(объем
выборки)
(средняя
арифметическая величина)
(центральный
момент по модулю)
(центральный
момент второго порядка)
(центральный
момент третьего порядка)
(центральный
момент четвертого порядка)
На основе полученных результатов рассчитываем основные выборочные характеристики по выборке заданной в таблице 1.
1.Среднее арифметическое случайной величины X (обобщающая величина признака по совокупности в целом):
2.Среднее линейное отклонение (обобщающая характеристика степени колебания признаков совокупности):
3.Дисперсия случайной величины X (средний квадрат отклонений индивидуальных значений признака от их средней величины - разброс):
4.Несмещенная оценка дисперсии:
5.Среднее квадратическое отклонение (характеризует разброс индивидуальных значений признака от их средней величины):
6.Несмещенная выборочная оценка для среднего квадратического отклонения:
7.Коэффициент вариации (мера относительной изменчивости наблюдаемой случайной величины Х):
%
8.Выборочный коэффициент асимметрии случайной величины Х (служит для характеристики асимметрии распределения случайной величины):
Асимметрия положительна т. к. «длинная часть» кривой распределения расположена справа от математического ожидания
9.Коэффициент эксцесса случайной величины Х (выборочный эксцесс):
Кривая этого распределения отличается от нормальной кривой. Эксцесс отрицательный – кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая.
10. Вариационный размах:
По результатам вычислений основных выборочных характеристик можно сделать предварительные выводы о нормальности распределения заданной выборки:
Для нормального распределения случайной величины Х должно выполнятся условие V<33%. Это условие для заданной выборки выполняется, т.к. V=
%.<33%.
Коэффициент вариации V
можно применять для анализа распределения,
поскольку все выборочные значения
случайной величины положительны.Выборочный коэффициент асимметрии и выборочный эксцесс нельзя считать близкими по значению к нулю, поэтому кривая распределения отличается от нормальной кривой. Чтобы определить степень близости распределения выборки к нормальному распределению, необходимо провести дополнительные исследования.
Ранжирование выборочных данных и вычисление моды и медианы.
Проранжируем
исходный ряд статистических данных,
т.е. расположим выборочные данные
в порядке возрастания. В ранжированном
вариационном ряду все элементы выборки
упорядочены в виде неубывающей
последовательности значений случайной
величины Х.
Ранжированный ряд необходим для построения интервального вариационного ряда, поскольку объем выборки достаточно велик.(таблица 1.)
Интервал [4,03; 8,29] содержит все элементы заданной выборки. Разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов. По формуле Стерджеса длина частичного интерваларавна:
где,
и
- соответственно максимальное и
минимальное значения выборки.
k
=
– число интервалов, которое округляется
до ближайшего целого числа.
Округляем до h=0,6 и вычисляем последовательно границы частичных интервалов. За начало первого интервала принимаем значение:
Далее вычисляем границы интервалов (начало второго интервала совпадает с концом первого и т.д.):
Заканчиваем
вычисление границ, как только выполниться
неравенство
Далее
определяем частоты – количество ni
элементов выборки, попавших в i-й
энтервал (ni
равно числу членов вариационного ряда,
для которых справедливо неравенство
xi-1
xi*
<xi,
где xi-1,
xi
–
границы i-го
интервала; xi*
- значения вариационного ряда).
По результатам вычислений составляем таблицу частот группированной выборки (таблица 2). В первой строке таблицы определим частичные интервалы, во второй строке – середины интервалов, в третьей строке запишем количество элементов выборки, попавших в каждый интервал – частоты; в четвертой – относительные частоты и в пятой – значения плотности относительных частот (значения выборочной, эксперементальной функции плотности)
Таблица 2.
Значения выборочной плотности распределения
h |
[3,73;4,33) |
[4,33;4,93) |
[4,93;5,53) |
[5,53;6,13) |
[6,13;6,73) |
[6,73;7,33) |
[7,33;7,93) |
[7,93;8,53) |
|
4.03 |
4.36 |
5.23 |
5.83 |
6.43 |
7.03 |
7.63 |
8.23 |
|
1 |
6 |
13 |
10 |
17 |
8 |
3 |
2 |
|
0.017 |
0.100 |
0.217 |
0.167 |
0.283 |
0.133 |
0.050 |
0.033 |
|
0.028 |
0.167 |
0.361 |
0.278 |
0.472 |
0.222 |
0.083 |
0.056 |
Посчитаем относительное количество наблюдений попавших в данный интервал, а также плотность распределения относительных частот , если длина h промежутков достаточно мала и объем выборки N велик (как в данном случае), то с вероятностью, близкой к единице, можно утверждать, что
Иными
словами функция
является статистическим аналогом
плотности распределения наблюдаемой
в эксперименте случайной величины Х.
плотность распределения относительных
частот служит одной из основных
характеристик интервального вариационного
ряда.
Для
наглядного представления о закономерностях
изменения вариационного ряда построим
график «гистограмма и полигон относительных
частот». Для этого выбеем систему
координат и по оси абсцисс отложим
частичные интервалы [Xi-1,
Xi)
и середины этих интервалов
,
а по оси ординат – относительные частоты
и плотность относительных частот.
Анализируя
вычисления в таблице 2, можно сделать
вывод, что мода (наиболее часто
встречающееся значение) экспериментального
распределения имеет одно значение –
локальный максимум в окрестности точки
с частотой n=17.
Используя вариационный ряд, находим оценку медианы (значение признака, который делит ряд пополам) по формуле:
Сравним
оценки медианы
и математического ожидания Х=6,35. Сравнение
показывает, что они отличаются на 1,23%
