- •Гордеева ю.Л., Левченкова т.В.
- •Введение
- •1 Статистическое распределение и числовые характеристики выборки
- •1.1 Выборки и их характеристики
- •1.1.1 Выборочный метод и способы составления выборок
- •1.1.2 Статистическое распределение и его геометрическое изображение
- •Алгоритм составления дискретного статистического распределения:
- •1.1.3 Числовые характеристики вариационного ряда
- •1.2 Статистические оценки
- •1.2.1 Точечные оценки
- •1.2.2 Интервальные оценки
- •1.2.3 Доверительный интервал для оценки математического ожидания нормального распределения при известной дисперсии
- •1.2.4 Доверительный интервал для оценки математического ожидания при неизвестной дисперсии
- •1.2.5 Доверительный интервал для оценки среднего квадратического отклонения нормального распределения
- •1.3 Типовые задачи
- •Решение
- •Простая дисперсия
- •1.4 Вопросы для самопроверки
- •2 Элементы корреляционного анализа
- •2.1 Статистическая зависимость случайных величин. Уравнения регрессии
- •2.2 Корреляционная зависимость. Коэффициент корреляции
- •2.3 Типовые задачи
- •Решение
- •2.4 Вопросы для самопроверки
- •3 Варианты контрольной работы
- •Библиографический список
- •Содержание
Простая дисперсия
Взвешенная дисперсия
Получим:
Среднее квадратическое отклонение находится как квадратный корень из дисперсии. Показывает отклонение от среднего.
Среднее квадратическое отклонение простое
Среднее квадратическое отклонение взвешенное
Получим:
– среднее
квадратическое отклонение выборки,
– коэффициент
вариации.
Среднее квадратическое
отклонение показывает, что масса тушек
бройлера по данной совокупности
колеблется в пределах
кг по отношению к среднему уровню.
Коэффициент вариации показывает, что
разброс величин (масса тушек) по отношению
к среднему уровню средний.
5. Для нахождения моды, медианы и построения гистограммы, полигона, кумуляты построим интервальный ряд распределения (табл.2).
Число групп в ряду распределения определяют по формуле Стерждесса и округляют до целого числа.
где n – численность совокупности.
Длина интервала должна быть постоянной.
Количество интервалов и длина каждого интервала равны:
За
нижнюю границу первого интервала можно
принять
.
Нижняя граница каждого последующего интервала равна верхней границе предыдущего интервала.
Верхняя граница каждого интервала xв вычисляется по формуле
xв
= xн+h,где
– нижняя
граница каждого интервала
Середину интервалов определяют по формуле
В результате получим Табл.2 (выполним округление до второго знака после запятой).
Табл. 2
№ интервала |
Группа тушек по величине хi - масса |
Число тушек fi |
|
Нижняя граница Хн |
Верхняя граница Хв |
||
1 |
0,9 |
1,09 |
3 |
2 |
1,09 |
1,28 |
3 |
3 |
1,28 |
1,47 |
5 |
4 |
1,47 |
1,66 |
9 |
5 |
1,66 |
1,85 |
11 |
6 |
1,85 |
2,04 |
1 |
fi – число тушек, попавших в данный интервал.
fi* – накопленная частота. Определяется как сумма частот предыдущих интервалов и частота текущего интервала.
В результате расчетов (Табл.2) получилось 6 интервалов.
Замечание: интервал, частота которого равна нулю, объединяют с соседним интервалом, который имеет наименьшую частоту. При этом шаг полученного интервала равен сумме шагов объединенных интервалов.
В итоге получим Табл.3.
Табл. 3
№ интервала |
Группа тушек по величине хi - масса |
Число тушек fi |
Середина интервала xi* |
Накопленная частота fi* |
|
Нижняя граница Хн |
Верхняя граница Хв |
||||
1 |
0,9 |
1,09 |
3 |
0,995 |
3 |
2 |
1,09 |
1,28 |
3 |
1,185 |
6 |
3 |
1,28 |
1,47 |
5 |
1,375 |
11 |
4 |
1,47 |
1,66 |
9 |
1,565 |
20 |
5 |
1,66 |
1,85 |
11 |
1,755 |
31 |
6 |
1,85 |
2,04 |
1 |
1,945 |
32 |
6. Средние величины, описанные выше, являются обобщающими характеристиками совокупности по тому или иному признаку. Вспомогательными характеристиками являются, так называемые, структурные средние, к которым относятся мода, квартили, децили, медиана и др. Наиболее употребляемыми являются мода и медиана.
Модальный интервал – интервал с наибольшей частотой.
Мода вычисляется по формуле:
Наибольшая частота fi = 11 на интервале 1,62 – 1,8. Следовательно, модальным является интервал 1,62 – 1,8.
хМо = 1,66
hМо = 0,19
fМо = 11
fМо-1 = 9
fМо+1 = 1
Тогда, мода равна:
Медианный интервал – интервал, накопленная частота которого равна или превышает половину суммы частот.
Медиана вычисляется по формуле
Половина суммы частот равна 16 (32/2). Следовательно, медианным интервалом будет интервал 1,47 – 1,66.
хМе = 1,47
hМе =0,19
= 32
fМе−1 = 11
fМе = 9.
Тогда, медиана равна:
7. Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение.
Интервальный ряд отображается гистограммой, в которой ось ОХ – интервалы значений варьирующего признака, а ось OY – частоты.
Если имеется дискретный ряд распределения или используются середины интервалов, то такой ряд отображается в виде полигона - координаты Xi* (ось ОХ) и fi. (ось OY).
Кумулята отображает накопленные частоты, последовательное суммирование (кумуляция) частот в направлении от первого класса до конца вариационного ряда.
По данным Табл. 3 построим гистограмму, полигон и кумуляту (Рис. 6 – 8).
Рис. 6. Гистограмма распределения массы тушек
Рис. 7. Полигон распределения массы тушек
Рис. 8. Кумулята распределения массы тушек
Данные гистограммы и полигона показывают: чаще встречаются тушки бройлера с массой от 1,66 до 1,85 кг, среди них 11 штук имеют среднюю массу 1,755 кг.
Данные кумуляты показывают: количество тушек бройлера с массой до 1,09 кг – 3; с массой до 1,28 кг – 6; с массой до 1,47 кг – 11; с массой до 1,66 кг – 20; с массой до 1,85 кг – 31; с массой до 2,04 кг – 32 штуки.
Для вычисления числовых характеристик асимметрии и эксцесса (As, E) составим следующую таблицу:
|
|
|
|
|
|
|
0,9 |
3 |
-0,6 |
-0,216 |
-0,648 |
0,1296 |
0,3888 |
1,2 |
3 |
-0,3 |
-0,027 |
-0,081 |
0,0081 |
0,0243 |
1,4 |
5 |
-0,1 |
-0,001 |
-0,005 |
0,0001 |
0,0005 |
1,5 |
2 |
0 |
0 |
0 |
0 |
0 |
1,6 |
7 |
0,1 |
0,001 |
0,007 |
0,0001 |
0,0007 |
1,7 |
5 |
0,2 |
0,008 |
0,04 |
0,0016 |
0,008 |
1,8 |
6 |
0,3 |
0,027 |
0,162 |
0,0081 |
0,0486 |
2 |
1 |
0,5 |
0,125 |
0,125 |
0,0623 |
0,0625 |
|
|
|
|
|
|
|
Применим формулы для вычисления моментов распределения третьего и четвертого порядков:
Рассчитаем третью и четвертую степень среднего квадратического отклонения
Найдем коэффициент асимметрии и эксцесса:
Выводы: коэффициент асимметрии отрицательный, следовательно, имеем левостороннюю асимметрию распределения полигона.
Коэффициент эксцесса отрицательный, следовательно, имеем плосковершинное распределение.
