- •Для построения гистограммы и вычисления характеристик положения случайной величины воспользуемся полученной статистической совокупностью в Лабораторной работе №1.
- •Вычислим Медиану случайной величины
- •Рассчитаем Ассиметрию (скошенность) или 3-й статистический центральный момент с помощью следующей формулы:
- •Рассчитаем Эксцесс (крутость) или 4-й статистический центральный момент с помощью следующей формулы:
Лабораторная работа № 2
Тема «Наглядные методы представления выборок (гистограмма) и характеристики положения случайной величины»
Теория:
Чаще всего для наглядного описания исходных данных используются гистограммы.
Для построения гистограммы определяются: 1) размах варьирования R= xmax - xmin; 2) число интервалов группировки K (иногда используется эмпирическая формула Стэрджеса K= 1+ 3.32lg n с округлением до ближайшего целого); 3) длина интервалов группировки l= R/K; 4) частоты , т.е. число элементов вариационного ряда, попавших в интервалы [xi-1 ,xi ], здесь i=1,...,K, x0= xmin , xi= xi-1+l, xkxmax ; 5) относительные частоты (Relative Frequency) /n.
Гистограммой называется графическое изображение зависимости частот (или относительных частот /n) попадания элементов выборки от соответствующего интервала группировки в виде ступенчатой функции.
Практика:
Лабораторная работа выполняется средствами программы MS Excel.
Для построения гистограммы и вычисления характеристик положения случайной величины воспользуемся полученной статистической совокупностью в Лабораторной работе №1.
Открыть диск С – Program Files - Statgr_win_2.1 - SGWIN.EXE
Щелкнуть на названии колонки "X1 (элемент списка)" левой кнопкой мыши для выделения всего столбца, снова щелкнуть на названии колонки "X1 (элемент списка)" правой клавишей мыши и выбрать из раскрывшегося меню “Copy”.
Открыть Menu – Microsoft Office – Microsoft Excel.
Встать в первую ячейку в Лист 1 и вставить копируемый столбец "X1".
Отсортировать полученные данные по увеличению. (Панель меню – Данные-Сортировка по возрастанию)
Далее рассматривается упрощенная задача в качестве примера выполнения лабораторной работы №2.
При обследовании роста среди 25 студентов получена следующая статистическая совокупность.
i |
Хi |
1 |
153,43 |
2 |
153,45 |
3 |
153,67 |
4 |
154 |
5 |
154,6 |
6 |
155,3 |
7 |
156 |
8 |
156,4 |
9 |
157 |
10 |
158,4 |
11 |
160 |
12 |
161,2 |
13 |
161,56 |
14 |
162 |
15 |
170 |
16 |
171,6 |
17 |
173 |
18 |
173 |
19 |
174 |
20 |
180 |
21 |
185 |
22 |
190 |
23 |
191 |
24 |
199 |
25 |
200 |
Итого |
4203,61 |
Где xi - реализации случайной величины Х (рост студента)
i – номер эксперимента
n- объем выборки
Построим гистограмму для данной статистической совокупности.
Для этого определим границы интервалов по формуле Стерджесса
Где n-объем выборки (число элементов выборки); lgn-десятичный логарифм числа n
Количество интервалов: K = 1 + (3,2× lgn) , полученную величину округляем до целого в большую сторону
Для рассматриваемого примера получаем K = 5,473408 и отбрасываем дробную часть, то есть получаем 5 интервалов.
Величина интервала (шаг), с помощью которого можно определить границы интервалов: l = (200-153,43)/5= 9,314
Тогда получаем следующие интервалы
1 = от 153,43 до 162,744
2 = от 162,744 до 172,058
3 = от 172,058 до 181,372
4 = от 181,372 до 190,686
5 = от 190,686 до 200
Создаем гистограмму с помощью надстройки MS Excel «Анализ данных» (Данные – Анализ данных).
Справка: Чтобы установить Пакет анализа требуется выполнить следующие действия: Сервис – Надстройки – Analisys Tool Pak. Далее снова зайти Сервис – Data Analys – Гистограмма.
Задаем Входной интервал = весь статистический ряд
Интервалы карманов = 162,744; 172,058; 181,372; 190,686; 200
При этом указываем интервалы, начиная с первого числа, а не с названия столбцов. В этом случае не требуется ставить галочку в «Метки». Далее указываем место, где будет размещена гистограмма, для удобства - на том же листе. И ставим галку на «Вывод графика».
Получаем статистический ряд распределения случайной величины Хi.
Xi |
Частота |
162,744 |
14 |
172,058 |
2 |
181,372 |
4 |
190,686 |
2 |
200 |
3 |
Еще |
0 |
|
25 |
Характеристики положения случайной величины
Найдем среднее значение (матожидание) этого ряда .
Для этого найдем сумму всего статистического ряда и разделим на объем выборки (25 экспериментов).
Так же это значение можно найти в MS Excel с помощью вызова мастера уравнения: «Статистические» - «СРЗНАЧ».
Вычислим Моду случайной величины
Модой случайной величины является частота, имеющая максимальное значение. Смотря на гистограмму, мы можем сделать вывод о том, что находится в интервале от 153,43 до 162,744. В какой именно точке сказать нельзя, это будет некорректно.
В MS Excel Мода вычисляется по другой формуле и по ней она ищет наиболее часто повторяющееся значение случайной величины, для прикладной статистике мы пользуемся другим определением Моды и соответственно делаем вычисление, указанное выше.
Справка: Мода часто используется при определении размеров одежды и обуви, которые пользуются широким покупательским спросом. Она выявляет наиболее часто встречающийся тип покупателя.