Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб_раб_2_-_Гистограмма_и_хар-ки_положения_-_по...doc
Скачиваний:
10
Добавлен:
17.08.2019
Размер:
528.9 Кб
Скачать

Лабораторная работа № 2

Тема «Наглядные методы представления выборок (гистограмма) и характеристики положения случайной величины»

Теория:

Чаще всего для наглядного описания исходных данных используются гистограммы.

Для построения гистограммы определяются:  1) размах варьирования R= xmax - xmin;  2) число интервалов группировки K (иногда используется эмпирическая формула Стэрджеса K= 1+ 3.32lg n с округлением до ближайшего целого);  3) длина интервалов группировки l= R/K;  4) частоты  , т.е. число элементов вариационного ряда, попавших в интервалы [xi-1 ,xi ], здесь i=1,...,K, x0= xmin , xi= xi-1+l, xkxmax ;  5) относительные частоты (Relative Frequency)   /n.

Гистограммой называется графическое изображение зависимости частот   (или относительных частот   /n) попадания элементов выборки от соответствующего интервала группировки в виде ступенчатой функции.

Практика:

Лабораторная работа выполняется средствами программы MS Excel.

Для построения гистограммы и вычисления характеристик положения случайной величины воспользуемся полученной статистической совокупностью в Лабораторной работе №1.

  1. Открыть диск С – Program Files - Statgr_win_2.1 - SGWIN.EXE

  2. Щелкнуть на названии колонки "X1 (элемент списка)" левой кнопкой мыши для выделения всего столбца, снова щелкнуть на названии колонки "X1 (элемент списка)" правой клавишей мыши и выбрать из раскрывшегося меню “Copy”.

  3. Открыть Menu – Microsoft Office – Microsoft Excel.

  4. Встать в первую ячейку в Лист 1 и вставить копируемый столбец "X1".

  5. Отсортировать полученные данные по увеличению. (Панель меню – Данные-Сортировка по возрастанию)

Далее рассматривается упрощенная задача в качестве примера выполнения лабораторной работы №2.

При обследовании роста среди 25 студентов получена следующая статистическая совокупность.

i

Хi

1

153,43

2

153,45

3

153,67

4

154

5

154,6

6

155,3

7

156

8

156,4

9

157

10

158,4

11

160

12

161,2

13

161,56

14

162

15

170

16

171,6

17

173

18

173

19

174

20

180

21

185

22

190

23

191

24

199

25

200

Итого

4203,61

Где xi - реализации случайной величины Х (рост студента)

i – номер эксперимента

n- объем выборки

  1. Построим гистограмму для данной статистической совокупности.

Для этого определим границы интервалов по формуле Стерджесса

Где n-объем выборки (число элементов выборки); lgn-десятичный логарифм числа n

Количество интервалов: K = 1 + (3,2× lgn) , полученную величину округляем до целого в большую сторону

Для рассматриваемого примера получаем K = 5,473408 и отбрасываем дробную часть, то есть получаем 5 интервалов.

Величина интервала (шаг), с помощью которого можно определить границы интервалов:  l = (200-153,43)/5= 9,314

Тогда получаем следующие интервалы

1 = от 153,43 до 162,744

2 = от 162,744 до 172,058

3 = от 172,058 до 181,372

4 = от 181,372 до 190,686

5 = от 190,686 до 200

Создаем гистограмму с помощью надстройки MS Excel «Анализ данных» (Данные – Анализ данных).

Справка: Чтобы установить Пакет анализа требуется выполнить следующие действия: Сервис – Надстройки – Analisys Tool Pak. Далее снова зайти Сервис – Data Analys – Гистограмма.

Задаем Входной интервал = весь статистический ряд

Интервалы карманов = 162,744; 172,058; 181,372; 190,686; 200

При этом указываем интервалы, начиная с первого числа, а не с названия столбцов. В этом случае не требуется ставить галочку в «Метки». Далее указываем место, где будет размещена гистограмма, для удобства - на том же листе. И ставим галку на «Вывод графика».

Получаем статистический ряд распределения случайной величины Хi.

Xi

Частота

162,744

14

172,058

2

181,372

4

190,686

2

200

3

Еще

0

25

  1. Характеристики положения случайной величины

    1. Найдем среднее значение (матожидание) этого ряда .

Для этого найдем сумму всего статистического ряда и разделим на объем выборки (25 экспериментов).

Так же это значение можно найти в MS Excel с помощью вызова мастера уравнения: «Статистические» - «СРЗНАЧ».

    1. Вычислим Моду случайной величины

Модой случайной величины является частота, имеющая максимальное значение. Смотря на гистограмму, мы можем сделать вывод о том, что находится в интервале от 153,43 до 162,744. В какой именно точке сказать нельзя, это будет некорректно.

В MS Excel Мода вычисляется по другой формуле и по ней она ищет наиболее часто повторяющееся значение случайной величины, для прикладной статистике мы пользуемся другим определением Моды и соответственно делаем вычисление, указанное выше.

Справка: Мода часто используется при определении размеров одежды и обуви, которые пользуются широким покупательским спросом. Она выявляет наиболее часто встречающийся тип покупателя.