Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс лекций по Математической статистике.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
966.66 Кб
Скачать

2.3. Интервальный ряд и гистограмма

При обработке большого числа экспериментальных данных их предварительно группируют и оформляют в виде так называемого интервального ряда.

Пример. Рассмотрим среднюю месячную зарплату 50 случайно отобранных работников предприятия:

317

304

230

285

290

320

262

274

205

180

234

221

241

270

257

290

258

296

301

150

160

210

235

308

240

370

180

244

365

130

170

250

370

267

288

231

253

315

201

256

279

285

226

367

247

252

320

160

215

350

Величина Х здесь – средняя месячная зарплата. Наименьшее её значение – 130, наибольшее – 370. Диапазон составляет 130 - 370, его длина(размах) 370 – 130 = 240.

Разобьем диапазон на части (разряды) так, чтобы каждый разряд содержал несколько экспериментальных данных. Например, на 6 равных частей: 240 : 6 = 40 – длина одного разряда. Границы: 130, 170, 210, 250, 290, 330, 270.

Замечание. В статистике же, для определения количества частей диапазона (интервалов) используется формула Стреджесса: I=1+3,322⋅log2N, где N — это количество значений диапазона (размер выборки).

Подсчитаем число значений в каждом разряде, например, разряд 130 - 170: 130, 170, 150,160,160; поскольку значение 170 попадает на границу 1 – го и 2 – го разрядов, включим его и в 1 – й, и во 2 – й разряды, но с с кратностью ½. Сложим кратности, получим абсолютную частоту 1 – го разряда:

m1 = 1 + ½ + 1+2 = 4 ½ .

Относительная частота попадания Х в 1 – й разряд равна:

И т.д. Результаты можем свести в таблицу:

Таблица 6

130 - 170

170 - 210

210 - 250

250 - 290

290 - 330

330 – 370

4,5

5

12

14,5

9

5

0,09

0,1

0,24

0,29

0,18

0,1

Таблица 6 называется интервальным рядом. Для проверки правильности вычислений используется свойство:

,

а также свойство

.

Графически интервальный ряд изображается в виде гистограммы, которая строится так. Сначала вычисляют плотности частот делением относительной частоты каждого разряда на его длину:

, где ∆Х = 40;

; ; ; ; .

Затем выбирают на плоскости систему координат и откладывают на оси Х границы разрядов: 130, 170, 210, … На каждом участке оси Х из отрезков длины 40, как на основании, строят прямоугольник высотой .

В каждом прямоугольнике площадь равна .

Отсюда правило: чтобы найти долю тех значений Х, которые попадают в некоторый интервал, надо найти площадь той части гистограммы, основанием которой является данный интервал.

Найдем долю значений средних месячных зарплат работников данного предприятия, которые попадают в интервал 210 – 300:

, или 57,5%.

В случае интервального ряда отдельные значения Х не фиксируются, а подсчитываются только абсолютные частоты каждого разряда. Поэтому нельзя использовать формулы (1), (5) и (7) для вычисления , D и S. Однако можно найти приближенные значения этих величин. Для этого находят середины разрядов ; затем вычисляют величины , D и S по следующим формулам:

(8)

(9)

(10)

Результаты расчетов могут быть сведены в таблицу:

Таблица 7.

i

1

150

13,5

- 106,8

11406,24

1026,56

2

190

19,0

- 66,8

4462,24

446,22

3

230

55,2

- 26,8

718,24

172,38

4

270

78,3

13,2

174,24

90,53

5

310

55,8

53,2

2830,24

509,44

6

350

35,0

93,2

8686,24

868,62

256,8

3113,75

и т.д.

D = 3113,75;

S = .

Интервальный ряд, гистограмма и числовые характеристики, найденные по формулам (8) – (10), составляют математическую модель средней заработной платы на данном предприятии. Она используется при проведении различных социологических исследований, например, при определении уровня жизни работников какой – либо отрасли.

Часто для анализа строится еще и график. В этом случае находятся средние значения по каждому интервалу (суммируются границы интервала и полученная сумма делится на 2). Для графика используются полученные средние значения (по оси абсцисс Х) и частоты mi или доли pi (по оси ординат У).