Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторные работы 6-8.doc
Скачиваний:
3
Добавлен:
01.05.2019
Размер:
874.5 Кб
Скачать

Двойная группировка данных.

Здесь будет описан другой надежный способ группировки данных, отличный от того, который был использован в предыдущих лабораторных работах.

Находим для каждой переменной максимальные и минимальные значения и вычисляем ориентировочно величину шага группировки на 10 интервалов (обозначим ориентировочные значения hhx и hhy). Принимаем значения шага ближайшее к ориентировочному, но допускаемому по ГОСТ (ДСТУ). Принимаем также значения начала первого интервала (они должны быть меньше минимальных значений и кратны принятому шагу или полушагу). Принятые значения, как и раньше, выделяем красным цветом.

n =

44

n =

44

Xmax =

1,329

Ymax =

132

Xmin =

0,495

Ymin =

52

hhx =

0,083

hhy =

8

hx =

0,1

hy =

10

х0 =

0,4

у0 =

50

p =

10

q =

9

xp =

1,4

yq =

140

Определяем количества интервалов группировки (p, q) по каждой переменной и значения правых границ последних интервалов:

р = ОКРУГЛВВЕРХ((Xmax – х0) / hx; 0),

q = ОКРУГЛВВЕРХ((Ymax – y0) / hy; 0),

xp = x0 + p*hx, yp = y0 + p*hy.

Теперь для каждого наблюдения вычисляем номера групп:

№Х = ОКРУГЛВВЕРХ((x – х0) / hx; 0),

№У = ОКРУГЛВВЕРХ((y – y0) / hy; 0).

В последней колонке таблицы для каждого наблюдения вычислен Шифр = 100*№Х + №У, объединяющий в краткой записи номера групп по Х и по У.

Функцией СЧЁТЕСЛИ подсчитываем количества одинаковых шифров и записываем найденные частоты mij в таблицу размером p q.

Корреляционное поле

i =>

1

2

3

4

5

6

7

8

9

10

j

Y X

0,45

0,55

0,65

0,75

0,85

0,95

1,05

1,15

1,25

1,35

l

9

135

1

0

0

0

0

0

0

0

0

0

1

8

125

0

0

0

0

0

0

0

0

0

0

0

7

115

1

1

0

0

0

0

0

0

0

0

2

6

105

0

0

0

0

0

0

0

0

0

0

0

5

95

0

1

2

4

0

0

0

0

0

1

8

4

85

0

0

1

1

0

0

0

0

0

0

2

3

75

0

0

0

2

5

0

0

0

0

0

7

2

65

0

0

0

0

1

10

8

0

0

0

19

1

55

0

0

0

0

0

1

1

3

0

0

5

k

2

2

3

7

6

11

9

3

0

1

44

В верхней строке таблицы записываем номера групп по переменной Х (индексы i). В левом столбце таблицы записываем номера групп по переменной У (индексы j ), причем для визуального сходства с графиком разброса индексы j записываем в полядке убывания (т.к. ось У направлена вверх). Для каждого индекса можно сгенерировать значения центров интервалов (вторая строка, второй столбец таблицы). Частоты вычисляются формулой mij = СЧЁТЕСЛИ(Шифры; 100*Индекс_i + Индекс_j), которая набирается для одной ячейки таблицы и копируется в остальные. При копировании не должны изменяться ссылки на диапазон Шифров, ссылки на строку Индекс_i и ссылки на столбец Индекс_j (при наборе в формуле адресов этих операндов клавишей F4 делается абсолютными ссылками или на весь адрес, или только на адрес строки, или только на адрес столбца). Центральная часть таблицы частот mij иногда называется "Корреляционное поле".

С помощью условного форматирования можно нулевые частоты вывести серыми символами, чтобы они не отвлекали внимания. На корреляционном поле ясно виден выброс, который мы уже обнаружили ранее на графике разброса.

n =

43

n =

43

Xmax =

1,182

Ymax =

132

Xmin =

0,495

Ymin =

52

hhx =

0,069

hhy =

8

hx =

0,1

hy =

10

х0 =

0,45

у0 =

50

p =

8

q =

9

xp =

1,25

yq =

140

Выбросы должны быть удалены, после чего автоматически перевычисляются число наблюде­ний, минимальные и максимальные значения, число интервалов и правые границы последних интервалов. Иногда после этой операции приходится задавать другое значения шага группировки или другое начало отсчета. Заменяем начало отсчета на х0 = 0,45.

В нашем примере из таблицы удаляются два последних столбца (с индексами i = 9, 10), размер таблицы сокращается до 9  8.

i =>

1

2

3

4

5

6

7

8

  j  

Y X

0,5

0,6

0,7

0,8

0,9

1

1,1

1,2

l

mX

V

9

135

1

0

0

0

0

0

0

0

  1  

0,5

0,500

8

125

0

0

0

0

0

0

0

0

0

0

7

115

1

1

0

0

0

0

0

0

2

1,1

0,550

6

105

0

0

0

0

0

0

0

0

0

0

5

95

0

3

4

0

0

0

0

0

7

4,6

0,657

4

85

0

1

1

0

0

0

0

0

2

1,3

0,650

3

75

0

0

2

5

0

0

0

0

7

5,4

0,771

2

65

0

0

0

1

3

8

7

0

19

19,2

1,011

1

55

0

0

0

0

0

2

1

2

5

5,5

1,100

k

2

5

7

6

3

10

8

2

43

mY

250

485

615

440

195

630

510

110

U

125,00

97,00

87,86

73,33

65,00

63,00

63,75

55,00

Подсчитываем суммы частот по столбцам и строкам таблицы: ; . Делается это так – выделяем диапазон частот вместе с дополнительной сторокой снизу и дополнительным столбцом справа; далее на панели инструментов нажимаем мышкой нажимаем кнопку  . При этом в дополнительные ряды записываются формулы суммирования, а не числа.

В последних двух строках таблицы вычислены средние интервальные значения для каждого интервала по Х. Аналогично, в последних двух строках таблицы вычислены средние интервальные значения для каждого интервала по Y.

Суммы mY и mX еще понадобятся в дальнейшем.