Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ватник!.doc
Скачиваний:
10
Добавлен:
07.12.2018
Размер:
1.44 Mб
Скачать

§ 3. Эмпирическая регрессия

Методы анализа взаимосвязи, вытекающие из определения статистической зависимости и изложенные в предыдущем параграфе, универсальны в том смысле, что могут быть применены к исследованию зависимостей между признаками любой природы, количественными и атрибутивными. В общих чертах эти методы сводятся к сопоставлению распределений по результирующему признаку y групп, однородных по признаку-фактору x. Но при исследовании распределений по количественному признаку разработан широкий арсенал численных характеристик распределений — средние, показатели вариации, показатели формы распределения. Поэтому в тех случаях, когда результирующий признак является количественным, применение этих показателей делает анализ зависимости более гибким и богатым результатами.

Одной из важнейших характеристик распределения по количественному признаку является среднее значение признака. Поэтому весьма важные выводы о взаимозависимости между признаками можно сделать, сопоставляя средние значения результативного признака в группах, соответствующих определенным значениям признака-фактора.

Так как одинаковым распределениям должны соответствовать одинаковые средние значения, то различие групповых средних позволяет утверждать, что признаки взаимозависимы. Ход изменения средних при переходе от одной группы к другой показывает характер зависимости.

Если при этом группы оказываются достаточно многочисленными, то групповые средние оказываются статистически устойчивыми величинами; действие посторонних, не принятых во внимание причин при этом в значительной мере погашается, и групповые средние показывают «очищенное» влияние рассматриваемого признака-фактора.

Применение описанной методики иллюстрируется следующим примером.

Таблица 3.1. Данные о длительности сборки

Номер

узла

Число деталей

Длительность сборки, мин.

Номер узла

Число

деталей

Длительность сборки, мин.

1

4

11.4

11

6

14.0

2

5

14.5

12

4

12.6

3

7

22.1

13

4

11.4

4

3

9.6

14

6

19.1

5

3

14.9

15

5

12.3

6

5

13.2

16

5

13.3

7

7

20.6

17

5

15.5

8

5

13.0

18

3

10.9

9

4

11.8

19

6

17.9

10

4

14.6

20

5

14.1

Пример. Требуется исследовать зависимость длительности сборки узла (y) от числа деталей, входящих в узел (x). Исходные данные приведены в таблице 3.1.

Для того чтобы проанализировать связь длительности сборки со сложностью узлов, т.е. с числом деталей, входящих в узел, необходимо произвести группировку по этому признаку. В рассмотренной совокупности встречаются узлы с числом деталей, равным 3, 4, 5, 6, и 7. Таким образом, совокупность разбивается на 5 групп, однородных по числу деталей в узле. По каждой группе вычисляются средние арифметические значения длительности сборки. Результаты приведены в таблице 3.2.

Таблица 3.2. Группировка узлов по числу деталей

Число

деталей

в узле (x)

Число узлов

Длительность

сборки (y),

мин.

Средняя по группе

длительность сборки (), мин.

3

3

9.6; 14.9; 10.9;

11.8

4

5

11.4; 11.8; 14.6; 12.6; 11.4

12.4

5

7

14.5; 13.2; 13.0; 12.3; 13.3; 15.5; 14.1

13.7

6

3

14.0; 19.1; 17.9

17.0

7

2

22.1; 20.6

21.4

Всего

20

Различие групповых средних показывает, что признаки являются взаимозависящими; ряд значений x и относящихся к ним групповых средних показывает характер этой зависимости, т.е. выражает в табличной форме эмпирическую функцию регрессии (или, короче, эмпирическую регрессию) длительности сборки по числу деталей в узле. Если на корреляционном поле (рис. 3.1) отметить групповые средние и соединить их прямолинейными отрезками, полученная ломаная линия будет графически представлять ту же функцию. Эта линия носит название эмпирической линии регрессии.

Следует заметить, что функция регрессии не дает значений результативного признака, соответствующих отдельным значениям фактора у каждого элемента: рассматриваемая зависимость вообще не является функциональной и никакой функцией не может быть описана точно. Регрессия отражает при этом главную тенденцию рассматриваемой зависимости.

Рис. 3.1

Если число наблюдений велико, вычисление групповых средних может быть выполнено с помощью корреляционной таблицы, которую строят по результатам комбинационной группировки. Соответствующие данные приведены в таблице 3.3.

Таблица 3.3. Расчет эмпирической регрессии.

Число деталей в узле

Длительность сборки, мин.

Средняя по группе длительность сборки (), мин.

9.7 –12.1

12.2 –14.6

14.7 –17.1

17.2 –19.6

19.7 –22.1

Всего

3

2

1

3

12.6

4

3

1

1

5

12.1

5

6

1

7

13.8

6

1

2

3

16.7

7

2

2

20.9

Если признак непрерывен и его значения представлены в виде интервального ряда, а число наблюдений в каждой группе невелико, вычисленные по корреляционной таблице значения средних могут содержать значительные ошибки, обусловленные группированием. Поэтому для рассмотренного выше примера более целесообразной является форма расчета, приведенная в таблице 3.2.

В рассмотренном примере значения признака-фактора были представлены в виде дискретного ряда; если признак-фактор непрерывен, группировка может быть выполнена путем разбиения множества значений этого признака на интервалы; в остальном анализ остается тем же.