Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Work1-2.doc
Скачиваний:
3
Добавлен:
04.12.2018
Размер:
1.99 Mб
Скачать

Определение коэффициента корреляции по выборка большого объема

ОБЪЕМ ВЫБОРКИ N > 50

Выборкой большого объема будем считать выборку, в которой несколько значении переменных встречаются по 2 и более раза.

Пример. Определим коэффициент корреляции между случайными величинами размеров двух деталей, обрабатываемых одновременно на одном станке. После обработки, каждой пары деталей производятся измерения, результаты которых заносятся в протокол (см. табл. 15).

Таблица 15

Номер

опыта (№)

1

2

3

4

5

6

7

...

100

Деталь

Х

21,867

21,845

21,871

21,878

21,847

21,867

21,867

...

21,867

Деталь

Y

21,852

21,843

21,864

21,871

21,838

21,852

21,853

...

21,854

В каждом ряду отыскиваются минимальные и максимальные значения (21,845 мм - 21,878 мм, 21,838 мм -21,871 мм). Если разность между этими значениями велика, то все значения целесообразно разбить на группы. В нашем примере 21,878-21,845=0,033мм и 21,871-21,838=0,033 мм. Объединим все значения в группы с шириной интервала h = 0,002 мм. Затем строим корреляционную таблицу (см. табл. 16), в которой приводятся интервалы, середины интервалов и и значения новых случайных величин и , которые получаются по следующим формулам

; , где -величины интервалов.

За и обычно принимают среднее значение середин интервалов. Примем ; . В рассматриваемом примере . Переход к новым случайным величинам целесообразно делать в тех случаях, когда середины интервалов ; имеют двухзначные и более значения.

Для заполнения корреляционной таблицы пользуемся протоколом измерения деталей (табл. 15). Берем первый результат измерения 21,867-21,852. Ищем в табл. 16 по горизонтали интервал, содержащий число 21,867, а по вертикали-22,852. На пересечении этих координат ставим точку (обведена кружочком). Затем берем второй результат измерений 21,845-21,843, ищем интервал, содержащий эти значения, и на пересечении координат ставим точку (также обведена кружочком). Так поступаем со всеми парами замеров деталей.

В результате заполнения корреляционной таблицы получаем частоты встречаемости () всех различных пар значений . Затем приступаем к определению эмпирического значения коэффициента корреляции, обозначаемого через по формуле (d)

, (d)

где n-число опытов;

-частота совместного наступления событий Х и У.

Последовательность вычисления r приведена в строках 1-5 и колонках 1-3 табл. 16.

Значения находятся как суммы частот по всем колонкам и строкам.

Находим , как сумму значений 1-й строки () и 1-й колонки (). Равенство и служит контролем правильности вычисления и .

Все значения умножаем на и записываем во 2-й строке. Суммируя все значения этой строки, получаем .

Все значения умножаем на записываем по 2-й колонке. Суммируя все значения этой колонки, определяем .

Находим произведения значений строки 1 на и заполняем 3-ю строку. Суммируя значения этой строки, получим, что .

Корреляционная таблица

Таблица 16

х'i

-8

-7

-6

-5

-4

-3

-2

-1

0

1

2

3

4

5

6

7

8

Середина интервалов

хi

21,8385

8405

8425

8445

8465

8485

8505

8525

8545

8565

8585

8605

8625

8645

8665

8685

8705

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

y'i

Середина

интервалов

уi

y \ x

21,838-21,839

840 841

842 843

844 845

846 847

848 849

850 851

852 853

854 855

856 857

858 859

860 861

862 863

864 865

866 867

868 869

870 871

 

 

 ny'

 ny' y' 

 ny' (y')2 

-8

 

21,

8455

21,845-21,846

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

-16

128

-7

 

 

8475

847 848

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

-7

49

-6

 

 

8495

849 850

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

-6

36

-5

 

 

8515

851 852

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

-5

25

-4

 

 

8535

853 854

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

-20

80

-3

 

 

8555

855 856

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

-15

45

-2

 

 

8575

857 858

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

-8

16

-1

 

 

8595

859 860

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

-8

8

0

 

 

8615

861 862

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

0

0

1

 

 

8635

863 864

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

3

3

2

 

 

8655

865 866

 

 

 

 

 

 

 

 

 

 

 

 

20

40

80

3

 

 

8675

867 868

 

 

 

 

 

 

 

 

 

 

 

 

22

66

198

4

 

 

8695

869 870

 

 

 

 

 

 

 

 

 

 

 

 

 

13

52

208

5

 

 

8715

871 872

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

40

200

6

 

 

8735

873 874

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

8755

875 876

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

8775

877 878

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

8

64

Σy ny

Σy ny y

Σy ny (y)2

1

nx’

1

2

1

1

8

2

14

11

7

9

13

17

12

 

1

1

100

2

nx’ x’

-8

-12

-5

-4

-24

-4

-14

0

7

18

39

68

60

 

7

8

136

3

nx’ (x’)2

64

12

25

16

72

8

14

0

7

36

117

272

300

 

49

64

1116

4

Σnx’y’ y’

-7

-16

-6

-4

-20

-2

-8

17

6

18

31

57

45

 

5

8

124

5

Σnx’y’ y’x’

56

96

30

16

60

4

8

0

6

36

93

228

225

 

35

64

957

100

124

1140

Вычисляем произведения значений колонки 1 на и заполняем 3-ю колонку. Суммируя значения этой колонки, найдем, что .

Определяем произведения значений на соответствующие значения , суммируем эти произведения и заполняем строку 4.

Например: 1(-7)-7; 2(-8)  -16; 1(-6) = -6; 1 (-4)  -4;

1(5) + 3(-4) + 1(-3 ) + 2(- 1) 12 =- 5- 12- 3- 2 +2- -20 и т. д.

Суммируя все значения этой строки, определяем . Контролем правильности предыдущих вычислений служит равенство сумм значений 4-й строки и2-й колонки, т. е.

.

Значения 4-й строки умножаем на и заполняем строку 5. Сумма значений этой строки равна

.

Вычисленные значения сумм подставляем в формулу (d) и определяем эмпирическое значение коэффициента корреляции

После того, как определен коэффициент корреляции , необходимо оценить существенно ли отличие полученного значения от 0.

Для решения этой задачи можно воспользоваться способом Фишера [*].

Случайная величина , подчинена нормальному закону со средним квадратическим отклонением . Значения Z для различных r приведены в приложении 4.

В рассматриваемом примере:

. По приложению 4 находим, что для r = 0,82; Z = 1,1568.

Определяем

По найденному значению t по приложению 5 находим Ф(t). Вероятность того, что отклонение от 0 случайно равно . В примере для . Поэтому

За уровень значимости обычно принимают 0,05 или 0,01, Если , то значение можно считать полученным случайно, а исследуемые случайные величины некоррелятивными.

Так как коэффициент корреляции является случайной величиной, то иногда требуется по эмпирическому значению оценить теоретическое значение коэффициента , т. е, найти такой интервал, в котором с заданной надежностью находится значение .

Зададимся надежностью , т.е. . Это равенство выполняется при . Случайная величина имеет среднее квадратическое отклонение .

____________________________________

* Смирнов Н.В., Дунин-Барковский И.В. Краткий курс математической статистики для технических приложений, М., Физматгиз, 1959.

Поэтому .

Определив доверительный интервал для Z, по приложению 4 находим значения для.

Рассмотрим предыдущий пример. Величина . По приложению 4 находим Z = 1,1568.

Вычисляем .

Задаемся надежностью Ф(t)= 0,95. При этом t = 1,96.

Определяем доверительный интервал для , т. е. для Z, соответствующему теоретическому значению

или .

Пользуясь приложением 4 для найденных Z=1,0579 и 1,3557, находим значения .

Для Z = 1,0579, r = 0,79 и для Z= 1,3557, = 0,89.

Поэтому 0,79 < < 0,89, т. e. теоретическое значение коэффициента корреляции с вероятностью 0,95 лежит в этом интервале.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]