- •Практическая работа № 1 установление закона изменения случайных величин по результатам опыта
- •1. Основные понятия и определения теории вероятностей и математической статистики
- •II. Методика построения эмпирической кривой вычисление ее параметров и характеристик
- •1. Построение эмпирической кривой
- •2. Техника вычислений параметров эмпирического распределения
- •А) Значения выборки заданы однозначными или двухзначными величинами. Объем выборки n 25
- •Б) Значения выборки заданы многозначными величинами. Объем выборки n 25
- •В) Результаты эксперимента заданы выборкой небольшого объема. Объем выборки n 25
- •Методика определения поля допуска по эмпирическому распределению
- •4. Вычисление коэффициентов относительной асимметрии и относительного рассеивания
- •А) Поле допуска задано и изменению не подлежит.
- •Б) Поле допуска не задано
- •5. Критерии для непринятия резко выделяющихся наблюдений (ошибок измерения)
- •6. Функции плотности теоретических и эмпирических распределений
- •Подбор теоретической функции для эмпирического распределения
- •2. Выравнивание эмпирического распределения по гипотетическим теоретическим
- •7. Сравнение эмпирических и теоретических функций распределения частот по критериям согласия
- •А) Критерий согласия Пирсона
- •Б) Критерий Колмогорова
- •Практическая работа № 2 установление вида зависимости между двумя переменными величинами
- •Функциональная зависимость
- •Корреляционная зависимость
- •Определение коэффициента корреляции по выборка большого объема
- •Приложения
- •Плотность вероятности нормального распределения
- •Значение функции
Определение коэффициента корреляции по выборка большого объема
ОБЪЕМ ВЫБОРКИ N > 50
Выборкой большого объема будем считать выборку, в которой несколько значении переменных встречаются по 2 и более раза.
Пример. Определим коэффициент корреляции между случайными величинами размеров двух деталей, обрабатываемых одновременно на одном станке. После обработки, каждой пары деталей производятся измерения, результаты которых заносятся в протокол (см. табл. 15).
Таблица 15
Номер опыта (№) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
... |
100 |
Деталь Х |
21,867 |
21,845 |
21,871 |
21,878 |
21,847 |
21,867 |
21,867 |
... |
21,867 |
Деталь Y |
21,852 |
21,843 |
21,864 |
21,871 |
21,838 |
21,852 |
21,853 |
... |
21,854
|
В каждом ряду отыскиваются минимальные и максимальные значения (21,845 мм - 21,878 мм, 21,838 мм -21,871 мм). Если разность между этими значениями велика, то все значения целесообразно разбить на группы. В нашем примере 21,878-21,845=0,033мм и 21,871-21,838=0,033 мм. Объединим все значения в группы с шириной интервала h = 0,002 мм. Затем строим корреляционную таблицу (см. табл. 16), в которой приводятся интервалы, середины интервалов и и значения новых случайных величин и , которые получаются по следующим формулам
; , где -величины интервалов.
За и обычно принимают среднее значение середин интервалов. Примем ; . В рассматриваемом примере . Переход к новым случайным величинам целесообразно делать в тех случаях, когда середины интервалов ; имеют двухзначные и более значения.
Для заполнения корреляционной таблицы пользуемся протоколом измерения деталей (табл. 15). Берем первый результат измерения 21,867-21,852. Ищем в табл. 16 по горизонтали интервал, содержащий число 21,867, а по вертикали-22,852. На пересечении этих координат ставим точку (обведена кружочком). Затем берем второй результат измерений 21,845-21,843, ищем интервал, содержащий эти значения, и на пересечении координат ставим точку (также обведена кружочком). Так поступаем со всеми парами замеров деталей.
В результате заполнения корреляционной таблицы получаем частоты встречаемости () всех различных пар значений . Затем приступаем к определению эмпирического значения коэффициента корреляции, обозначаемого через по формуле (d)
, (d)
где n-число опытов;
-частота совместного наступления событий Х и У.
Последовательность вычисления r приведена в строках 1-5 и колонках 1-3 табл. 16.
Значения находятся как суммы частот по всем колонкам и строкам.
Находим , как сумму значений 1-й строки () и 1-й колонки (). Равенство и служит контролем правильности вычисления и .
Все значения умножаем на и записываем во 2-й строке. Суммируя все значения этой строки, получаем .
Все значения умножаем на записываем по 2-й колонке. Суммируя все значения этой колонки, определяем .
Находим произведения значений строки 1 на и заполняем 3-ю строку. Суммируя значения этой строки, получим, что .
Корреляционная таблица |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 16 |
|
|||
|
|
|
|
|
х'i |
-8 |
-7 |
-6 |
-5 |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
|
|
|
|
|
|
|
|
|
|
|
Середина интервалов хi |
21,8385 |
8405 |
8425 |
8445 |
8465 |
8485 |
8505 |
8525 |
8545 |
8565 |
8585 |
8605 |
8625 |
8645 |
8665 |
8685 |
8705 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
|
|
|
y'i |
Середина |
интервалов |
уi |
y \ x |
21,838-21,839 |
840 841 |
842 843 |
844 845 |
846 847 |
848 849 |
850 851 |
852 853 |
854 855 |
856 857 |
858 859 |
860 861 |
862 863 |
864 865 |
866 867 |
868 869 |
870 871 |
|
|
ny' |
ny' y' |
ny' (y')2 |
|
|
|
-8 |
|
21, |
8455 |
21,845-21,846 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
-16 |
128 |
|
|
|
-7 |
|
|
8475 |
847 848 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
-7 |
49 |
|
|
|
-6 |
|
|
8495 |
849 850 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
-6 |
36 |
|
|
|
-5 |
|
|
8515 |
851 852 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
-5 |
25 |
|
|
|
-4 |
|
|
8535 |
853 854 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
-20 |
80 |
|
|
|
-3 |
|
|
8555 |
855 856 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
-15 |
45 |
|
|
|
-2 |
|
|
8575 |
857 858 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
-8 |
16 |
|
|
|
-1 |
|
|
8595 |
859 860 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
-8 |
8 |
|
|
|
0 |
|
|
8615 |
861 862 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
0 |
0 |
|
|
|
1 |
|
|
8635 |
863 864 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
3 |
3 |
|
|
|
2 |
|
|
8655 |
865 866 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
40 |
80 |
|
|
|
3 |
|
|
8675 |
867 868 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
22 |
66 |
198 |
|
|
|
4 |
|
|
8695 |
869 870 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13 |
52 |
208 |
|
|
|
5 |
|
|
8715 |
871 872 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
40 |
200 |
|
|
|
6 |
|
|
8735 |
873 874 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
|
|
8755 |
875 876 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
|
8775 |
877 878 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
8 |
64 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Σy’ ny’ |
Σy’ ny’ y’ |
Σy’ ny’ (y’)2 |
|
|
|
|
|
|
1 |
nx’ |
1 |
|
2 |
1 |
1 |
8 |
2 |
14 |
11 |
7 |
9 |
13 |
17 |
12 |
|
1 |
1 |
100 |
|
|||||
|
|
|
|
2 |
nx’ x’ |
-8 |
|
-12 |
-5 |
-4 |
-24 |
-4 |
-14 |
0 |
7 |
18 |
39 |
68 |
60 |
|
7 |
8 |
136 |
|
|||||
|
|
|
|
3 |
nx’ (x’)2 |
64 |
|
12 |
25 |
16 |
72 |
8 |
14 |
0 |
7 |
36 |
117 |
272 |
300 |
|
49 |
64 |
1116 |
|
|||||
|
|
|
|
4 |
Σnx’y’ y’ |
-7 |
|
-16 |
-6 |
-4 |
-20 |
-2 |
-8 |
17 |
6 |
18 |
31 |
57 |
45 |
|
5 |
8 |
124 |
|
|||||
|
|
|
|
5 |
Σnx’y’ y’x’ |
56 |
|
96 |
30 |
16 |
60 |
4 |
8 |
0 |
6 |
36 |
93 |
228 |
225 |
|
35 |
64 |
957 |
100 |
124 |
1140 |
|
Вычисляем произведения значений колонки 1 на и заполняем 3-ю колонку. Суммируя значения этой колонки, найдем, что .
Определяем произведения значений на соответствующие значения , суммируем эти произведения и заполняем строку 4.
Например: 1(-7)-7; 2(-8) -16; 1(-6) = -6; 1 (-4) -4;
1(5) + 3(-4) + 1(-3 ) + 2(- 1) 12 =- 5- 12- 3- 2 +2- -20 и т. д.
Суммируя все значения этой строки, определяем . Контролем правильности предыдущих вычислений служит равенство сумм значений 4-й строки и2-й колонки, т. е.
.
Значения 4-й строки умножаем на и заполняем строку 5. Сумма значений этой строки равна
.
Вычисленные значения сумм подставляем в формулу (d) и определяем эмпирическое значение коэффициента корреляции
После того, как определен коэффициент корреляции , необходимо оценить существенно ли отличие полученного значения от 0.
Для решения этой задачи можно воспользоваться способом Фишера [*].
Случайная величина , подчинена нормальному закону со средним квадратическим отклонением . Значения Z для различных r приведены в приложении 4.
В рассматриваемом примере:
. По приложению 4 находим, что для r = 0,82; Z = 1,1568.
Определяем
По найденному значению t по приложению 5 находим Ф(t). Вероятность того, что отклонение от 0 случайно равно . В примере для . Поэтому
За уровень значимости обычно принимают 0,05 или 0,01, Если , то значение можно считать полученным случайно, а исследуемые случайные величины некоррелятивными.
Так как коэффициент корреляции является случайной величиной, то иногда требуется по эмпирическому значению оценить теоретическое значение коэффициента , т. е, найти такой интервал, в котором с заданной надежностью находится значение .
Зададимся надежностью , т.е. . Это равенство выполняется при . Случайная величина имеет среднее квадратическое отклонение .
____________________________________
* Смирнов Н.В., Дунин-Барковский И.В. Краткий курс математической статистики для технических приложений, М., Физматгиз, 1959.
Поэтому .
Определив доверительный интервал для Z, по приложению 4 находим значения для.
Рассмотрим предыдущий пример. Величина . По приложению 4 находим Z = 1,1568.
Вычисляем .
Задаемся надежностью Ф(t)= 0,95. При этом t = 1,96.
Определяем доверительный интервал для , т. е. для Z, соответствующему теоретическому значению
или .
Пользуясь приложением 4 для найденных Z=1,0579 и 1,3557, находим значения .
Для Z = 1,0579, r = 0,79 и для Z= 1,3557, = 0,89.
Поэтому 0,79 < < 0,89, т. e. теоретическое значение коэффициента корреляции с вероятностью 0,95 лежит в этом интервале.