
- •Случайные величины и законы их распределения
- •Закон распределения случайной величины х
- •Нормальный закон распределения и функция Лапласа Нормальный закон распределения характеризуется плотностью
- •Корреляционный анализ
- •Основные показатели деятельности предприятий (данные условные)
- •Расчетная таблица для определения линейного коэффициента корреляции
- •Расчетная таблица для определения коэффициента конкордации
Расчетная таблица для определения коэффициента конкордации
Поряд- ковый номер семьи
|
Годовой доход семьи, тыс. руб. x1 |
Число детей в семье x2
|
Сбере- жения за год, тыс. руб. x3
|
Ранги каждого фактора
|
Сумма рангов
|
Квадрат суммы рангов
|
Квадрат отклонении суммы рангов от их средней величины
|
||
|
|
|
|||||||
1
|
30
|
2
|
2,5
|
1
|
2
|
1
|
4
|
16
|
12,25
|
2
|
35
|
1
|
3,1
|
2
|
1
|
2
|
5
|
25
|
6,25
|
3
|
38
|
3
|
4,2
|
3
|
3
|
4
|
10
|
100
|
6,25
|
4
|
40
|
4
|
3,6
|
4
|
4
|
3
|
11
|
121
|
12,25
|
Σ |
|
|
|
|
|
|
30
|
262
|
S= 37
|
Второй способ. Разделив итог графы 7 на n, найдем среднюю величину суммы рангов. Обозначив ее через Т, получим
Затем определим S как сумму квадратов отклонений суммы рангов каждой строки от их средней величины:
Этот расчет приведен в графе 10. Ее итог и есть искомая сумма S. Откуда коэффициент конкордации:
Коэффициент конкордации W может принимать значения от 0 до 1. Полученное значение W = 0,82 позволяет сделать вывод о сильной зависимости между тремя рассмотренными показателями.
Изучение связи между качественными признаками на основе таблиц сопряженности
Построение таблиц, в которых дается комбинационное распределение единиц совокупности по двум признакам, применимо не только к количественным, но и к неколичественным, т.е. качественным, или атрибутивным, признакам (пол, образование, семейное положение, профессия, форма собственности, вид заболеваний, вид преступлений и т.п.).
Качественные признаки, взаимосвязи между ними, их влияние на другие показатели (в том числе и количественные) особенно часто приходится изучать при проведении различных социологических исследований путем опроса или анкетирования.
В таких случаях о зависимости ответов на те или иные вопросы от других признаков единиц наблюдения судят, исходя из комбинационного распределения единиц совокупности по двум атрибутивным признакам (или одному атрибутивному, а другому — количественному), т.е. анализируя таблицы взаимной сопряженности. Последние могут иметь разную размерность.
Простейшая форма таблицы взаимной сопряженности — таблица «четырех полей». В ней по каждому признаку выделяется только две группы, чаще всего по альтернативному принципу («да» — «нет», «хорошо» — «плохо» и т.д.). Пример такой таблицы приведен ниже. В ней указаны условные данные о распределении 500 опрошенных человек по двум показателям: наличие (отсутствие) у них прививки против гриппа и факт заболевания (не заболевания) гриппом во время его эпидемии.
Таблица
Таблица «четырех полей»
Группа лиц
|
Число лиц |
||
заболевших гриппом
|
не заболевших гриппом
|
Итого
|
|
Сделавших прививку |
30 (a) |
270 (b) |
300 |
Не сделавших прививку |
120 (с) |
80 (d) |
200 |
Итого |
150 |
350 |
500 |
Применительно к таблице «четырех полей», частоты которых можно обозначить через а, Ь, с, d, коэффициент ассоциации выражается формулой
Для распределения, приведенного выше, имеем:
Задача
Для четырех пар значений (x i yi), приведенных в табл., определите линейные коэффициенты корреляции Пирсона: r1, r2, r3, r4.
x 1 |
y1 |
x 2 |
y2 |
x 3 |
y3 |
x 4 |
y4 |
21 |
1 |
1 |
100 |
1 |
100 |
145 |
59 |
26 |
2 |
2 |
80 |
2 |
80 |
46 |
62 |
17 |
3 |
3 |
85 |
3 |
95 |
17 |
64 |
54 |
4 |
4 |
74 |
4 |
74 |
754 |
64 |
61 |
5 |
5 |
71 |
5 |
91 |
10 |
67 |
53 |
6 |
6 |
36 |
6 |
36 |
10 |
69 |
77 |
7 |
7 |
47 |
7 |
87 |
1007 |
75 |
97 |
8 |
8 |
31 |
8 |
31 |
97 |
77 |
128 |
9 |
9 |
40 |
9 |
90 |
128 |
78 |
110 |
10 |
10 |
29 |
10 |
29 |
11 |
85 |
Ответ. r1 = 0,947; r2 = - 0,937; r3 = -0,591; r4 = 0,01.
Задачи
Задача 1. В урне 30 шаров: 20 белых и 10 черных. Вынули подряд четыре шара, причем каждый вынутый шар возвращается в урну перед извлечением следующего и шары в урне перемешиваются. Какова вероятность того, что среди вынутых 4 шаров будет 2 белых?
Решение. Вероятность извлечения белого шара p = 20/30 = 2/3
можно считать одной и той же во всех четырех испытаниях; q = 1 - p = 1/3. Применив предыдущую формулу, получаем
Задача 2. Вероятность появления события А равна 0,4. Какова вероятность того, что при 10 испытаниях событие А появится не больше трех раз?
Решение. Здесь p = 0,4, q = 0,6.
Найдем вероятности появления события А:
0 раз - Р0,10 = q10;
1 раз - Р1,10 = 10рq9;
2 раза - Р2,10 = 45р2q8;
З раза – Р3,10 = 120р3q7.
Вероятность того, что событие А появится не больше З раз, определится равенством Р = Р0,10 + Р1,10 + Р2,10 + Р3,10.
т. е.
Р = 0,67 • (0,216 + 1,44 + 4,32 + 7,68), Р ~ 0,38.
Задача 3. Определить вероятность того, что в семье, имеющей пять детей, будет три девочки и два мальчика. Вероятности рождения мальчика и девочки будем считать одинаковыми.
Решение. Вероятность рождения девочки р = 0,5, тогда q =1 - р = 0,5 (вероятность рождения мальчика). Решение находим по формуле
Условная вероятность события Hi в предположении, что событие А имеет место, определяется по так называемой формуле Бейеса:
Вероятности Р(Hi/А), вычисленные по формуле Бейеса, часто называют вероятностями гипотез.
Задача
4. Имеется 4
урны. В первой урне 1 белый и 1 черный
шары. Во второй урне 2 белых и 3 черных
шара. В третьей урне 3 белых и 5 черных
шаров, В четвертой урне 4 белых и 7 черных
шаров. Событие Hi
—выбор i-й
урны (i
= l, 2, 3, 4). Дано, что вероятность выбора
i-й
урны равна
,
т. е. Р(H1)
= 0,1; Р(H2)
= 0,2; Р(H3)
= 0,3; Р(H4)
= 0,4.
Выбирается наугад одна из урн и вынимается из нее шар. Найти вероятность того, что этот шар белый.
Решение. Из условия следует, что Р(А/Н1) = 0,5 (условная вероятность извлечения белого шара из первой урны).
Р(А/Н2) = 2/5; Р(А/Н3) = 3/8; Р(А/Н4) = 4/11.
Вероятность извлечения белого шара, находим по формуле полной вероятности:
Р(А) = Р (Н1)•Р(А/Н1) + Р(H2)• Р(А/Н2) + Р(H3)•Р(А/Н3) + Р(H4)•Р(А/Н4) =
= 1707/4400.
Задача 5. Имеются три одинаковых по виду ящика. В первом ящике 20 белых шаров. Во втором ящике 10 белых и 10 черных шаров. В третьем ящике 20 черных шаров. Из выбранного наугад ящика вынули белый шар.
Вычислить вероятность того, что шар вынут из первого ящика.
Решение.
Гипотеза H1 - выбор первого ящика;
Гипотеза H2 - выбор второго ящика;
Гипотеза H3 - выбор третьего ящика;
событие А - появление белого шара.
Р(H1) = Р(H2) = Р(H3) = 1/3 (выбор любого из ящиков равновозможен);
Р(А / H1) = 1 (вероятность извлечения белого шара из первого ящика);
Р(А/H2)= 10/20 = 1/2 - (вероятность извлечения белого шара из второго ящика);
Р(А/H3) = 0 (вероятность извлечения белого шара из третьего ящика).
Искомую вероятность Р(H1/А) находим по формуле Бейеса:
Задача 6. Дан ряд распределения случайной величины X: X 10 20 30 40 50 р 0,2 0,3 0,35 0,1 0,05
Построить функцию распределения вероятности этой случайной величины.
Решение.
Если х £ 10, то F(x) = P(Х<х) = 0;
если 10 < х < 20, то F(x) = P (Х<х) = 0,2;
если 20 < х <30, то F(х) = P(X<х) = 0,2 + 0,3 = 0,5;
если 30 < х < 40, то F (х) = Р (X < х) = 0,2 + 0,3 + 0,35 = 0,85;
если 40 < х < 50, то F (х) = Р (X < х) = 0,2 + 0,3 + 0,35 + 0,1= 0,95;
если х > 50, то F(х) = Р(Х< х) = 0,2 + 0,3 + 0,35 + 0,1 + 0,05=1.