- •Статистика
- •Содержание
- •Ряды распределения.
- •1. Атрибутивные ряды распределения
- •2. Вариационные ряды распределения
- •Графическое изображение.
- •Эмпирическая функция распределения.
- •Средние величины.
- •2. Структурные средние.
- •Показатели вариации
- •Ряды динамики.
- •Изучение тренда.
- •Статистическая и корреляционная зависимость.
- •Корреляционная таблица.
- •1. Представим результаты эксперимента в виде корреляционной таблицы:
- •Уравнение регрессии и коэффициент корреляции величин, заданных числовыми массивами.
- •Эмпирическая функция распределения
- •Степенные средние величины
- •Показатели вариации
- •Средняя величина и анализ динамики
- •Изучение тренда
- •Линейная корреляция
- •Библиографический список:
1. Представим результаты эксперимента в виде корреляционной таблицы:
X Y |
0 |
1 |
2 |
3 |
4 |
пу |
10 |
3 |
|
|
|
|
3 |
15 |
7 |
3 |
|
|
|
10 |
20 |
|
6 |
|
|
|
6 |
25 |
|
1 |
|
|
|
1 |
30 |
|
|
4 |
|
|
4 |
35 |
|
|
5 |
|
|
5 |
40 |
|
|
1 |
3 |
|
4 |
45 |
|
|
|
4 |
|
4 |
50 |
|
|
|
3 |
3 |
б |
55 |
|
|
|
|
4 |
4 |
60 |
|
|
|
|
3 |
3 |
nx |
10 |
10 |
10 |
10 |
10 |
N=50 |
2. На основании данных, приведенных в корреляционной таблице, рассчитаем условные средние х величины Y для всех Х по формуле (5):
х=0 =(3∙10 + 7∙15)/(7+3) = 13,5;
х=1 =(3∙15 +6∙20 +1∙25)/(3+6+1)= 19;
х=2 =(4∙30+5∙35+1∙40)/4+5+1) = 33,5;
х=3 = (3∙40+4∙45+3∙50)/(3+4+3) = 45;
х=4 = (3∙50+4∙55+3∙60)/(3+4+3) = 55.
Теперь по этой же формуле рассчитаем условные средние значения Х для каждого из значений Y: у=10 = 3∙0/3 =0; у=15=(7∙0+3∙1)/10 =0,3; у=20=6∙1/6=6;
у=25=1∙1/1=1; у=30=4∙2/4= 2; у=35=5∙2/5 =2;
у=40=(1∙2+3∙3)/(3+1)=2,75; у=45= 4∙3/4 =3;
у=50=(3 ∙3+3∙4)/(3+3)=3,5; у=55=4∙4/4= 4; у=60=3∙4/3= 4.
3. Составим вспомогательные таблицы для нахождения коэффициентов ρYx, ρXy соответственно.
xi |
x |
nxi |
xi2 |
nxi∙ xi |
nxi∙ xi2 |
nxi∙ xi∙ x |
0 |
13,5 |
10 |
0 |
0 |
0 |
0 |
1 |
19 |
10 |
1 |
10 |
10 |
190 |
2 |
33,5 |
10 |
4 |
20 |
40 |
670 |
3 |
45 |
10 |
9 |
30 |
90 |
1350 |
4 |
55 |
10 |
16 |
40 |
160 |
2200 |
Сумма |
50 |
30 |
100 |
300 |
4410 |
yj |
y |
nyj |
yj2 |
nyj∙ yj |
nyj ∙yj2 |
nyj ∙yj∙ y |
10 |
0 |
3 |
100 |
30 |
300 |
0 |
15 |
0,3 |
10 |
225 |
150 |
2250 |
45 |
20 |
1 |
6 |
400 |
120 |
2400 |
120 |
25 |
1 |
1 |
625 |
25 |
625 |
25 |
30 |
2 |
4 |
900 |
120 |
3600 |
240 |
35 |
2 |
5 |
1225 |
175 |
6125 |
350 |
40 |
2,75 |
4 |
1600 |
160 |
6400 |
440 |
45 |
3 |
4 |
2025 |
180 |
8100 |
540 |
50 |
3,5 |
6 |
2500 |
300 |
15000 |
1050 |
55 |
4 |
4 |
3025 |
220 |
12100 |
880 |
60 |
4 |
3 |
3600 |
180 |
10800 |
720 |
Сумма |
50 |
16225 |
1660 |
67700 |
4410 |
Подставим в формулы (8) числовые данные, полученные в таблицах: = 100/50=2; = 1660/50 = 33,2; (Х)2=4; (Y)2=1102,24; = 4410/50 = 88,2; =300/50 = 6; = 67700/50 = 1354;σх2 = 6-4=2; σу2 = 1354 – 1102Б24 = 251,76.
В соответствии с приведенной ранее формулой рассчитаем коэффициенты регрессии Y на X:
ρYx = (88,2 - 2∙33,2)/2 ≈ 10,9;b = (6∙33,2 - 2∙88,2)/2 ≈ 11,4.
Аналогично рассчитаем коэффициенты регрессии Х на Y:
ρXy= (88,2 - 2∙33,2)/251,76 ≈ 0,086;
d = (1354∙2 – 33,2∙88,2)/251,76 ≈ − 0,86.
Коэффициенты вычислены, запишем уравнения регрессии:
х = 10,9∙х +11,4; у = 0,086∙у − 0,86.
Коэффициент линейной корреляции.
Для полного описания корреляционной связи недостаточно просто найти форму корреляционной зависимости между величинами и определить ее силу по величине коэффициентов регрессии.
Для количественной оценки тесноты линейной корреляционной связи между величинами Х и Y вводят понятие коэффициента линейной корреляции, определяемого соотношением:
r = M((X-M(X))∙(Y_M(Y))/σx∙σy, (9)
где М – математическое ожидание соответствующей величины;
σx,σy, - средние квадратические отклонения величин Х и Y соответственно.
Основные свойства коэффициента корреляции:
Коэффициент корреляции двух независимых случайных величин равен нулю.
Коэффициент корреляции двух случайных величин, связанных линейной функциональной зависимостью, равен 1 в случае возрастающей(прямой) зависимости, и −1 в случае убывающей(обратной).
Абсолютное значение коэффициента корреляции не превышает 1, т.е. −1≤ r ≤ 1.
На практике для оценки тесноты линейной корреляционной связи между величинами Х и Y по результатам выборочных наблюдений используется формула:
(10)
Сравнением формулы (10) с приведенными выше уравнениями (8), получаем:
R = ρYx∙ σx/σy = ρXy∙σу/σх (11)
Пример. Рассчитайте выборочный коэффициент линейной корреляции между количеством решенных задач и сырым баллом по шкале В(интеллект) теста Кэттелла по данным предыдущего примера.
Решение. Выборочный коэффициент линейной корреляции можно рассчитать, используя формулу (10):
r = (88,2 - 2∙33,2)/√2∙√251,7 = 0,96
Ответ: Полученное значение коэффициента линейной корреляции близко к 1, следовательно, в данном случае имеет место достаточно сильная прямая зависимость между правильно решенными задачами и сырым баллом по шкале теста Кэттелла.