![](/user_photo/58847_rqTYU.jpg)
2. Статистические оценки параметров распределения двумерного случайного вектора
Пример1.
Вычислить выборочные средние
,
,
несмещенные оценки
дисперсий
,
и коэффициент корреляции
для выборки
|
8 |
10 |
5 |
8 |
9 |
|
1 |
3 |
1 |
2 |
3 |
Решение. Для расчетов воспользуемся формулами
, (4)
где n – объем выборки, nij – частота появления пары элементов (xi, yj) выборки; ni – частота появления элемента xi (при любом y); nj – частота появления элемента y (при любом x).
В рассматриваемом примере среди значений xi, yj нет повторяющихся, поэтому
Вычисления удобно свести в таблицу.
Таблица 8
i |
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
8 |
1 |
64 |
1 |
8 |
9 |
81 |
2 |
10 |
3 |
100 |
9 |
30 |
13 |
169 |
3 |
5 |
1 |
25 |
1 |
5 |
6 |
36 |
4 |
8 |
2 |
64 |
4 |
16 |
10 |
100 |
5 |
9 |
3 |
81 |
9 |
27 |
12 |
144 |
|
40 |
10 |
334 |
24 |
86 |
|
530 |
Последний столбец таблицы служит для контроля вычислений с помощью тождества
(В данном случае: 530 = 334 + 2∙86 + 24).
Используя данные из последней строки и учитывая (8), по формулам (4)–(7) получаем
Пример 2. В табл. 9 приведены результаты измерений двух физических величин в ходе некоторого эксперимента
Таблица 9
Вычислить средние, несмещенные оценки дисперсий и коэффициента корреляции, предварительно сгруппировав выборку и составив корреляционную таблицу.
Решение. Определим размах выборки по х и по у
В данном случае для группировки элементов выборки удобно использовать четыре интервала по х и два интервала по у. Определим длины интервалов группировки
Группировку выборки можно производить по диаграмме рассеивания (см. рис. 9). Для построения этой диаграммы нанесем элементы выборки (xi, yj) в виде точек на плоскость с выбранной системой координат.
Рис. 9
Будем считать, что элементы выборки, которые попали на границу двух соседних прямоугольников, относятся к верхнему или к правому прямоугольнику, и составим корреляционную таблицу.
Таблица 10
y |
x |
46-50 |
50-54 |
54-58 |
58-62 |
|
48 |
52 |
56 |
60 |
|
|
|||||
16-18 |
17 |
2 |
4 |
1 |
3 |
18-20 |
19 |
3 |
6 |
4 |
1 |
Здесь xi*, yj* – означают середины интервалов группировки. В клетках таблицы записываются частоты (то есть число пар исходной выборки, попавших в данный прямоугольник) для каждого прямоугольника на диаграмме рассеивания.
Для
вычисления искомых оценок параметров
распределения по сгруппированной
выборке можно использовать те же формулы
(4)–(7),
в которых xi,
yj
следует заменить на xi*,
yj*,
а
,
,
– на частоты попадания элементов выборки
в соответствующие интервалы
,
,
.
Однако, если xi*, yj* достаточно велики, то для упрощения вычислений рекомендуется ввести вспомогательные случайные величины
где dx, dy – наиболее часто встречающиеся значения xi* и yj*. Найти их параметры распределения по формулам, аналогичным (4)–(7), а затем воспользоваться соотношениями
(11)
В
заданном примере
.
Результаты промежуточных вычислений представим в виде таблицы (табл. 11).
По
формулам (4) - (7)
используя найденные
в таблице вспомогательные суммы
,
,
,
,
и вычислив
имеем
Таблица 11
xi* |
48 |
52 |
56 |
60 |
|
|
|
|
yj* |
ui vj |
-1 |
0 |
1 |
2 |
|||
17 |
-1 |
2 |
4 |
1 |
3 |
10 |
-10 |
10 |
19 |
0 |
3 |
6 |
4 |
1 |
14 |
0 |
0 |
|
5 |
10 |
5 |
4 |
|
|
|
|
|
-5 |
0 |
5 |
8 |
|
|
||
|
5 |
0 |
5 |
16 |
|
Возвращаясь к заданным случайным величинам, по формулам (11) получим
Пример 3. По выборке из примера 2 оценить параметры линейной регрессии X на Y и Y на X и составить уравнения прямых регрессии.
Решение. Уравнения прямых регрессии Y на X и X на Y были получены в курсе теории вероятностей и имеют вид
Заменяя в этих
уравнениях числовые характеристики
mx,
my,
,
,
rxy
их статистическими оценками, получим
(12)
(13)
Подставляя в эти
уравнения найденные в предыдущем примере
значения
,
,
Sx,
Sy,
rxy
имеем
Отсюда следует, что уравнения линейной регрессии Y на X и X на Y имеют соответственно вид
Отметим, что эти
прямые пересекаются в точке ().
Угол между ними уменьшается при увеличении
,
а при
= 1, прямые регрессии совпадают.
Решите примеры, используя данные своего варианта, приведенные в Приложении 2, табл. 1,2.
4. В ходе некоторого эксперимента были многократно измерены две физические величины X и Y. Результаты измерений записаны в таблицу. Обработайте результаты эксперимента по следующему плану:
1) постройте диаграмму рассеивания;
2) составьте корреляционную таблицу;
3) вычислите средние, несмещенные оценки дисперсий среднеквадратичных отклонений и оцените коэффициент корреляции;
4) составьте уравнения прямых регрессии и нанесите эти прямые на диаграмму рассеивания.
5.
Вычислить выборочные средние
,
,
несмещенные оценки
дисперсий
,
и коэффициент корреляции
для выборки, представленной в табл. 2
приложения 2.