- •Методические указания
- •Часть 2
- •§ 1. Разные задачи по теории вероятности
- •§ 5. Тестовые задания
- •Математическая статистика
- •1. Графическое представление выборки. Статистические оценки параметров распределения
- •2. Статистические оценки параметров распределения двумерного случайного вектора
- •§4. Интервальные оценки
- •Библиографический список
- •Библиографический список
- •Содержание
- •Часть 2
- •394026 Воронеж, Московский просп., 14
2. Статистические оценки параметров распределения двумерного случайного вектора
Пример1. Вычислить выборочные средние , , несмещенные оценки дисперсий , и коэффициент корреляции для выборки
8 |
10 |
5 |
8 |
9 |
|
1 |
3 |
1 |
2 |
3 |
Решение. Для расчетов воспользуемся формулами
, (4)
где n – объем выборки, nij – частота появления пары элементов (xi, yj) выборки; ni – частота появления элемента xi (при любом y); nj – частота появления элемента y (при любом x).
В рассматриваемом примере среди значений xi, yj нет повторяющихся, поэтому
Вычисления удобно свести в таблицу.
Таблица 8
i |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
8 |
1 |
64 |
1 |
8 |
9 |
81 |
2 |
10 |
3 |
100 |
9 |
30 |
13 |
169 |
3 |
5 |
1 |
25 |
1 |
5 |
6 |
36 |
4 |
8 |
2 |
64 |
4 |
16 |
10 |
100 |
5 |
9 |
3 |
81 |
9 |
27 |
12 |
144 |
40 |
10 |
334 |
24 |
86 |
|
530 |
Последний столбец таблицы служит для контроля вычислений с помощью тождества
(В данном случае: 530 = 334 + 2∙86 + 24).
Используя данные из последней строки и учитывая (8), по формулам (4)–(7) получаем
Пример 2. В табл. 9 приведены результаты измерений двух физических величин в ходе некоторого эксперимента
Таблица 9
Вычислить средние, несмещенные оценки дисперсий и коэффициента корреляции, предварительно сгруппировав выборку и составив корреляционную таблицу.
Решение. Определим размах выборки по х и по у
В данном случае для группировки элементов выборки удобно использовать четыре интервала по х и два интервала по у. Определим длины интервалов группировки
Группировку выборки можно производить по диаграмме рассеивания (см. рис. 9). Для построения этой диаграммы нанесем элементы выборки (xi, yj) в виде точек на плоскость с выбранной системой координат.
Рис. 9
Будем считать, что элементы выборки, которые попали на границу двух соседних прямоугольников, относятся к верхнему или к правому прямоугольнику, и составим корреляционную таблицу.
Таблица 10
y |
x |
46-50 |
50-54 |
54-58 |
58-62 |
|
48 |
52 |
56 |
60 |
|
|
|||||
16-18 |
17 |
2 |
4 |
1 |
3 |
18-20 |
19 |
3 |
6 |
4 |
1 |
Здесь xi*, yj* – означают середины интервалов группировки. В клетках таблицы записываются частоты (то есть число пар исходной выборки, попавших в данный прямоугольник) для каждого прямоугольника на диаграмме рассеивания.
Для вычисления искомых оценок параметров распределения по сгруппированной выборке можно использовать те же формулы (4)–(7), в которых xi, yj следует заменить на xi*, yj*, а , , – на частоты попадания элементов выборки в соответствующие интервалы , , .
Однако, если xi*, yj* достаточно велики, то для упрощения вычислений рекомендуется ввести вспомогательные случайные величины
где dx, dy – наиболее часто встречающиеся значения xi* и yj*. Найти их параметры распределения по формулам, аналогичным (4)–(7), а затем воспользоваться соотношениями
(11)
В заданном примере .
Результаты промежуточных вычислений представим в виде таблицы (табл. 11).
По формулам (4) - (7) используя найденные в таблице вспомогательные суммы ,,,, и вычислив имеем
Таблица 11
xi* |
48 |
52 |
56 |
60 |
|
|
|
|
yj* |
ui vj |
-1 |
0 |
1 |
2 |
|||
17 |
-1 |
2 |
4 |
1 |
3 |
10 |
-10 |
10 |
19 |
0 |
3 |
6 |
4 |
1 |
14 |
0 |
0 |
|
5 |
10 |
5 |
4 |
|
|
|
|
|
-5 |
0 |
5 |
8 |
|
|
||
|
5 |
0 |
5 |
16 |
|
Возвращаясь к заданным случайным величинам, по формулам (11) получим
Пример 3. По выборке из примера 2 оценить параметры линейной регрессии X на Y и Y на X и составить уравнения прямых регрессии.
Решение. Уравнения прямых регрессии Y на X и X на Y были получены в курсе теории вероятностей и имеют вид
Заменяя в этих уравнениях числовые характеристики mx, my, , , rxy их статистическими оценками, получим
(12)
(13)
Подставляя в эти уравнения найденные в предыдущем примере значения , , Sx, Sy, rxy имеем
Отсюда следует, что уравнения линейной регрессии Y на X и X на Y имеют соответственно вид
Отметим, что эти прямые пересекаются в точке (). Угол между ними уменьшается при увеличении , а при = 1, прямые регрессии совпадают.
Решите примеры, используя данные своего варианта, приведенные в Приложении 2, табл. 1,2.
4. В ходе некоторого эксперимента были многократно измерены две физические величины X и Y. Результаты измерений записаны в таблицу. Обработайте результаты эксперимента по следующему плану:
1) постройте диаграмму рассеивания;
2) составьте корреляционную таблицу;
3) вычислите средние, несмещенные оценки дисперсий среднеквадратичных отклонений и оцените коэффициент корреляции;
4) составьте уравнения прямых регрессии и нанесите эти прямые на диаграмму рассеивания.
5. Вычислить выборочные средние , , несмещенные оценки дисперсий , и коэффициент корреляции для выборки, представленной в табл. 2 приложения 2.