Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 3. Математическая статистика.doc
Скачиваний:
6
Добавлен:
04.09.2019
Размер:
1.29 Mб
Скачать

Корреляционная таблица

При большом числе наблюдений одно и то же значение может встретиться раз, одно и то же значение - раз, одна и та же пара чисел может наблюдаться раз. Поэтому данные наблюдений группируют, т.е. подсчитывают частоты , . Все сгруппированные данные записывают в виде таблицы, которая называется корреляционной.

Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным

Для определения параметров уравнения прямой линии регрессии Y на X была получена система уравнений

(3)

Для простоты записи опустим индексы

(3a)

При выводе этой системы предполагалось, что значения X и соответствующие им значения Y встречались по одному разу. Если дана корреляционная таблица, то до применения системы (3а) предварительно заметим, что из раннее выведенных формул

=

(учтено, что пара чисел наблюдалась раз).

Подставив правые части тождеств в систему (3а) получим:

(4)

Из второго уравнения найдём , предварительно сократив на , и подставим в уравнение , получим

. (5)

Для определения второе уравнение умножим на и вычтем из первого:

.

Учитывая, что , получим .

Умножим обе части равенства на дробь :

(6).

Обозначим правую часть равенства (6) через

тогда равенство (6) примет вид

Откуда . Подставив значение в (5), окончательно получим выборочное уравнение прямой линии регрессии Y на X:

где - выборочный коэффициент корреляции.

Если величины Y и X независимы, то =0; если связаны линейной функциональной зависимостью, то . Отсюда следует, что измеряет тесноту линейной связи между Y и X.

Методика вычисления выборочного коэффициента корреляции

Найти выборочное уравнение прямой линии регрессии Y на X по данным, приведённым в корреляционной табл.1.

Таблица 1

При определении выборочного уравнения прямой линии регрессии основная задача сводится к определению . Для упрощения расчётов на практике переходят к условным вариантам

Составим корреляционную табл. 2 в условных вариантах, выбрав в качестве ложных нулей

Таблица 2

В этом случае выборочный коэффициент корреляции вычисляют по формуле (при этом величина не изменится)

Величины можно найти методом произведений или вычислить непосредственно исходя из определений этих величин:

Для определения найдём предварительно и :

тогда

Остаётся указать способ вычисления , где - частота пары условных вариант . Можно доказать, что справедливы формулы:

Для контроля целесообразно выполнить расчёты по обеим формулам и сравнить результаты; их совпадение свидетельствует о правильности вычислений.

Для вычисления составим расчётную табл. 3.

Пояснения к составлению табл.3:

В каждой клетке, в которой частота , записывают в правом верхнем углу произведение частоты на варианту . Например, в правых верхних углах клеток первой строки записаны произведения: 4 .

Складывают все числа, помещённые в правых верхних углах клеток одной строки и их сумму записывают в клетку этой же строки столба . Например, для первой строки

Умножают варианту на и полученное произведение записывают в последнюю клетку той же строки . Например, в первой строке таблицы следовательно .

Сложив все числа столбца , получают сумму , которая равна искомой сумме . Например, в нашем случае , следовательно

Для контроля аналогичные вычисления производят по столбцам: произведения записывают в левый нижний угол клетки, содержащей частоту ; все числа, помещённые в левых нижних углах клеток одного столбца, складывают и их сумму записывают в строке V; далее умножают каждую варианту на V и результат записывают в клетках последней строки.

Сложив все числа последней строки, получают сумму , которая также равна

Найдём выборочный коэффициент корреляции:

Найдём шаги

Найдём

Подставив найденные величины в уравнение

получим искомое уравнение прямой линии регрессии Y на X: