Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по теории вероятностей.doc
Скачиваний:
165
Добавлен:
02.05.2014
Размер:
3.94 Mб
Скачать

Свойства коэффициента корреляции

  1. .

В самом деле, имеем

или

что эквивалентно неравенству .

  1. если инезависимы, то. Доказательство следует из независимости* и*.

  2. тогда и только тогда, когда случайные величины линейно зависимы, то есть

Если , тоr= -1, если, тоr= 1.

Пусть , тогда

.

Обратно, пусть . Возьмемr= -1,

тогда

, следовательно.

Возвращаясь к , получаем

.

Для r= 1, возьмем

  1. Если r 0, то случайные величины зависимы.

Из свойств коэффициента корреляции следует, что он характеризует тесноту линейной связи в том смысле, что с возрастанием одной случайной величины другая линейно увеличивается (если r) или линейно уменьшается (еслиr), в среднем.

Пусть имеем набор случайных величин 1,2, …,n, представляющих некоторый объект для исследования. Математический анализ этого объекта можно проводить, если известны:

а) математические ожидания Мi,

б) дисперсии случайных величин Di,

в) парные коэффициенты корреляции rij, число которых равно, гдеi,j = 1, 2, …,n.

Для оценки совокупного поведения системы случайных величин, часто рассматривают корреляционнуюматрицу

,

где rij =rji – коэффициенты корреляции случайных величинi,j.

Изучение этой матрицы задача достаточно сложная и выходит за рамки данного курса [1].

Замечание. Можно рассматривать корреляционную матрицу, элементами которой являются корреляции случайных величин, а по главной диагонали идут их дисперсии. По такой матрице можно судить о величине рассеяния системы случайных величин относительно их среднего значения.

Еще одним видом зависимости случайных величин являются линии регрессии.

Пусть имеем пару (,хy).

Определение. Условным математическим ожиданием случайной величины(или), при фиксированном значении случайной величины х, (илиуназовем число

(61)

(62)

Из формул (61), (62) видно, что при изменении значений х(значенийу) изменяется и величина

Определение. Функцияназываетсяфункцией регрессиислучайной величинына. Аналогично,- функция регрессии случайной величинына.

Кривые, которые заданы функциями и, называются линиями регрессии. Ясно, что функции,не являются, вообще говоря, обратными, поскольку взаимное влияние случайных величин друг на друга, как правило, различно. Это становится очевидным, если заметить, что при фиксированном значении х, значениеу= (х) определяется как условное среднее значенийуУ, которое может даже и не принадлежать множествуУ.

Разумно считать, что линии регрессии у= (х) иразличны и имеют, как правило, сложную функциональную зависимость.

Нахождение истинной линии регрессии задача трудновыполнимая. На практике, как правило, поступают следующим образом.

Если, из каких-либо соображений, общий вид линии регрессии известен, например, у = ,,), то задача состоит в нахождении числовых параметров,,, которые обычно являются композицией из моментов случайных величин. Эта задача решаемая.

Другим, наиболее часто используемым в инженерных расчетах подходом, является приближение линии регрессии многочленом степени n. Приближение тем точнее, чем выше его степень. Обычно выбирают метод наименьших квадратов (М.Н.К.) [4]. Пусть задан класс многочленов, накладывающий на выборку одинаковое число связей, которое равно числу неопределенных коэффициентов многочлена. Наилучшее уравнение приближенной регрессии дает тот многочлен степениn, для которого наименьшее значение имеет функция, где (хi,yi) –совокупность опытных данных.

Пример. Пусть линия регрессии приближается линейной функцией, то есть

.

Здесь означает, что истинная линия регрессииу= (х) заменяется на линейную функцию.

Требуется подобрать коэффициенты так, чтобы эта линейная функция была наилучшей.

Решение. Рассмотрим коэффициент корреляции, имеем

где , а,.

Учитывая (60),

,

или

.

Отсюда

.

Для нахождения заметим, что, если линия регрессии линейна, тосправедливо, то есть

или

.

Таким образом,

. (63)

Аналогично получаем

. (64)

Упражнение. Показать, что те же самые результаты дает метод наименьших квадратов.

Если , то случайные величины зависимы и оцениваются острым углом между прямыми (63) и (64).

а) б)

Рис. 25

На рис. 25 а), коэффициент корреляции r,, так как с увеличением значений, значенияувеличиваются. На рис. 25 б), коэффициент корреляцииr ,, так как с увеличением значений, значенияубывают. Если прямые перпендикулярны, тоr ,). Это означает, что случайные величины некоррелированы.