Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Корреляция и взаимосвязь величин.docx
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
9.09 Mб
Скачать

Линейная и нелинейная корреляция

Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y. Корреляционный анализ экспериментальных данных для двух случайных величин заключает в себе следующие основные приемы:

- вычисление выборочных коэффициентов корреляции;

- составление корреляционной таблицы;

- проверка статистической гипотезы значимости связи.

График корреляций

Определение. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии f(x) и ф(x) являются линейными. В этом случае обе линии регрессии являются прямыми; они называется прямыми регрессии.

Смотреть видео 11, добавленное в раздел "Линейная и нелинейная корреляция"

Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии. Например, ясно, что корреляционная зависимость возраста Y учеников средней школы от года Х их обучения в школе является, как правило, более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.

Для оценки тесноты линейных корреляционных зависимостей между величинами Х и Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной корреляции, определяемого формулой:

Выборочный коэффициент линейной корреляции

Следует отметить, что основной смысл выборочного коэффициента линейной корреляции rB состоит в том, что он представляет собой эмпирическую (т.е. найденную по результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r. Принимая во внимание формулы:

Генеральный коэфициент линейной корреляции

Видим, что выборочное уравнение линейной регрессии Y на Х имеет вид:

Выборочное уравнение линейной регрессии Y на Х

Основные свойства выборочного коэффициента линейной корреляции:

1. Коэффициент корреляции двух величин, не связанных линейной корреляционной зависимостью, равен нулю.

Пример линейной зависимости скорости удаления галактик от расстояния до них

2. Коэффициент корреляции двух величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.

Линейная корреляционная зависимость

3. Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной зависимостью, удовлетворяет неравенству 0 меньше r меньше 1.

Понятие абсолютной величины коэффициента корреляции двух величин

4. Чем ближе r к 1, тем теснее прямолинейная корреляция между величинами Y, X.

По своему характеру корреляционная связь может быть прямой и обратной, а по силе - сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.

Сила и характер связи между параметрами

Пример 4. Изучалась зависимость между двумя величинами Y и Х. Результаты наблюдений приведены в таблице в виде двумерной выборки объема 11:

Результаты наблюдений для примера линейной корреляции

Требуется:

1. Вычислить выборочный коэффициент корреляции.

2. Оценить характер и силу корреляционной зависимости.

3. Написать уравнение линейной регрессии Y на Х.

Решение. По известным формулам:

Решение примера по линейной корреляции

Таким образом, следует сделать вывод, что рассматриваемая корреляционная зависимость между величинами Х и Y является по характеру - обратной, по силе - средней. Уравнение линейной регрессии Y на Х:

Уравнение линейной регрессии Y на Х

Пример 5. Изучалась зависимость между качеством Y (%) и количеством Х (шт). Результаты наблюдений приведены в виде корреляционной таблицы:

Исходные условия для примера по вычислению коэффициента выборочной корреляции

Требуется вычислить выборочный коэффициент линейной корреляции зависимости Y от Х.

Решение. Для упрощения вычислений перейдем к новым переменным - условным вариантам (ui, vi), воспользовавшись формулами при

Значение переменных

Для удобства перепишем данную таблицу в новых обозначениях:

Таблица с новыми обозначениями исходных условий для примера по вычислению выборочного коэффициента линейной корреляции

Смотреть видео 12, добавленное в раздел "Линейная и нелинейная корреляция"

Решение примера по выборочному коэффициенту линейной корреляции

Вывод: Корреляционная зависимость между величинами Х и Y - прямая и сильная.

Выбрав вид функции регрессии, т.е. вид рассматриваемой модели зависимости Y от Х (или Х от У), например, линейную модель, необходимо определить конкретные значения коэффициентов модели. При различных значениях а и b можно построить бесконечное число зависимостей, т.е на координатной плоскости имеется бесконечное количество прямых, нам же необходима такая зависимость, которая соответствует наблюдаемым значениям наилучшим образом. Таким образом, задача сводится к подбору наилучших коэффициентов.

Примеры корреляционной зависимости

Линейную функцию ищем, исходя лишь из некоторого количества имеющихся наблюдений. Для нахождения функции с наилучшим соответствием наблюдаемым значениям используем метод наименьших квадратов. В методе наименьших квадратов требуется, чтобы еi, разность между измеренными yi и вычисленными по уравнению значениям Yi, была минимальной. Следовательно, находим коэффициенты а и b так, чтобы сумма квадратов отклонений наблюдаемых значений от значений на прямой линии регрессии оказалась наименьшей:

Формула расчета коэффициентов а и b на прямой линии регрессии

Исследуя на экстремум эту функцию аргументов а и с помощью производных, можно доказать, что функция принимает минимальное значение, если коэффициенты а и b являются решениями системы:

Коэффициенты а и b - решение системы после исследования функции на экстремум

Если разделить обе части нормальных уравнений на n, то получим:

Формула расчета коэффициентов а и b

При этом b называют коэффициентом регрессии; a называют свободным членом уравнения регрессии и вычисляют по формуле:

Формула коэффициента регрессии

Полученная прямая является оценкой для теоретической линии регрессии. Имеем:

Уравнение линейной регрессии

Регрессия может быть прямой (b больше 0) и обратной (b меньше 0). Прямая регрессия означает, что при росте одного параметра, значения другого параметра тоже увеличиваются. А обратная, что при росте одного параметра, значения другого параметра уменьшаются.

Пример 1. Результаты измерения величин X и Y даны в таблице:

Исходные условия примера по уравнению линейной регрессии

Предполагая, что между X и Y существует линейная зависимость, способом наименьших квадратов определить коэффициенты a и b. Решение. Здесь n=5:

Решение примера по уравнению линейной регрессии

Решая эту систему, получим:

Решение системы

Пример 2. Имеется выборка из 10 наблюдений экономических показателей (X) и (Y).

Исходные условия примера по выборочному уравнению регрессии

Требуется найти выборочное уравнение регрессии Y на X. Построить выборочную линию регрессии Y на X.

Решение. 1. Проведем упорядочивание данных по значениям xi и yi. Получаем новую таблицу:

Упорядочинные данные для примера по выборочному уравнению регрессии

Для упрощения вычислений составим расчетную таблицу, в которую занесем необходимые численные значения.

Расчетная таблица для примера по выборочному уравнению регрессии

Согласно формуле, вычисляем коэффициента регрессии:

Вычисление коэффициента регрессии

Нанесем на координатной плоскости точки (xi; yi) и отметим прямую регрессии.

График регрессии для примера выборочного уравнения регрессии

На графике видно, как располагаются наблюдаемые значения относительно линии регрессии. Для численной оценки отклонений yi от Yi, где yi наблюдаемые, а Yi определяемые регрессией значения, составим таблицу:

Таблица численной оценки отклонений по примеру выборочного уравнения регрессии

Значения Yi вычислены согласно уравнению регрессии. Заметное отклонение некоторых наблюдаемых значений от линии регрессии объясняется малым числом наблюдений. При исследовании степени линейной зависимости Y от X число наблюдений учитывается. Сила зависимости определяется величиной коэффициента корреляции.

Сила зависимости определяется величиной коэффициента корреляции

Смотреть видео 13, добавленное в раздел "Линейная и нелинейная корреляция"

Яндекс.Директ

Что будет с курсом завтра ?Учись играть на валютной бирже с нами !Уникальный Бесплатный курс !lp.forexac.com