
- •Министерство образования и науки Российской Федерации
- •1. Основные понятия и задачи
- •1.1. Основные задачи теории корреляции
- •1.2. Задачи регрессионного анализа
- •1.3. Корреляционная таблица
- •1.4. Выборочное уравнение прямой линии регрессии по сгруппированным данным. Выборочный коэффициент корреляции
- •1.5. Свойства выборочного коэффициента корреляции
- •1.6. Точечная и интервальная оценки коэффициентов корреляции нормально распределенной генеральной совокупности
- •1.7. Проверка гипотезы о значимости выборочного коэффициента корреляции
- •1.8. Корреляционное отношение
- •1.9. Свойства корреляционного отношения
- •1.10. Проверка однородности нескольких дисперсий, найденных по выборкам одинаковых объемов
- •1.11. Проверка однородности нескольких дисперсий, найденных по выборкам различного объема
- •1.12. Проверка адекватности регрессионной модели
- •1.13. Порядок проверки адекватности модели
- •1.14. Коэффициент детерминации
- •2. Пример выполнения расчетно-графической работы
- •2.1. Определение основных параметров случайных величин и
- •2.2. Построение корреляционной таблицы
- •2.3. Проверка однородности дисперсий случайных величин ипо критерию Бартлетта
- •2.4. Построение линейной регрессионной модели
- •2.5. Точечная и интервальная оценки коэффициента корреляции генеральной совкупности
- •2.6. Проверка гипотезы о значимости выборочного коэффициента корреляции
- •2.7. Вычисление корреляционных отношений
- •2.8. Построение квадратичной регрессионной модели по методу наименьших квадратов
- •2.9. Нахождение средней квадратической ошибки уравнения
- •2.10. Интервальные оценки параметров квадратичной линии регрессии генеральной совокупности
- •2.11. Нахождение коэффициента детерминации
- •2.12. Проверка адекватности регрессионной модели
- •Список литературы:
1.2. Задачи регрессионного анализа
Регрессионный анализ – анализ функции регрессии. С его помощью решаются следующие задачи:
Находят точечные и интервальные оценки параметров элементарной функции регрессии.
Производят точечные и интервальные оценки, необходимые для предсказания средних значений одной случайной величины, соответствующие функциональной зависимости от другой величины.
Производят согласование найденной элементарной функции с экспериментальными данными.
1.3. Корреляционная таблица
При большом
количестве наблюдений одного и того же
значения, значение
может встретиться
раз, одно и то же значение
–
раз. Одна и та же пара чисел
может встретиться
раз. Поэтому данные наблюдений
группируются, то есть подсчитываются
частоты
,
,
.
Все сгруппированные данные записываются в виде таблицы, которую называют корреляционной. Интервалы одной случайной величины записывают в первый столбец корреляционной таблицы, а интервалы другой случайной величины – в первую строку.
По каждой паре
значений
решают в какую строку и в какой столбец
они попадают. В клетку, стоящую на
пересечении соответствующих строки и
столбца, ставят точку. Так поступают со
всеми парами чисел
.
Затем подсчитывают точки во всех клетках
и записывают соответствующим числом
.
Далее суммируют
числа
по строкам и столбцам и находим
и
.
Замечание.
.
Для каждого столбца
необходимо найти условное среднее
,
а для каждой строки
.
1.4. Выборочное уравнение прямой линии регрессии по сгруппированным данным. Выборочный коэффициент корреляции
Для отыскания
параметров прямой линии регрессии
по несгруппированным данным по методу
наименьших квадратов получена система:
(1)
где
– коэффициент регрессии.
Пусть получено большое число данных (для удовлетворительной оценки искомых параметров количество наблюдений должно быть не менее 50). Среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Запишем соотношение (1) так, чтобы оно отражало данные корреляционной таблицы.
;
;
;
;
;
;
.
Учтено, что пара
чисел наблюдалась
раз. Поставив все это в систему (1) будем
иметь
(2)
Решив эту систему,
найдем параметры
и
и тем самым найдем уравнение регрессии
.
Однако целесообразно, введя новую величину – коэффициент корреляции, найти уравнение регрессии в ином виде.
Из 2-го уравнения
системы выразим
:
.
Подставив правую часть этого уравнения
в уравнение
получим
;
.
(3)
Найдем из системы
(2) коэффициент корреляции
:
,
(4)
где
– среднее квадратическое отклонение
СВ
.
Умножая обе части
равенства на дробь
,
получим выборочный коэффициент корреляции
(5)
Выборочный коэффициент корреляции служит для оценки тесноты линейной корреляционной зависимости.
Отсюда выборочное
уравнение прямой линии регрессии
на
имеет вид
.
(6)
Аналогично находят второе уравнение прямой линии регрессии
.
(7)
1.5. Свойства выборочного коэффициента корреляции
Абсолютная величина выборочного коэффициента корреляции не превосходит 1 (
).
Если выборочный коэффициент корреляции равен 0 и выборочные линии регрессии – прямые линии, то
и
не связаны линейной корреляционной зависимостью и
,
.
В этом случае прямые линии регрессии параллельны соответственно координатным осям.
Замечание.
Если выборочный коэффициент корреляции
,
то признаки
и
могут быть связаны нелинейной
корреляционной или даже функциональной
зависимостью.
Если абсолютная величина
, то наблюдаемые значения признаков связаны линейной функциональной зависимостью.
С возрастанием абсолютной величины выборочного коэффициента корреляции линейная корреляционная зависимость становится более тесной и при
переходит в функциональную.
Величина коэффициента
корреляции характеризует силу линейной
связи между признаками ():
если
– связь слабая;
если
– связь умеренная;
если
– связь заметная;
если
– связь высокая;
если
– связь весьма высокая;
если
– связь функциональная.
5. Знак выборочного
коэффициента корреляции совпадает со
знаком выборочного коэффициента
регрессии:
,
и определяет направление связи. Если
– связь прямая,
– связь обратная.
Перемножим первое
и второе равенства
;
.
Знак при радикале
должен совпадать со знаком коэффициента
регрессии, т.е.
,
если
;
,
если
.
Выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрессий.