
- •Введение
- •Постановка задачи
- •Теоретическая часть
- •Часть 1. Исходные данные и их обработка
- •Расчет коэффициента корреляции
- •Гистограммы для признаков X и y
- •Графики эмпирических функций распределения X и y
- •Графики полигонов частот X и y
- •Часть 2. Исследование линейных зависимостей Метод наименьших квадратов
- •Исследование линейной зависимости
- •Список литературы
Исследование линейной зависимости
Одним из важнейших методов определения зависимости между X и Y является метод наименьших квадратов. Видя общее расположение точек, можно предположить, что эта зависимость линейная. Количество прямых, проходящих через заданную совокупность точек, бесконечно. Выберем оптимальную из них. Для этого суммарное отклонение между теоретическими и экспериментальными точками должно быть минимальным. Это отклонение мы найдем с помощью функции:
Метод нахождения минимального отклонения и есть метод наименьших квадратов. Это суммарное отклонение зависит от коэффициентов а и b функции Y, поэтому эти коэффициенты должны быть минимальными, то есть производная функции F(a, b) в этих точках равны нулю:
Пусть
N=100.
Получаем следующую систему:
Числа A, B, C и D считаем на компьютере. Используем данные расчетной таблицы и получаем систему уравнений с двумя неизвестными:
Далее, решая эту систему методом исключения переменных, получаем искомые числа a и b:
следовательно,
уравнение прямой примет вид:
Рис. 12. Уравнение линейной регрессии Y=-1,99X+2,85.
Аналогично ищем уравнение прямой вида:
Для этого суммарное отклонение между теоретическими и экспериментальными точками должно быть минимальным. Это отклонение мы найдем с помощью функции:
Суммарное отклонение зависит от коэффициентов c и d функции X, поэтому эти коэффициенты должны быть минимальными, то есть производная функции F(с, d) в этих точках равны нулю:
Пусть
N=100.
Получаем следующую систему:
Числа A, B, C и D считаем на компьютере. Используем данные расчетной таблицы и получаем систему уравнений с двумя неизвестными:
Далее, решая эту систему, получаем искомые числа c и d:
следовательно, уравнение прямой примет вид:
Рис. 13. Уравнение линейной регрессии X=-0,5Y+1,49.
Выборочные коэффициенты регрессии
и
:
Исследование квадратичной зависимости
Линейные связи являются основными, но нередко встречаются и нелинейные связи, хорошо описываемые параболой, гиперболой и т. д.
В этой курсовой работе рассмотрим еще одну регрессию в форме параболы, которая также может описывать отклонения точек от кривой.
Уравнение
регрессии в форме параболы второго
порядка имеет вид:
.
Суммарное отклонение зависит от
коэффициентов p,
q
и r
этой функции. Как и в предыдущем
исследовании, нам необходимо провести
оптимальную кривую, т. е. найти минимум
функции:
Известно, что минимум достигается в точках, где частные производные функции F(p, q, r) равны нулю. В нашем случае имеем:
Продифференцировав данную функцию, получим следующую систему:
Введем следующие обозначения
N=100.
Получаем следующую систему:
Числа A, B, C, D, E, F, G считаем на компьютере. При решении используем данные расчетной таблицы и получаем систему уравнений с тремя неизвестными:
Решаем данную систему, получаем искомые числа:
следовательно, искомое уравнение параболической регрессии имеет вид:
Рис. 14. Уравнение параболической регрессии Y = 0,006X2-2,11X+3,28.
Вывод
В данной работе при помощи статистических методов были прослежены закономерности и связи между двумя дискретными случайными величинами X и Y.
Для этих величин были посчитаны числовые характеристики дискретных случайных величин, построены гистограммы распределения частот, приведены диаграммы рассеивания с линиями регрессии, а также корреляционная таблица и таблица статистической зависимости между случайными величинами X и Y.
В результате было научно доказано существование зависимости между X и Y. При возрастании X возрастает Y и наоборот.
Было выяснено, что данная зависимость очень хорошо описывается как линейной, так и квадратичной функциями. По сравнению статистик становится ясно, что наилучшим образом это делается при квадратичной зависимости, но ввиду больших и сложных вычислений можно остановиться на линейной функции, т. к. в данной работе различие между описываемыми функциями не существенно.