- •7. Корреляционная зависимость. 39
- •8. Измерение связи. Регрессия. 42
- •Корреляционная зависимость.
- •Понятие о корреляционной зависимости.
- •Дисперсия суммы случайных величин. Корреляционный момент.
- •Теорема сложения дисперсий.
- •Коэффициент корреляции.
- •Оценка значимости коэффициента корреляции.
- •Измерение связи. Регрессия.
- •Понятие о регрессии. Уравнение регрессии.
- •Достоверность линии регрессии и коэффициентов регрессии.
- •Сравнение коэффициентов регрессии.
- •Криволинейные зависимости.
- •Коэффициент ранговой корреляции.
Лекция 5. (Осень 2000 г.)
7. Корреляционная зависимость. 39
7.1 Понятие о корреляционной зависимости. 39
7.2 Дисперсия суммы случайных величин. Корреляционный момент. 40
7.3 Теорема сложения дисперсий. 40
7.4 Коэффициент корреляции. 41
7.5 Оценка значимости коэффициента корреляции. 41
8. Измерение связи. Регрессия. 42
8.1 Понятие о регрессии. Уравнение регрессии. 42
8.2 Достоверность линии регрессии и коэффициентов регрессии. 42
8.3 Сравнение коэффициентов регрессии. 43
8.4 Криволинейные зависимости. 43
8.5 Коэффициент ранговой корреляции. 43
Корреляционная зависимость.
Понятие о корреляционной зависимости.
Наиболее простым видом связи между величинами является функциональная зависимость, когда какая-либо величина определяется как однозначная функция другой или нескольких других величин. С функциональной зависимостью часто встречаются в естествознании и технике (например, закон Ома, или , гдеС длина окружности,R радиус).
Но есть и такие связи, которые нельзя отнести к функциональным. Например, связь между ростом отцов и сыновей. Каждому значению одной величины соответствует множество значений другой величины. Случайный разброс этих возможных значений объясняется влиянием большого количество дополнительных факторов, от которых мы отвлекаемся, изучая связь между данными величинами. Такие зависимости называются стохастическими или корреляционными. Они характеризуются тем, что каждому значению любой из двух рассматриваемых величин соответствует определенное распределение вероятностей другой величины.
Понятие корреляционной зависимости распространяется также на качественные показатели, если наличию одного показателя соответствует определенная вероятность наличия, или отсутствия другого. Совокупность всех точек (опытных данных), иллюстрирующих характер зависимости одной величины от другой, называется полем корреляции. Экспериментальные графики для величин , находящихся в корреляционной зависимости состоят из ряда точек, не укладывающихся на какую-либо определенную кривую. Но некоторое общее представление о такой зависимости может дать линия, проходящая через средние значения величиныдля каждого. Эти средние значенияназываются условными средними, в отличие от общего среднего значения, не зависящего от. С увеличением числа опытных точек внутри рассматриваемого интервала измененияуказанная линия будет стремиться к некоторой предельной кривой соединяющей точки условных математических ожиданий величины(условных средних). Эта предельная кривая называетсялинией регрессии, а соответствующая ей функция-функцией регрессии по.
Название «линия регрессии» в статистику было введено английским математиком Гальтоном. Термин «регрессия», означающий «движение назад», был позаимствован из биологии. Исследуя статистические проблемы наследственности, Гальтон обнаружил возврат индивидуальных признаков внуков к средним показателям дедов и назвал этот показатель «регрессией».
Если поменять местами и, линия регрессии изменится.
Следовательно, в отличие от функциональной зависимости корреляционная зависимость между двумя величинами характеризуется двумя линиями регрессии.
В органической природе наблюдается сложное пересечение множества различных причин, взаимных влияний и их следствий, поэтому так часты в ней именно корреляционные, а не функциональные зависимости. В настоящее время изучение различных корреляций является важным разделом многих биологических дисциплин, поэтому возникает потребность в количественном измерении корреляции. Для этого служит ряд методов, наиболее распространенным из которых является вычисление количественной характеристики связи, то есть коэффициента корреляции. Остановимся на этом вопросе подробно.