
- •Курс «Математическая статистика»
- •Генеральная и выборочная совокупности
- •Статистический ряд
- •Статистическая функция распределения
- •Полигон и гистограмма
- •Характеристики генеральной совокупности
- •Характеристики статистического ряда
- •Статистические оценки параметров распределения
- •Оценка для математического ожидания
- •Оценка для дисперсии
- •Интервальные оценки параметров распределения
- •Доверительные оценки параметров нормального распределения
- •Доверительные интервалы для математического ожидания при известном среднем квадратическом отклонении
- •Доверительные интервалы для математического ожидания при неизвестном среднем квадратическом отклонении , распределение Стьюдента
- •Доверительный интервал для среднего
- •Построение нормальной кривой по опытным данным
- •Проверка гипотез нормальности распределения
- •Преобразование распределений к нормальному
- •Методы построения парных зависимостей по экспериментальным данным
- •Две основные задачи теории корреляции
- •Методы построения, преобразования и оценки парных зависимостей по экспериментальным данным
- •Парная корреляция Статистическое оценивание парной корреляции и регрессии
- •1.3.4. Корреляционная таблица
- •Построение прямых линий регрессии по сгруппированным данным
- •Свойства коэффициента корреляции
- •1.3.7. Упрощение вычисления выборочного коэффициента корреляции.
- •1.3.8. Выборочное корреляционное отношение
- •1.3.9. Нелинейная парная регрессия
- •1.3.10. Оценивание тесноты корреляционной связи
Методы построения парных зависимостей по экспериментальным данным
Часто требуется установить и оценить зависимость изучаемой СВ Y от одной или нескольких других величин. Рассмотрим сначала зависимость СВ Y от одной случайной или неслучайной величины Х.
Две случайные величины Y и Х могут быть связаны либо функциональной, либо статистической зависимостью, либо быть независимыми. Строгая функциональная зависимость реализуется в реальных процессах исключительно редко, т.к. обе величины или одна из них бывают подвержены еще и действию случайных факторов, причем среди них могут быть и общие для обеих величин. В этом случае возникает статистическая зависимость.
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой величины. Если при изменении одной из величин изменяется среднее значение другой величины, то в этом случае статистическую зависимость называют корреляционной.
П р и м е р
Y-урожай, Х-количество внесенных удобрений. С одинаковых площадей при равных количествах удобрений снимают различный урожай, т.е. Y не является функцией Х. Это объясняется влиянием случайных факторов (влажность, качество земли, температура воздуха и др.). Средний же урожай по множеству разных участков одинаковой площади является функцией от количества удобрений, т.е. Y связан с Х корреляционной зависимостью.
Пусть
каждому значению Х
соответствует несколько значений Y.
Например, при
величина Y
приняла значения:
,
,
.
Среднее арифметическое
.
- условное
среднее.
Черточка над
- обозначение среднего арифметического,
индекс 2 указывает на то, что рассматриваются
те значения Y,
которые соответствуют
.
Если каждому значению х соответствует одно значение условной средней, то условная средняя зависит от х, т.е. является функцией х. В этом случае говорят, что случайная величина Y зависит от Х корреляционно.
Корреляционной
зависимостью Y
от Х
называют функциональную зависимость
условной средней
от х:
.
Это уравнение называют уравнением
регрессии
Y
на Х;
функцию
- регрессией
Y
на Х,
а график этой функции – линией
регрессии
Y
на Х.
Две основные задачи теории корреляции
Первая
основная задача
– установить
форму корреляционной связи,
т.е. вид функции регрессии. Часто функции
регрессии являются линейными. Если
и
- линейные функции, то корреляцию называют
линейной, в противном случае имеем
нелинейную корреляцию. При линейной
корреляции – обе линии регрессии прямые.
Вторая задача теории корреляции - оценить тесноту корреляционной связи. Теснота корреляционной зависимости Y от Х оценивается по величине рассеяния значений Y вокруг условного среднего . Большое рассеяние – слабая зависимость Y от Х, либо отсутствие такой зависимости. Малое рассеяние – достаточно сильная связь Y с Х, возможно даже функциональная связь, которая оказалась размытой под воздействием второстепенных случайных факторов, в результате при одном и том же значении х величина Y принимает различные значения.