2.2. Оценка реальности парной линейной связи и ее тесноты

Первоочередным вопросом построения линейной эмпирической зависимости является оценка реальности линейной связи (первое правило). Если связи нет, задача линейной аппроксимации не имеет решения, и оно прекращается.

Сложность оценки существования связи состоит в том, что она завуалирована случайным рассеянием переменных, то есть не очевидна.

2.2.1. Случайное рассеяние и неопределенность парной линейной связи

Причиной случайного рассеяния эмпирических данных является влияние множества неучитываемых факторов и ошибок измерений.

1. Случайное рассеяние при линейной зависимости проявляется в том, что каждое допустимое значение аргумента х обуславливает не определенную величину зависимой переменной у(х), а множество ее случайных значений (точек в системе координат х0у). Пример такого рассеяния переменных приведен на рис. 1А.

Множество случайных значений у(х) для каждого значения х образует статистическое распределение, а для ряда значения х – семейство распределений. На рис. 2 такое семейство распределений представлено семейством гистограмм, отвечающим некоторой линейной стохастической связи. Она проявляется в изменении закона распределения зависимой переменной, в частности математических ожиданий, при изменении аргумента.

2. Неопределенность стохастической связи в математической статистике понимается как показатель рассеяния (разброса) случайных величин, отсутствия у них общей тенденции. Возможны 3 случая (А, Б, В на рис. 2.2).

Рис. 2.2. Рассеяние переменных х и у относительно центра в случаях: А – отсутствия связи; Б – стохастической связи; В – функциональной связи (графики: 1 –значений х и у, 2 – тенденций рассеяния, 3 – средних значений у)

Графически, в системе декартовых координат, рассеяние случайных величин отображается множеством точек с общим центром . Чем хаотичнее разброс точек, чем менее оно подчинено общей тенденции, тем связь неопределеннее, то есть слабее. По смыслу неопределенность противоположна понятию реальности и силы связи, как поясняется рис. 2.2.

Рис. 2.2А отвечает рассеянию переменных х и у относительно центра при отсутствии общей тенденции группирования точек. Нельзя указать линию, проходящую через центр и отвечающую тенденции упорядочения точек, поэтому неопределенность рассеяния максимальна, связь отсутствует, задача линейной аппроксимации не имеет решения.

Рис. 2.2В отражает противоположный случай, когда нет рассеяния точек – все они строго подчиняются общей тенденции (принадлежат одной и той же прямой), то есть стохастическая связь вырождается в функциональную, и неопределенность отсутствует.

На рис 2.2Б – общий случай линейной стохастической связи, когда рассеяние точек имеет общую тенденцию, точки группируются в области, вытянутой в одном направлении, вдоль прямой, проходящей через центр и отвечающей линейной зависимости.

3. Коэффициент неопределенности, словесно определяется отношением

то есть долей рассеяния зависимой переменной у относительно модели (2.1) в общем рассеянии зависимой переменной у.

Иначе, коэффициент неопределенности – это отношение сумм квадратов:

. (2.6)

В числителе (2.6) – сумма квадратов разностей зависимой переменной у и модели (2.1), называемая остаточной суммой квадратов. В знаменателе – сумма квадратов отклонений y от ее среднего .

При отсутствии связи (рис. 2.2А) в группировании точек отсутствует общая тенденция, точки одинаково рассеяны относительно любой линии, проходящей через центр , в том числе линии средних значений . Поэтому отношение их рассеяний равно 1 – это максимальная величина коэффициента неопределенности.

Если точки группируются в области, вытянутой в некотором направлении, вдоль прямой, проходящей через центр и отвечающей линейной стохастической зависимости, то рассеяние y относительно нее меньше, чем относительно среднего значения (рис. 2.2Б), и коэффициент неопределенности (2.6) меньше 1.

При полном отсутствии неопределенности (рис. 2.2В) стохастическая связь вырождается в функциональную зависимость, поэтому все точки принадлежат модели (2.1), то есть относительно нее, рассеяния y нет, и коэффициент неопределенности (2.6) равен 0.

Таким образом, коэффициент неопределенности (2.6) изменяется соответственно ослаблению стохастической связи от 0 (при наиболее тесной – функциональной связи) до 1 (при отсутствии линейной связи).

<<< < Предыдущая 1 2 3 4 5 6 78 / 238 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
05.11.2018187.9 Кб3Элетронный УМК по курсу Введение в профессию (Х....doc
#
15.11.2018488.96 Кб3элфиз и элхим.DOC
#
26.11.20183.85 Mб14эльконин.doc
#
23.08.2019131.58 Кб0ЭМ5.doc
#
22.04.2019605.93 Кб1Эмиль Дюркгейм - Самоубийство.docx
#
14.08.20191.01 Mб6ЭММиМ_5.doc
#
14.09.2019238.63 Кб2эмпедокл.docx
#
01.08.20193.08 Mб1Энгдаль У. СТОЛЕТИЕ ВОЙНЫ.rtf
#
14.08.2019126.46 Кб0Энергетические ресурсы.doc
#
09.12.2018300.03 Кб3энциклопедия аргументов для сочинения №3.doc
#
06.12.2018280.58 Кб2Энциклопедия аргументов.doc