Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Mylnik_ISU / Мыльник_Исследование систем управления_2003.rtf
Скачиваний:
88
Добавлен:
12.02.2015
Размер:
45.79 Mб
Скачать

8.3. Корреляционный и регрессионный анализ

Для оценки степени связи двух характеристик в корреляционном анализе используется коэффициент корреляции. Оценка коэффициента корреляции по наблюдениям рассчитывается по формуле:

где

Значимость оценки определяется с помощью критерия Стьюдента: если

то оценка значима, и не значима в противном случае.

Величина выбирается из таблицы распределения Стьюдента [6] и отвечает уровню значимости а. (Для).

Для оценки характера связи в регрессионном анализе используется понятие функции регрессии. Оценка функции регрессии в нормальном случае производится по n наблюдениям по формуле

где

Доверительная область для линии регрессии r(х) определяется как:

где

К определяется по уровню значимости (для ).

В многомерном случае степень связи случайных величин ,Y определяется с помощью множественного коэффициента корреляции

Его оценка по n наблюдениям определяется как:

где – оценка функции множественной регрессииY пo

Оценка множественной регрессии в виде линейной функции находится методом наименьших квадратов:

Значимость оценок коэффициентов определяется из условий:

имеет распределение Стьюдента

имеет распределение Стьюдента

имеет распределение

Оценка коэффициента является значимой, если значение соответствующей статистики превосходит табличное значение, отвечающее заданному уровню значимости.

8.4. Робастные методы и процедуры

Многие «наилучшие» оценки в статистике (например, наиболее распространенная на практике оценка среднего значения случайной величины ) обладают тем дефектом, что они являются наилучшими лишь в случае, если выборка наблюдений получена из нормально распределенной совокупности данных и быстро теряют свои оптимальные свойства по мере отклонения распределения от нормального, то есть являются неустойчивыми к отклонениям от нормального распределения. В качестве характеристики устойчивости оценки можно предложить понятие робастности.

Определение робастности оценки. Пусть случайная величина X имеет плотность распределения вероятностей , где вид функцииf известен, а – неизвестный параметр (может быть величиной векторной). Оценка параметра производится по n наблюдениям . В классической статистике качество оценкиопределяется ее дисперсиейDf вычисленной в предположении, что выборка получена из генеральной совокупности с плотностью распределения вероятностей

Определим понятие -окрестности распределения f:

где – произвольная плотность распределения вероятностей.

Назовем оценку робастной, если для нее имеет место

То есть робастная оценка – это такая оценка, которая в наихудшем случае (когда достигается max ) имеет наименьшую дисперсию. Нахождение робастной оценки отвечает решению, как говорят в математике, минимаксной задачи. Минимаксное значениеесть гарантированный верхний порог дисперсии оценки для любого распределенияf из -окрестности.

Минимаксная стратегия широко распространена в таком разделе теории операций как теория игр. В определенном смысле робастная процедура – это «игра» исследователя с природой.

Робастная оценка среднего значения. Если параметр играет роль центра распределения (среднего значения), то . Робастная оценка параметра в этом случае находится по п наблюдениям решением следующей задачи:

Если – плотность вероятностей нормального распределения, то:

Робастная оценка в этом случае представляет собой некий гибрид оценки средней арифметической и выборочной медианы. Она совмещает в себе эффективность первой оценки и устойчивость второй. Их соотношение определяется величиной степени засорения ечерез величину. Если, то оценка близка к среднему арифметическому. Если, то оценка близка к выборочной медиане.

Робастная оценка имеет вид:

где – вариационный ряд выборочных значений;. Значенияможно найти в таблице 2 [6].

Таблица 2

Значения уровня урезания = ()

Робастная регрессия. Уравнение регрессии, получаемое методом наименьших квадратов, имеет существенный дефект, заключающийся в том, что при наличии грубых ошибок в данных оценки его коэффициентов сильно искажаются, то есть являются неустойчивыми к отклонениям от обычного предположения в регрессионном анализе, что ошибки в модели регрессииимеют нормальное распределение.

Коэффициенты робастной регрессии вычисляются решением задачи:

где (t) имеет вид (8.29).