Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МОДЕЛИР_ЛЕКЦИИ.doc
Скачиваний:
11
Добавлен:
22.08.2019
Размер:
759.3 Кб
Скачать

4.5. Типовые распределения вероятностей

Рассмотрим важнейшие свойства тех законов распределения вероятностей, которые чаще всего используются в математической статистике для проверки гипотез и в других приложениях.

4.5.1. 2-распределение Пирсона (хи-квадрат).

Def. Пусть имеем набор независимых нормально распределенных случайных величин i с параметрами а = 0,  = 1. Тогда скалярная случайная величина имеет распределение Пирсона с n степенями свободы (n – параметр распределения). Будем обозначать это 2(n).

4.5.2. t-распределение Стьюдента и F-распределение Фишера

Def. Пусть ХN(0, 1) и Yn2(n) – независимые СВ. Тогда СВ

Имеет t-распределение Стьюдента с n степенями свободы.

Def. Пусть Хn2(n) и Ym2(m) – независимые СВ. Тогда СВ имеет F-распределение Фишера с n и m степенями свободы.

Рассмотрим два приложения t- и F-распределений к проверке статистических гипотез.

1. Пусть имеем выборку Х1, …, ХN, Хj  N(a, 2). Тогда СВ имеет t-распределение Стьюдента с N – 1 степенями свободы.

Это означает, что если СВ Х распределена нормально, то статистика Т может быть использована в качестве статистического критерия проверки гипотезы вида Н0: M[X] = a, где а – заданное число, причем знание  не требуется.

Пример. Масса Х пачки печенья должна быть равна 200 г. Выборочное взвешивание 25 пачек дало следующие оценки = 196.64 г, s2 = 36 г2. Выдерживается ли заданный вес пачки?

Решение. Выдвигаем гипотезу Н0: M[X] = 200. = –2.8. При  = 0.05 получаем VКР = (– , –ТКР), где ТКР = СТЬЮДРАСПОБР(0,05; 24) = 2,06. Значит ТВЫЧ VКР и гипотеза не верна, на фабрике не выдерживают необходимые параметры.

2. Пусть имеем две выборки: Х1, …, Хn; Хj  N(a1, ) и Y1, …, Ym; Yi  N(a2, ). Пусть , . Тогда СВ имеет F-распределение с n – 1 и m – 1 степенями свободы. В частности, при такое же распределение имеет СВ .

Таким образом СВ F можно использовать в качестве статистического критерия проверки гипотезы с критической областью ( FРАСПОБР(1 – ; n –1; m – 1); + ).

4.6. Регрессионный анализ: исследование свойств уравнения регрессии

Остаточная дисперсия

Def. Остаточной дисперсией уравнения регрессии называется величина

,

равная среднему квадрату отклонения экспериментальных данных от расчетных (k – число коэффициентов модели (4.1)).

Величина остаточной дисперсии позволяет оценить точность построенного уравнения. Из нескольких альтернативных вариантов модели при прочих равных условиях предпочтение следует отдавать уравнению, имеющему наименьшую остаточную дисперсию.

Методы, рассматриваемые далее, основаны на следующем допущении: экспериментальные ошибки независимы и распределены нормально.

Проверка значимости МНК-оценок

Def. Если bj = 0, то говорят, что МНК-оценка незначима.

Это означает, что член bj fj (x) не должен входить в модель (4.1).

Выдвинем гипотезу Н0: bj = 0. Можно доказать, что при допущении о нормальности экспериментальных ошибок при верной Н0 случайные величины

, j = 1, …, k, (4.4)

где = (ФTФ)–1 , а – диагональный элемент этой матрицы (см. формулу (4.3)), имеют распределение Стьюдента с числом степеней свободы  = N – k. Критическая область имеет двухстороннюю структуру: если > ТКРИТ, где ТКРИТ = СТЬЮДРАСПОБР(; N – k ), то гипотеза не верна и МНК-оценка значима.

Проверка эффективности регрессии. Пусть модель (4.1) содержит свободный член b0. Тогда имеет место формула

(уi )2 = (уi ) 2 +  2  QОБЩ = QОСТАТ + QРЕГР.

Предположим, что влияние на выходной параметр у контролируемых входных параметров хi незначимо на фоне случайных помех. Этот факт можно сформулировать в виде статистической гипотезы Н0: bj = 0  j  0. В отличие от предыдущего пункта, речь идет не об отдельных членах модели, а об уравнении в целом.

Def. Если гипотеза Н0 верна, то будем говорить, что модель (4.1) неэффективна.

Теорема. Если ошибки эксперимента независимы и распределены нормально, то при верной гипотезе о неэффективности модели (4.1) статистики QОСТАТ /2 и QРЕГР /2 независимы и распределены по законам 2(N – k) и 2 (k – 1), соответственно.

Это означает, что при верной гипотезе Н0: bj = 0  j 0 статистика

(4.5)

имеет распределение Фишера с числами степеней свободы k – 1 и N – k. Таким образом, для проверки эффективности модели (4.1) может быть использован статистический критерий (4.5) с правосторонней критической областью: если FВЫЧ > FРАСПОБР(1 – ; k –1; N – k) = FКРИТ, то гипотеза не верна и модель (4.1) эффективна.

Пример. Пусть объект характеризуется двумя входными параметрами х1 и х2. Имеем матрицу Х значений входных параметров и вектор у значений выхода:

; .

Построим по этим данным линейное уравнение регрессии у = b0 + b1 x1 + b2 x2.

Для этого запишем регрессионную матрицу и матрицы, связанные с ней:

; ; .

В результате решения системы вида (4.2):

,

получаем вектор МНК-оценок, а с его помощью найдем вектор расчетных значений у: ; .

Отсюда QОСТАТ = 0.667; QОБЩ = 48.75; QРЕГР = 48.083. Проверим эффективность модели. FВЫЧ = 36.06, при  = 0.05 будет FКРИТ = 199.5. Следовательно, модель неэффективна.

Оценим значимость коэффициентов. Для этого определим оценку дисперсионной матрицы С:

.

Отсюда имеем вектор значений критерия Стьюдента для МНК-оценок

при ТКРИТ = 12.706. Следовательно, все коэффициенты незначимы, модель получилась «нехорошей».

Исключим из уравнения член с минимальным значением |Тj|, т.е. b2 x2. Получим модель у =2.5 + 3.1 х1, которая является эффективной: FВЫЧ = 137.3, FКРИТ = 18.5. Новые значения критерия Стьюдента равны (3.45; 11.72) при ТКРИТ = 4.3. Следовательно, коэффициент при х1 значим, а свободный член “близок к значимому”. Получили приемлемую модель.