Скачиваний:
114
Добавлен:
08.04.2015
Размер:
3.32 Mб
Скачать

f(x)

 

P(x< χ2γ) = γ = 1- α

α

 

χ2γ

x

Рис. П2.2.

Иногда квантили находят не из условия (П2.4), когда задается уровень некоторой «доверительной» вероятности или надежности – γ , а по заданному уровню значимости α , связанному с доверительной вероятностью соотношением – α =1 γ . В этом случае

квантиль уровня α обозначается символом χα2;n .

Для нахождения квантилей заданного уровня распределения хи-квадрат в Excel предусмотрена стандартная функция ХИ2ОБР

(…) – рис. П2.3, П2.4. Вызов функции: пункт меню Вставка ¾ Функция ¾ Категория «Статистические» ¾ ХИ2ОБР (…).

Рис. П2.3.

231

Рис. П2.4.

Для нахождения квантиля χ2α ,n в одной из ячеек рабочего листа Excel необходимо записать правую часть формулы

χ2α,n = ХИ2ОБР (α; n),

где α – уровень значимости, n – число степеней свободы.

Например, если необходимо вычислить квантиль распределения хи-квадрат для уровня значимости α = 0,05 (или, что тоже са-

мое – для уровня надежности γ =1α = 0,95 ) при числе степеней свободы n = 5, то в одной из ячеек рабочего листа Excel необходимо записать формулу: =ХИ2ОБР(0,05;5). После записи формулы и нажатия клавиши Enter в ячейке будет выведено численное значение квантиля, равное 11,0705.

f(x)

 

 

 

 

 

 

 

 

0,16

 

 

 

 

 

 

 

 

0,12

 

 

 

 

 

 

 

 

 

 

 

 

n=5

 

 

 

 

0,08

 

 

 

 

 

 

 

 

 

 

 

 

 

P(x >χ20,05; 5) = 0,05

 

0,04

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

0

2

4

6

8

10 χ20,05;512

14

16

18

 

 

 

Рис. П2.5.

 

 

 

232

Это означает – рис. П2.5, что, во-первых χ2 0,05; 5 =11,0705 и

P(x > χ02,05;5

) = 0,05 P(x >11,0705) = 0,05,

или

P(x < χ02,05;5 ) = 0,95 P(x <11,0705) = 0,95 .

П2.4. РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА

Распределением Стьюдента (t-распределением) называется распределение случайной величины

t =

 

Z

 

 

1

,

 

 

 

 

χ2

 

 

n

 

 

 

 

где Z ~ N (0;1) – нормально распределенная случайная величина с математическим ожиданием, равным нулю и дисперсией, равной единице, χ2 – независящая от Z случайная величина, имеющая хи-квадрат распределение с n степенями свободы.

График функции плотности вероятности для случайных величин x , имеющих распределение Стьюдента, показан на рис. П2.6. Как видно, характер кривой зависит от числа степеней свободы. С ростом числа степеней свободы, t-распределение приближается к нормальному. При n > 30 распределение Стьюдента может быть заменено на нормальное.

Распределение симметрично относительно начала координат и зависит только от одного параметра – числа степеней свободы n .

Основные числовые характеристики распределения Стьюдента:

yматематическое ожидание, мода и медиана равны нулю –

μ= 0;

yдисперсия существует только при n > 2 и равна

σ2 = n n 2 .

233

Pдов. = γ

0,5

 

 

 

 

 

 

 

 

 

 

n=30

 

 

0,4

 

 

 

 

 

 

0,3

 

 

 

n=2

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

0,1

 

 

 

 

 

 

0

 

 

 

 

 

 

-3

-2

-1

0

1

2

3

Рис. П2.6.

Аналитический вид функции плотности вероятности для случайных величин x , имеющих t-распределение, достаточно сложен и редко применяется для проведения непосредственных вычислений:

 

n +1

 

 

 

 

 

 

 

 

 

Γ

 

 

 

 

x2

 

n+1

 

 

 

 

 

 

 

 

 

 

 

f (x) =

2

 

 

2

 

 

 

 

 

1

+

 

 

,

(П2.4)

Γ(n / 2)

πn

n

 

 

 

 

 

 

 

 

где Γ(n) – функция специального вида, называемая гамма-функ-

цией [12].

Для нахождения нужных величин, связанных с распределением Стьюдента, составлены специальные таблицы.

Как и в случае распределения хи-квадрат, одна из основных задач, связанных с применением распределения Стьюдента, заключается в нахождении квантилей определенного уровня.

Чаще всего t-распределение применяют для построения доверительных интервалов. Для того, чтобы получить доверительный интервал, который с заданной вероятностью «накрывает»

истинное значение некоторого параметра θ , обычно конструиру-

ют или подбирают статистику – новую случайную величину, в

которую включают разность между θ и его оценкой θN . Например,

234

для получения доверительного интервала для генеральной средней (см. Приложение 3) используют статистику:

t =

(x μ)

N ,

(П2.5)

S

 

 

 

где x, S – оценки для среднего и стандартного отклонения – слу-

чайные величины, законы распределения которых известны, N – объем выборки, μ – неизвестный параметр – «истинное» математическое ожидание (генеральная средняя), не являющееся случайной величиной. Доказано, что случайная величина (П2.5) имеет t-распределение с N степенями свободы.

Наряду с заданием доверительной вероятности

Pдов. = γ,

обычно

используют понятие уровня значимости –

величину

α =1γ .

Эти две величины однозначно определяют друг друга.

Если доверительная вероятность Pдов. = γ = 0,95 , то уровень значимости α =1 γ = 0,05 . Часто задачу формулируют так: «построить доверительный интервал для неизвестного параметра, соответствующий доверительной вероятности P =1α ».

Границы доверительного интервала определяют границы, за пределы которых случайная величина выходит достаточно редко (с вероятностью, равной α). Поэтому значение α выбирают достаточно малым, полагая, например, α=0,05 или α=0,01. Содержательно это означает, что полученный для таких значений доверительный интервал, «накрывает» истинное значение параметра с вероятностью γ =1α = 0,95 или γ =1 α = 0,99 .

Задача построения доверительного интервала связана с нахо-

ждением его границ, т.е. квантилей определенного уровня, которые называют критическими значениями. Обычно рассматривают два случая – доверительный интервал расположен левее критического значения, либо доверительный интервал симметричен относительно центра распределения. Для распределения Стьюдента, как правило, рассматривают второй случай и находят два критических значения – квантили tα / 2;n и +tα / 2; n (рис. П2.7).

Для нахождения квантилей заданного уровня для распределения Стьюдента в Excel предусмотрена стандартная функция СТЬЮДРАСПОБР(…) – рис. П2.8, П2.9. Вызов функции: пункт

235

меню Вставка ¾ Функция ¾ Категория «Статистические» ¾

СТЬЮДРАСПОБР(…).

 

 

 

f(t)

 

 

 

γ = 1−α

α/2

 

α/2

t α/2,n

0

t

t α/2,n

 

Рис. П2.7.

 

Рис. П28.

236

Рис. П2.9.

Для того, чтобы найти квантиль tα / 2;n в одной из ячеек рабочего листа Excel необходимо записать правую часть формулы

tα / 2;n = СТЬЮДРАСПОБР (α; n),

где α – уровень значимости, n – число степеней свободы.

Например, если необходимо вычислить квантили распределения Стьюдента для уровня значимости α = 0,05 (т.е. для доверительной вероятности γ =1 α = 0,95 ) при числе степеней свободы n =11, то в одной из ячеек рабочего листа Excel необходимо записать формулу: =СТЬЮДРАСПОБР(0,05;11). После ввода формулы и нажатия клавиши Enter в ячейке будет получено численное значение квантиля t0,025;11 , равное 2,200985. Это означает, что

t0,025;11 = 2,200985 и

P(2,200985 < t < 2,200985) = 0,95

или

P(t > 2,200985 t < −2,200985) = 0,05 .

237

П2.5. РАСПРЕДЕЛЕНИЕ ФИШЕРА – СНЕДЕКОРА

 

(F-РАСПРЕДЕЛЕНИЕ)

Распределением Фишера – Снедекора или F-распределением

называется распределение случайной величины

 

1 χ

2 (k )

 

 

F = k1

1

 

 

 

,

 

1 χ

2 (k2 )

 

 

 

k2

 

 

где χ2 (k1 ) и χ2 (k2 ) – независимые случайные величины, имеющие

распределение хи-квадрат с k1 и k2 степенями свободы соответст-

венно. Распределение полностью определяется двумя параметрами

k1 , k2 – числами степеней свободы. Распределение Фишера – Сне-

декора находит широкое применение в задачах дисперсионного

анализа, в частности, задачах проверки гипотез о равенстве или

различии дисперсий.

 

 

График функции плотности вероятности для случайных вели-

чин, имеющих F- распределение, показан на рис. П2.9. Как видно,

характер кривой зависит от числа степеней свободы k1 и k2 . С рос-

том числа степеней свободы, F-распределение приближается к

нормальному. Распределение зависит от двух параметров – числа

степеней свободы k1 и k2 .

 

 

1

k1=1; k2=30

 

 

0,8

k1=10; k2=10

 

 

0,6

 

 

 

0,4

k1=10; k2=4

 

 

 

 

0,2

 

 

 

0

 

 

 

0

1

2

3

 

Рис. П2.9.

 

238

 

 

 

Основные числовые характеристики F-распределения:

 

y

математическое ожидание – μ =

k2

 

, существует только

 

k2 2

при k2 > 2 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k2 > 4 и равна

 

y

дисперсия

 

существует только

при

2

 

 

2k 2

(k

2

+ k 1)

 

 

 

σ =

 

2

 

 

 

1

 

 

.

 

 

 

k (k

2

2)2 (k

2

4)

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

Аналитический вид функции плотности вероятности для F- распределения достаточно сложен и редко применяется для проведения вычислений:

 

k

+ k

2

 

 

 

 

k1

 

 

 

k2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ

1

 

 

 

 

 

k 2

 

k

2

 

 

k

 

 

 

 

k

+k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (x) =

 

2

 

 

 

 

1

 

2

 

 

 

1

(k x + k )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 2

1

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

k

 

 

 

k

 

 

 

 

 

 

 

 

1

2

 

 

 

 

Γ

 

1

 

Γ

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

Одна из основных задач, связанных с применением F-распре- деления при проверке гипотез, заключается в нахождении квантилей заданного уровня.

Для нахождения квантилей заданного уровня F-распределе- ния в Excel предусмотрена стандартная функция FРАСПОБР(…) – рис. П2.10, П2.11. Вызов функции: пункт меню Вставка ¾ Функ-

ция ¾ Категория «Статистические» ¾ FРАСПОБР(…).

Для того, чтобы найти квантиль Fα;k1 ;k2 , в одной из ячеек рабочего листа Excel необходимо записать правую часть формулы

Fα;k1 ;k2 = FРАСПОБР(α; k1; k2),

где α – уровень значимости, k1 и k2 – число степеней свободы.

Например, если необходимо вычислить правосторонний квантиль F-распределения для уровня значимости α = 0,2 (т.е. для уровня надежности γ =1 α = 0,8) при числе степеней свободы k1 =10 и k2 =10, то в одной из ячеек рабочего листа Excel необходимо записать формулу:

= FРАСПОБР(0,2; 10; 10).

239

Рис. П2.10.

Рис. П2.11.

После ввода формулы и нажатия клавиши Enter в ячейке будет получено численное значение квантиля F0,2;10;10 , равное 1,7315. Это означает – рис. П2.12, что

F0,2;10;10 = 1,7315,

P(F >1,7315) = 0,2 ,

P(F <1,7315) = 0,8 .

240