Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебн. пособия-ОНИ / 1. Данько В.М._Алчевск-06

.pdf
Скачиваний:
125
Добавлен:
18.05.2015
Размер:
606.4 Кб
Скачать

Лекция № 10 10.1 Выборочные распределения

Выборочное распределение – это распределение какой-либо статистики, полученное в результате отбора различных случайных выборок из одной и той же генеральной совокупности и расчета по ним числовых значений этой статистики.

На рисунке 10.1 показаны распределение исходной случайной величины х и распределение статистки g, полученное из генеральной совокупности исходной случайной величины х.

р(х)

ГС х

g3

x

х

g1

gn

р(g)

 

 

g2

 

g

Рисунок 10.1 – Выборочное распределение

Выборочные распределения в обобщенном виде отражают вариации того или иного параметра всех возможных случайных выборок данного объема N. На практике редко берется более одной выборки. Поэтому выборочные распределения являются теоретическим поняти-

71

ем, которое используется для того, чтобы по результатам одной выборки оценить степень достоверности полученного числового значения оцениваемого параметра.

Для каждого из статистических параметров, таких, как μ(х), σ2(х) и т.д. можно построить свои выборочные распределения. Наиболее важными из них являются распределения, связанные со средними и дисперсиями.

10.2 Распределение Стьюдента

Служит для изучения вероятностных характеристик выборочных средних. Из того факта, что каждая выборка отбирается из генеральной совокупности случайным образом, следует, что для распределения средних справедливо следующее:

1. Среднее значение распределения равно среднему в генеральной совокупности

g(xi ) = μ(x)

2. Его стандартное (среднеквадратичное) отклонение равно σ(x)N ,

где σ2 (x) – дисперсия исходной генеральной совокупности.

3. Его форма будет близкой к «колоколу» нормального распределения, если объемы выборок не слишком малы.

Эти положения хорошо подтверждаются опытом при обобщении эмпирически полученных выборочных распределений.

На практике нам не известны ни μ(х), ни σ2(х). По выборочным данным можно рассчитать только их оценки x и s2 (x) . Эти данные не дают оснований считать, что выборочное распределение является нор-

мальным со стандартным отклонением s(x)N (на самом деле его стан-

дартное отклонение неизвестно и равно σ(x)N ). В таком случае воз-

72

никает проблема: как описать выборочное распределение?

Решение этой проблемы было дано в 1908г. У.Госеттом, который публиковал свои работы под псевдонимом «Стьюдент». Это было первым серьезным достижением в статистическом анализе малых выборок. Госетт показал, что статистика

x

 

t = s(x) N

(10.1)

подчиняется так называемому t-распределению (которое стали называть распределением Стьюдента) с числом степеней свободы (ЧСС), равным ν. Это означает, что данное распределение зависит только от одного параметра – ν, который легко находится по объему выборки. Оно имеет очень сложную формулу плотности распределения

p(t) =

где ! – знак факториала.

 

 

 

æ n - 1

ö

 

 

 

 

 

 

 

ç

2

 

÷!

 

 

 

 

 

 

 

è

 

ø

 

 

 

 

 

(10.2)

 

 

 

 

 

æ

 

 

2

ö

ν+1

 

 

 

 

 

 

 

 

 

 

 

 

æ n - 2

ö

 

t

2

 

 

 

 

ç

 

 

÷

 

 

 

 

pnç

 

÷!× 1 +

 

 

÷

 

 

 

 

è 2

ø

ç

 

n

 

 

 

 

è

 

ø

 

 

 

Число степеней свободы – параметр, равный объему выборки минус число оцениваемых по этой выборке параметров.

Для t-распределения ЧСС ν = N-1.

График функции плотности t-распределения симметричен относительно оси ординат и с ростом ν приближается к кривой нормального распределения (рис.10.2). При малых ν t- распределение заметно отличается от нормального своей большой рассеянностью значений относительно центра распределения. Для того, чтобы распределение Стьюдента не слишком отличалось от нормального, объемы выборок

73

должны быть не очень малыми (N ³ 10).

p(t)

Нормальное распределение

ν = 8

ν = 4

t

Рисунок 10.2 – Распределение Стьюдента

Это следует из того, что у нормального распределения 95% наблюдаемых значений заключено в интервале ± 2σ , а для распределения Стьюдента при N=10 – в пределах ± 2,2σ . Т.о. даже для относительно небольших выборок расчет дисперсии по выборочным данным не может сильно исказить оценку математического ожидания.

Практическое значение распределения Стьюдента в том, что:

1.Найден точный ответ на вопрос о характере выборочного распределения средних для выборок небольшого объема.

2.Обосновано положение о том, что разница между распределением средних и нормальным распределением невелика. Нормальное рас-

пределение может служить хорошей аппроксимацией даже в том слу-

чае, когда вместо σ(x)N приходится использовать s(x)N .

3. Получена возможность выяснения вероятностных свойств выбороч-

ных средних, когда дисперсия σ2 (x) неизвестна.

4. Статистика (8.1) может использоваться до отбора выборки для вы-

74

движения различных гипотез относительно выборочных средних, в частности, при интервальном оценивании.

10.3 Распределение c2 (хи-квадрат)

Это распределение, называемое также распределением Пирсона, используется при изучении вероятностных свойств выборочных дисперсий.

Если s2(x) – дисперсия случайной величины по выборке из генеральной совокупности с дисперсией σ2(х) и неизвестным μ(х), то статистика

c

2

=

(N - 1)s2 (x)

(10.3)

 

s2 (x)

 

 

 

 

подчиняется так называемому χ2 – распределению с единственным параметром ν = N-1.

Распределение хи-квадрат возникает при рассмотрении случайной величины

c2 = u12 + u22 + Ku2N ,

где ui - независимые нормально распределенные случайные величины с μ(u) = 0 и σ2(u) = 1.

Функция плотности распределения χ2 , подобно функции плотности t-распределения, имеет очень сложную структуру

p(c2 )=

 

 

 

1

 

 

 

 

 

 

 

 

ν

æ n - 2

ö

 

2 2

 

ç

2

÷!

 

 

 

è

ø

χ2

ν−2

(c2 ) 2 e 2 (10.4)

Графики функции плотности этого распределения показаны на рисун-

ке 10.3:

75

р(χ2)

ν =1

ν = 3

ν = 5

ν = 6

χ2

Рисунок 10.3 – Распределение χ2

По рисунку 10.3 видно, что с ростом объема выборки χ2- распределение очень быстро становится похожим на нормальное. Область определения функции р(χ2) – от 0 до + . При малых ЧСС она асимметрична, но с ростом ν она становится более пологой и симметричной. При N → ∞ распределение стремится к нормальному с параметрами

μ(χ2 )= ν и σ2 (χ2 )= 2ν .

Распределение хи-квадрат применяется для описания вероятностных свойств эмпирических дисперсий. При помощи статистики (10.2) можно осуществлять интервальное оценивание эмпирической дисперсии s2(х), если до опыта известно σ2(х), а μ(х) – неизвестно

2

 

(N 1)s2 (x)

2

 

χν,α =1

q

 

≤ χν,α =1

q ,

σ2 (x)

 

 

 

 

где α - уровень значимости критерия (см. лекцию №

9).

10.4 Распределение Фишера

Служит для сравнения дисперсий разных статистических совокупностей разных случайных величин х1 и х2. Ему подчиняется стати-

76

стика

F =

s2

(x1 )

(10.5)

s2

(x2 )

 

где s2(x1) > s2(x2).

Распределение Фишера зависит от двух параметровчисел степеней свободы каждой совокупности

n1 = N1 - 1; n2 = N2 - 1.

Функция плотности этого распределения имеет довольно сложную структуру

 

 

æ n

1

+ n

2

- 2 ö

(

ν1 2

)

 

(

ν1

)

 

 

(

ν2

)

 

 

 

 

 

2

 

 

2

 

 

 

 

2

n

n

 

 

 

 

ç

 

 

 

 

÷

!F

 

1

 

 

 

 

 

p(F) =

 

è

 

 

2

 

 

 

ø

 

 

 

 

 

 

 

 

2

 

 

(10.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

æ n

 

- 2 ö

æ n

 

- 2 ö

 

 

 

 

 

 

 

ν

1 2

 

 

ç

 

1

2

÷!ç

 

2

2

÷!(n2 + n1F)(

 

 

2

 

)

 

 

è

 

 

ø

è

 

 

ø

 

 

 

 

 

 

 

 

 

 

 

 

 

Ее область определения: от 0 до +∞ .С увеличением ЧСС первоначально асимметричная кривая начинает приближаться по форме к кривой нормального распределения (рис.10.4).

р(F)

ν1 =2, ν2 = 3

ν1 =3, ν2 = 5

ν1 =12, ν2 = 12

F

Рисунок 10.4 – Распределение Фишера

77

Имеются многочисленные таблицы, облегчающие применение F-распределения. Оно применяется для выдвижения статистических гипотез об отношениях выборочных дисперсий до извлечения выборок, например для определения интервала, в котором с заданной доверительной вероятностью будет заключено данное отношение.

78

Лекция № 11 11.1 Статистические гипотезы

Как известно, одной из двух основных задач математической статистики является проверка статистических гипотез.

Статистическая гипотеза – это некоторое предположение о свойствах генеральной совокупности, из которой извлекается выборка.

Это может быть предположения о том, что некоторый параметр θ генеральной совокупности равен определенному числу, или что не-

которые параметры двух разных совокупностей равны (или не равны) друг другу и т.п.

Например: дисперсия генеральной совокупности равна нулю: σ2(х) = 0; или математические ожидания разных генеральных совокупностей не равны друг другу: μ(х1) ≠ μ(х2).

Поскольку выборочные аналоги параметров θ генеральных со-

вокупностей являются их оценками θ , то они позволяют выдвигать определенные предположения о величинах θ и их соотношениях.

Например, если s2(х) = 0,0012, то естественно предположить, что в генеральной совокупности оно будет точно равна нулю, а отклонение выборочной дисперсии от нуля обусловлено случайными причинами.

Проверка статистических гипотез осуществляется при помощи статистических критериев, позволяющих принимать или отбрасывать данную гипотезу на основе выборочных данных.

Характерной особенностью статистических критериев является то, что они могут устанавливать только отличие, но не тождественность чего-то относительно рассматриваемых признаков. Это следует из природы индуктивного вывода. Поэтому любая статистическая ги-

79

потеза состоит из двух частей: нулевой гипотезы и альтернативной гипотезы.

Нулевой гипотезой (или нуль-гипотезой) называется предположение о равенстве параметра θ какому-то числу или о равенстве некоторых параметров двух генеральных совокупностей друг другу.

Записывается в виде:

Н0: θ = m0; или Н0: θ 1= θ 2

Например: Н0: μ(х) = 0; или σ21) = σ22).

Поскольку для доказательства Н0 требуется исследование всей генеральной совокупности, то она отбрасывается, если оказывается верным противоположное предположение, записываемое в виде альтернативной гипотезы:

Н1: θ ≠ m0; или Н1: θ 1 > θ 2 или Н1: θ 1 < θ 2 и т.д. Альтернативная гипотеза выдвигается на основе выборочных

данных. Если в выборке, например, x1 > x2 , то и в генеральной сово-

купности μ(x1 )> μ(x2 ).

Полная запись статистической гипотезы имеет вид:

Н0: θ = m0;

или Н0: θ 1= θ 2

Н1: θ

Н1: θ 1> θ 2 и т.д.

11.2 Проверка статистических гипотез

Для проверки статистических гипотез используются статистики, называемые статистическими критериями или иначе – критериями значимости. В частности, для проверки гипотез о математическом ожидании применяется критерий Стьюдента, о дисперсии – критерий χ2, а

для сравнения дисперсий – критерий Фишера.

80