Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
титульник и теория курс раб.docx
Скачиваний:
28
Добавлен:
23.06.2016
Размер:
69.67 Кб
Скачать

2. Точечные оценки параметров распределения выборки

Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: варианты x1, … , xr и их частоты n1, … , nr.

Точечной называют оценку, которая определяется одним числом. Точечные оценки обычно используют в тех случаях, когда число наблюдений велико.

Выборочной средней xв называют среднее арифметическое значение вариант выборки. Если значения вариант x1, x2, … , xr имеют соответственно частоты n1, n2, … , nr, то

. (5)

Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонений вариант xi от их среднего значения xв, т.е.

. (6)

Выборочным средним квадратическим отклонением σв называют квадратный корень из выборочной дисперсии Dв

. (7)

Исправленную (несмещенную оценку) дисперсию s2 выборки получают по формуле

. (8)

Аналогично вводится исправленное среднее квадратическое отклонение s

. (9)

3. Интервальные оценки параметров распределения выборки

Интервальной называют оценку, которая задается в виде интервала. Интервальные оценки удобно использовать в тех случаях, когда число наблюдений n относительно невелико.

Пусть для неизвестного параметра θ количественного признака X генеральной совокупности статистическими методами найдено значение θ*. Зададимся точностью δ, т.е. | θ - θ* | < δ.

Надежностью оценки неизвестного параметра θ по вычисленному статистическими методами значению θ* называют вероятность γ, с которой выполняется неравенство| θ - θ* | < δ, при этом δ называется точностью оценки. В статистике обычно задаются надежностью γ и определяют точность δ.

Доверительным интервалом для параметра θ называют интервал (θ* - δ, θ* + δ), который покрывает неизвестный параметр θ с вероятностью γ:

P[θ* - δ <X < θ* + δ] = γ.

Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ неизвестно. Требуется оценить неизвестное математическое ожидание a по результатам выборки с заданной надежностью γ.

Доверительный интервал с уровнем надежности γ для математического ожидания a признака X, распределенного нормально, при неизвестном среднем квадратическом отклонении определяется как

, (10)

где xв – выборочное среднее; s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Точность оценки δ в этом случае . Значениеtγ = t(γ,n) можно найти из справочной таблицы ”Таблица значений tγ = t(γ,n)” для распределения Стьюдента.

Доверительный интервал с уровнем надежности γ для среднего квадратического отклонения σ признака X, распределенного нормально, определяется как

, (11)

где s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Значение q = q(γ,n) можно найти из справочной таблицы ”Таблица значений q = q(γ,n)” для распределения χ2.

В случае, когда q >1 доверительный интервал имеет вид

. (11') 4. Статистическая проверка статистических гипотез

Статистической называют гипотезу (предположение) о виде неизвестного распределения или о параметрах известного распределения. Основной или нулевой гипотезой H0 называют выдвинутую гипотезу о неизвестном распределении, вместе с основной H0 выдвигается и конкурирующая (альтернативная) гипотеза H1, противоречащая основной.

Основной принцип проверки статистических гипотез состоит в следующем:

в зависимости от вида гипотезы и характера неизвестного распределения вводится функция K, называемая критерием, по значениям ее будет приниматься решение о принятии или отклонении основной гипотезы H0. Вводится также уровень значимости α как вероятность того, что будет отвергнута верная нулевая гипотеза и принята неверная гипотеза H1.

Областью принятия гипотезы H0 называют те значения критерия K, при которых основная гипотеза H0 принимается, критической областью – отвергается. Для каждой выборки и конкретного вида критерия K по специальным таблицам находятся значения kкр, называемые критическими точками; критические точки отделяют область принятия гипотезы от критической области. Правосторонней называют критическую область, где K > kкр, левосторонней K < kкр и двусторонней (и симметричной) | K| > kкр.

Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: равноотстоящие с шагом h варианты x1, … , xr и их частоты n1, … , nr. Для нее подсчитаны по формулам (5-9) выборочное среднее xв и выборочное среднее квадратическое отклонение σв.

Для проверки гипотезы о нормальном распределении генеральной совокупности c уровнем значимости α используется критерий χ2 Пирсона:

(12)

Критическое значение χ2кр = χ2 (α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ2”. Здесь k = r - 3. Если вычисленное по результатам наблюдений по формуле (12) значение критерия χ2набл больше χ2кр, основная гипотеза отвергается, если меньше - нет оснований отвергнуть основную гипотезу.

Если варианты x1, x2, … , xr не являются равноотстоящими или число их сравнительно велико, удобно сгруппировать варианты в отдельные интервалы ( не обязательно равноотстоящие ) [x1*;x2*), [x2*;x3*), …, [xm-1*;xm*). Каждому интервалу назначается представительное значение, равное середине интервала xi.ср* = (xi* + xi-1*)/2 и частота ni*, равная сумме частот, попавших на интервал. В соответствии с критерием Пирсона, частоты ni*, попавшие на интервалы [xi* ; xi-1*), сравниваются с теоретическими частотами ni', вычисленными для соответствующих интервалов нормальной случайной величины Z с нулевым математическим ожиданием и единичным средним квадратическим отклонением (Z принадлежит N(0,1)).

, (13)

ni' = nPi, где n - обьем выборки;

Pi = Ф(zi+1) – Ф(zi), вероятности попадания X на интервал (xi*,xi+1*) или

Z на (zi,zi+1);

zi = (xi ср*–xв*) / σ*; i = 2,3,..,m-1; крайние интервалы открываем z1 = –∞,

zm = ∞, а Ф(zi) – значение функции Лапласа.

Критическое значение χ2кр = χ2 (α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ2”. Здесь k = m – 3. Если вычисленное по результатам наблюдений по формуле (13) значение критерия χ2набл меньше χ2кр, нет оснований отвергнуть основную гипотезу, если больше – основная гипотеза не принимается.

Для проверки гипотез о дисперсии σ2 генеральной совокупности с нормальным законом распределения при заданном уровне значимости α используется критерий

, (14)

где s2 – исправленная дисперсия выборки; n – объем выборки; σ02 – гипотетическое значение дисперсии.

А) Пусть выдвинута нулевая гипотеза H0: σ2 = σ02 о равенстве неизвестной генеральной дисперсии σ2 предполагаемому значению σ02 при конкурирующей гипотезе H1: σ2 ≠ σ02. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ2выб. Затем по таблице «Критические точки распределения χ2», по заданному уровню значимости α и числу степеней свободы k = n – 1 находятся левое критическое значение χ2лев.кр(1 – α/2;k) и правое критическое значение χ2прав.кр(α/2;k). Если при этом χ2лев.кр < χ2выб < χ2прав.кр, нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается. В противном случае принимается конкурирующая гипотеза и отвергается основная.

Б) Пусть теперь выдвинута нулевая гипотеза H0: σ2 = σ02 о равенстве неизвестной генеральной дисперсии σ2 предполагаемому значению σ02 при конкурирующей гипотезе H1: σ2 > σ02. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ2выб. Затем по таблице «Критические точки распределения χ2», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ2кр( α;k). Если при этом χ2выб < χ2кр, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.

В) Пусть теперь выдвинута нулевая гипотеза H0: σ2 = σ02 о равенстве неизвестной генеральной дисперсии σ2 предполагаемому значению σ02 при конкурирующей гипотезе H1: σ2 < σ02. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ2выб. Затем по таблице «Критические точки распределения χ2», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ2кр( 1- α;k). Если при этом χ2выб > χ2кр, нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается.

Для проверки гипотез неизвестной средней a генеральной совокупности с нормальным законом распределения с неизвестной дисперсией при заданном уровне значимости α используется критерий Стьюдента

, (15)

где xвыб – выборочное среднее; a0 гипотетическое значение средней; n – объем выборки; s – исправленное среднее квадратическое отклонение.

А) Пусть выдвинута нулевая гипотеза H0: a = a0 о равенстве неизвестной генеральной средней a предполагаемому значению a0 при конкурирующей гипотезе H1: a a0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) Tвыб. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится двустороннее критическое значение Tдвустор.кр(α;k). Если при этом | Tвыб | < Tдвустор.кр, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.

Б) Пусть теперь выдвинута нулевая гипотеза H0: a = a0 о равенстве неизвестной генеральной средней a предполагаемому значению a0 при конкурирующей гипотезе H1: a > a0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) Tвыб. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение Tправостор.кр(α;k). Если при этом Tвыб < Tправостор.кр, нет оснований отвергнуть основную гипотезу , а конкурирующая – отвергается.

В) Пусть теперь выдвинута нулевая гипотеза H0: a = a0 о равенстве неизвестной генеральной средней a предполагаемому значению a0 при конкурирующей гипотезе H1: a < a0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) Tвыб. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение Tправостор.кр(α;k) и полагают Tлевостор.кр = –Tправостор.кр. Если при этом Tвыб > Tлевостор.кр, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.