- •Министерство Российской Федерации
- •Академия гражданской защиты
- •Методы статистической обработки результатов выборки
- •0. Выборка и способы ее задания
- •Графические элементы анализа
- •2. Точечные оценки параметров распределения выборки
- •3. Интервальные оценки параметров распределения выборки
- •Заключение.
- •Литература
2. Точечные оценки параметров распределения выборки
Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: варианты x1, … , xr и их частоты n1, … , nr.
Точечной называют оценку, которая определяется одним числом. Точечные оценки обычно используют в тех случаях, когда число наблюдений велико.
Выборочной средней xв называют среднее арифметическое значение вариант выборки. Если значения вариант x1, x2, … , xr имеют соответственно частоты n1, n2, … , nr, то
. (5)
Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонений вариант xi от их среднего значения xв, т.е.
. (6)
Выборочным средним квадратическим отклонением σв называют квадратный корень из выборочной дисперсии Dв
. (7)
Исправленную (несмещенную оценку) дисперсию s2 выборки получают по формуле
. (8)
Аналогично вводится исправленное среднее квадратическое отклонение s
. (9)
3. Интервальные оценки параметров распределения выборки
Интервальной называют оценку, которая задается в виде интервала. Интервальные оценки удобно использовать в тех случаях, когда число наблюдений n относительно невелико.
Пусть для неизвестного параметра θ количественного признака X генеральной совокупности статистическими методами найдено значение θ*. Зададимся точностью δ, т.е. | θ - θ* | < δ.
Надежностью оценки неизвестного параметра θ по вычисленному статистическими методами значению θ* называют вероятность γ, с которой выполняется неравенство| θ - θ* | < δ, при этом δ называется точностью оценки. В статистике обычно задаются надежностью γ и определяют точность δ.
Доверительным интервалом для параметра θ называют интервал (θ* - δ, θ* + δ), который покрывает неизвестный параметр θ с вероятностью γ:
P[θ* - δ <X < θ* + δ] = γ.
Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ неизвестно. Требуется оценить неизвестное математическое ожидание a по результатам выборки с заданной надежностью γ.
Доверительный интервал с уровнем надежности γ для математического ожидания a признака X, распределенного нормально, при неизвестном среднем квадратическом отклонении определяется как
, (10)
где xв – выборочное среднее; s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Точность оценки δ в этом случае . Значениеtγ = t(γ,n) можно найти из справочной таблицы ”Таблица значений tγ = t(γ,n)” для распределения Стьюдента.
Доверительный интервал с уровнем надежности γ для среднего квадратического отклонения σ признака X, распределенного нормально, определяется как
, (11)
где s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Значение q = q(γ,n) можно найти из справочной таблицы ”Таблица значений q = q(γ,n)” для распределения χ2.
В случае, когда q >1 доверительный интервал имеет вид
. (11') 4. Статистическая проверка статистических гипотез
Статистической называют гипотезу (предположение) о виде неизвестного распределения или о параметрах известного распределения. Основной или нулевой гипотезой H0 называют выдвинутую гипотезу о неизвестном распределении, вместе с основной H0 выдвигается и конкурирующая (альтернативная) гипотеза H1, противоречащая основной.
Основной принцип проверки статистических гипотез состоит в следующем:
в зависимости от вида гипотезы и характера неизвестного распределения вводится функция K, называемая критерием, по значениям ее будет приниматься решение о принятии или отклонении основной гипотезы H0. Вводится также уровень значимости α как вероятность того, что будет отвергнута верная нулевая гипотеза и принята неверная гипотеза H1.
Областью принятия гипотезы H0 называют те значения критерия K, при которых основная гипотеза H0 принимается, критической областью – отвергается. Для каждой выборки и конкретного вида критерия K по специальным таблицам находятся значения kкр, называемые критическими точками; критические точки отделяют область принятия гипотезы от критической области. Правосторонней называют критическую область, где K > kкр, левосторонней K < kкр и двусторонней (и симметричной) | K| > kкр.
Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: равноотстоящие с шагом h варианты x1, … , xr и их частоты n1, … , nr. Для нее подсчитаны по формулам (5-9) выборочное среднее xв и выборочное среднее квадратическое отклонение σв.
Для проверки гипотезы о нормальном распределении генеральной совокупности c уровнем значимости α используется критерий χ2 Пирсона:
(12)
Критическое значение χ2кр = χ2 (α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ2”. Здесь k = r - 3. Если вычисленное по результатам наблюдений по формуле (12) значение критерия χ2набл больше χ2кр, основная гипотеза отвергается, если меньше - нет оснований отвергнуть основную гипотезу.
Если варианты x1, x2, … , xr не являются равноотстоящими или число их сравнительно велико, удобно сгруппировать варианты в отдельные интервалы ( не обязательно равноотстоящие ) [x1*;x2*), [x2*;x3*), …, [xm-1*;xm*). Каждому интервалу назначается представительное значение, равное середине интервала xi.ср* = (xi* + xi-1*)/2 и частота ni*, равная сумме частот, попавших на интервал. В соответствии с критерием Пирсона, частоты ni*, попавшие на интервалы [xi* ; xi-1*), сравниваются с теоретическими частотами ni', вычисленными для соответствующих интервалов нормальной случайной величины Z с нулевым математическим ожиданием и единичным средним квадратическим отклонением (Z принадлежит N(0,1)).
, (13)
ni' = nPi, где n - обьем выборки;
Pi = Ф(zi+1) – Ф(zi), вероятности попадания X на интервал (xi*,xi+1*) или
Z на (zi,zi+1);
zi = (xi ср*–xв*) / σ*; i = 2,3,..,m-1; крайние интервалы открываем z1 = –∞,
zm = ∞, а Ф(zi) – значение функции Лапласа.
Критическое значение χ2кр = χ2 (α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ2”. Здесь k = m – 3. Если вычисленное по результатам наблюдений по формуле (13) значение критерия χ2набл меньше χ2кр, нет оснований отвергнуть основную гипотезу, если больше – основная гипотеза не принимается.
Для проверки гипотез о дисперсии σ2 генеральной совокупности с нормальным законом распределения при заданном уровне значимости α используется критерий
, (14)
где s2 – исправленная дисперсия выборки; n – объем выборки; σ02 – гипотетическое значение дисперсии.
А) Пусть выдвинута нулевая гипотеза H0: σ2 = σ02 о равенстве неизвестной генеральной дисперсии σ2 предполагаемому значению σ02 при конкурирующей гипотезе H1: σ2 ≠ σ02. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ2выб. Затем по таблице «Критические точки распределения χ2», по заданному уровню значимости α и числу степеней свободы k = n – 1 находятся левое критическое значение χ2лев.кр(1 – α/2;k) и правое критическое значение χ2прав.кр(α/2;k). Если при этом χ2лев.кр < χ2выб < χ2прав.кр, нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается. В противном случае принимается конкурирующая гипотеза и отвергается основная.
Б) Пусть теперь выдвинута нулевая гипотеза H0: σ2 = σ02 о равенстве неизвестной генеральной дисперсии σ2 предполагаемому значению σ02 при конкурирующей гипотезе H1: σ2 > σ02. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ2выб. Затем по таблице «Критические точки распределения χ2», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ2кр( α;k). Если при этом χ2выб < χ2кр, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.
В) Пусть теперь выдвинута нулевая гипотеза H0: σ2 = σ02 о равенстве неизвестной генеральной дисперсии σ2 предполагаемому значению σ02 при конкурирующей гипотезе H1: σ2 < σ02. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ2выб. Затем по таблице «Критические точки распределения χ2», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ2кр( 1- α;k). Если при этом χ2выб > χ2кр, нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается.
Для проверки гипотез неизвестной средней a генеральной совокупности с нормальным законом распределения с неизвестной дисперсией при заданном уровне значимости α используется критерий Стьюдента
, (15)
где xвыб – выборочное среднее; a0 гипотетическое значение средней; n – объем выборки; s – исправленное среднее квадратическое отклонение.
А) Пусть выдвинута нулевая гипотеза H0: a = a0 о равенстве неизвестной генеральной средней a предполагаемому значению a0 при конкурирующей гипотезе H1: a ≠ a0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) Tвыб. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится двустороннее критическое значение Tдвустор.кр(α;k). Если при этом | Tвыб | < Tдвустор.кр, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.
Б) Пусть теперь выдвинута нулевая гипотеза H0: a = a0 о равенстве неизвестной генеральной средней a предполагаемому значению a0 при конкурирующей гипотезе H1: a > a0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) Tвыб. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение Tправостор.кр(α;k). Если при этом Tвыб < Tправостор.кр, нет оснований отвергнуть основную гипотезу , а конкурирующая – отвергается.
В) Пусть теперь выдвинута нулевая гипотеза H0: a = a0 о равенстве неизвестной генеральной средней a предполагаемому значению a0 при конкурирующей гипотезе H1: a < a0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) Tвыб. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение Tправостор.кр(α;k) и полагают Tлевостор.кр = –Tправостор.кр. Если при этом Tвыб > Tлевостор.кр, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.