Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зайцев_книга2[1].doc
Скачиваний:
780
Добавлен:
15.03.2015
Размер:
8.87 Mб
Скачать
    1. Асимметрия и эксцесс

Существеное значение для оценки групп статистического наблюдения такие характеристики распределения, как асимметрия (Skewness) и эксцесс.

На представленном рисунке (Рисунок 95) полигон частот имеет явно скошенное в правую сторону асимметричное распределение. Количественное описание такой скошенности дается с помощью коэффициента асимметрии (As).

Величина As тем больше, чем больше выражена асимметрия. Знак величины этого коэффициента однозначно связан с направлением асимметрии. Если распределение вытянуто в сторону отрицательных

На представленном рисунке (Рисунок 95) полигон частот имеет явно скошенное в правую сторону асимметричное распределение. Количественное описание такой скошенности дается с помощью коэффициента асимметрии (As).

Величина As тем больше, чем больше выражена асимметрия. Знак величины этого коэффициента однозначно связан с направлением асимметрии.

Рисунок 95. Пример скошенного распределения

Величина As тем больше, чем больше выражена асимметрия. Знак величины этого коэффициента однозначно связан с направлением асимметрии. Если распределение вытянуто в сторону отрицательных значений (центр распределения принимается за нуль), то коэффициент As - положителен (As>0), в противоположном случае - отрицателен(As<0). Количественное описание эксцесса дается с помощью коэффициента эксцесса ). При Е>0 распределение принято считать островершинным, при Е<0- туповершинным (Рисунок 96).

Рисунок 96. Примеры статистических распределений и соответствующих им параметров As и E

  1. Статистическая проверка статистических гипотез.

Методологической основой любого исследования, в том числе и статистического, является формулировка рабочей гипотезы. При этом целью исследования является получение данных, на основании которых выдвинутую еще до начала исследования, как говорят априори, гипотезу можно было бы принять, то есть признать истинной, либо отвергнуть - признать ложной.

Статистической называют гипотезу о виде неизвестного распределения или о параметрах распределений. Например:

  • генеральная совокупность распределена по закону Пуассона;

  • средние арифметические двух совокупностей не равны между собой;

  • дисперсии (разброс значений) двух совокупностей равны между собой.

В первом случае выдвинута гипотеза о виде неизвестного распределения. Во втором и третьем случае - о параметрах двух известных распределений. Гипотеза "в четверг будет дождик" не является статистической, поскольку в ней речь не идет ни о виде, ни о параметрах статистического распределения.

В статистике выдвинутую гипотезу называют основной или нулевой (Н0). Гипотезу, которая противоречит нулевой и является ее логическим отрицанием, называют конкурирующей или альтернативной (Н1). Гипотезы Н0 и Н1 предоставляют выбор только одного из двух вариантов. Например: если нулевая гипотеза предполагает, что среднее арифметическое М=15 , то логическим отрицанием будет М15. Коротко это записывается так: Н0: М=15; Н1: М15. В медико-биологических исследованиях при оценках различий каких-либо параметров в качестве нулевой гипотезы обычно принимают гипотезу об отсутствии различий.

Простой называют гипотезу, содержащую только одно предположение. Простая гипотеза прямо указывает на некий определенный закон распределения, точнее на его параметры (среднее арифметическое, дисперсию и т.п.).

Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Например: сложная гипотеза Н: D>15 может состоять из бесчисленного множества простых Н: D>16 Н: D>17 Н: D>18 и т.д. Таким образом, сложная гипотеза указывает не единственное распределение (параметры распределения), а какое-то множество, семейство распределений.

Выдвинутая гипотеза может оказаться правильной или неправильной. Поэтому она проверяется. Поскольку эту проверку делают статистическими методами, то ее называют статистической проверкой. При статистической проверке могут быть допущены ошибки двух родов.

Ошибка первого рода - отвергается правильная гипотеза. Вероятность совершить ошибку первого рода называют уровнем значимости, Этот параметр принято обозначать через . В биологии и медицине уровень значимости принимают не выше 0,05. Это означает, что в 5 случаях из 100 (в 5%) мы рискуем допустить ошибку первого рода.

Ошибка второго рода - принимается неправильная гипотеза. Значимость ошибки второго рода обозначают символом .

Последствия этих ошибок могут быть различны. Если, например, отвергнут какой-либо весьма эффективный метод лечения (ошибка первого рода), то, скорее всего, будут применяться другие, может быть менее эффективные методы. Последствия неправильного лечения (ошибка второго рода) могут быть более тяжкими. В другом варианте: человек не уехал на нужном ему поезде (ошибка первого рода) или сел на поезд, следующий в другом направлении (ошибка второго рода). Последствия ошибок в этой ситуации так же явно не однозначны. Анализ потерь и выигрышей при принятии правильных и неправильных решений является задачей самостоятельной дисциплины - теории принятия решений.

Для проверки нулевых гипотез используют специально подобранные величины - статистические критерии (К). Например, если проверяют гипотезу о равенстве дисперсий в двух совокупностях Н0: D1=D2, то в качестве критерия К истинности нулевой гипотезы Н0 принимают отношение этих дисперсий . ВеличинаF называемая критерием Фишера подчиняется своему закону распределения - закону Фишера-Снедекора. Зная этот закон, можно установить фактическое значение критерия при тех или иных параметрах этого распределения (число степеней свободы, объемы наблюдений и др.).

Для проверки гипотез величины критериев, полученные в результате наблюдений (опытов) Кнабл, сравнивают с уже известными (фактическими) значениями таких критериев Кфакт.

Главной проблемой здесь является правильный выбор статистического критерия с учетом допустимой области его применения. Область же применения того или иного критерия задаётся законом его распределения. Весьма существенное значение в этом аспекте имеет факт, относится ли избранный критерий к семейству параметрических или к семейству непараметрических критериев.

Например: В большинстве медико-биологических исследований для статистической проверки гипотез существенности различии средних используется параметрический критерий Стьюдента (t). Методология его применения основана на предположении о принадлежности сравниваемых выборочных совокупностей к нормальному распределению и равенстве дисперсий. На практике, зачастую, ни какой проверки соответствия исходных данных этим условиям не проводят, что может вести к существенным просчетам.

Для статистической проверки соответствия теоретического и эмпирического (полученного в результате опыта) распределений необходимо располагать теоретическими распределением. Получение последнего представляется некоторой проблемой. Для её решения могут быть использованы следующие способы:

1. Наиболее оптимальный вариант - использование компьютерных статистических программ. С их помощью все необходимые вспомогательные данные (теоретические распределения, критические значения статистических критериев и т.п.) получаются автоматически. Результаты их сравнений с данными эмпирических наблюдений выводятся также автоматически по запросу пользователя.

2. Вычисление теоретических значений критериев и отдельных статистических характеристик можно осуществлять, используя встроенные функции математической статистики компьютерных программ (в том числе и Microsoft Excel). С помощью этих функций можно генерировать и числовые ряды различных теоретических распределений.

3. В случае «ручной» обработки, для нахождения теоретических значений можно использовать специальные таблицы. (См. Приложения). Иногда, можно отказаться от таблиц, применяя приближенные оценки граничных значений критериев.

Все возможные значения выбранного критерия (в нашем примере критерия Фишера F) разбиваются на две части (два подмножества). Одна часть, содержащая значения критерия Ккр, при которых нулевая гипотеза отвергается, называется критической областью. Другая часть возможных значений критерия, при которых нулевая гипотеза принимается, называется областью принятия гипотезы. Если полученные значения критерия Кнабл принадлежат критической области, то нулевую гипотезу отвергают. Если полученные значения Кнабл принадлежат области принятия нулевой гипотезы, то ее принимают. Критическая область и область принятия гипотезы являются интервалами, разделяемыми критическими точками (kкр).

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Правосторонняя - критическая область определяется неравенством Ккр > kкр (Рисунок 97 А), где kкр - положительное число.

Рисунок 97. Схема распределения критических областей принятия гипотез.

Левосторонней, называют критическую область, определяемую неравенством Ккр< kкр (Рисунок 97 В). Двусторонней называют область, определяемую неравенством kкр1<Ккр и Ккр <kкр2 (Рисунок 97. С). Если вычисленное значение критерия Кнабл окажется в критической области, то есть КнаблКкр, то нулевую гипотезу отвергают. Если же КнаблКкр, то оснований отвергнуть нулевую гипотезу - нет.

В медико-биологических исследованиях используют как односторонние, так и двусторонние критерии. На практике односторонние критерии применяются тогда, когда оценивается один из вариантов: либо одна выборка больше другой, либо одна выборка меньше другой. Двусторонние: когда оценивается соответствие одной выборки другой (отличается одна от другой?). На первый взгляд, логических различий здесь нет. Однако они весьма существенны.

Например: при исследовании изменений веса печени подопытных животных, по двум группам животных (контрольной и опытной) найдены дисперсии D1=25 и D2=7. Требуется определить статистическую достоверность их различий. Поскольку изменения могут касаться и увеличения и уменьшения веса, применение одностороннего критерия исключается. Порядок рассуждений следующий. Число наблюдений в первой выборке составило n1=13, во второй n2=11. Наблюдаемое значение критерия Фишера . Поскольку распределение Фишера-Снедекора зависит от числа степеней свободы, для определенияFkкр вычисляются степени свободы k1=n1-1=11-1=10 и k2=n2-1=13-1=12 , где n1 - объем выборки, по которой была вычислена большая дисперсия, и n2.- меньшая.

При заданном уровне значимости Р=0,01 и степенях свободы k1=10 и k2=12 находим правостороннюю критическую точку распределения kкр=4,3 . При Р=0,05 критическая точка распределения kкр=2,7. Для нахождения критических точек kкр с помощью Microsoft Excel можно использовать встроенную функцию FРАСПОБР из меню <Вставка>/<Функция>. Эта функция воспроизводит kкр с заданной вероятностью и степенями свободы.

Поскольку вычисленный критерий при Р=0,05 F>Fkкр, то нулевая гипотеза, говорящая о равенстве дисперсий (Н0:D1=D2), отвергается с вероятностью 0,05. При Р=0,01 F<Fkкр . В этом случае нулевая гипотеза не может быть отвергнута. Таким образом, с вероятностью ошибки не более 0,05 можно признать различие этих дисперсий существенным или статистически достоверным. Но при вероятности не более 0,01 , различие дисперсий существенным или статистически достоверным признать нельзя. Окончательное заключение в данном случае зависит от исследователя, проводившего опытное наблюдение.

Применение одностороннего критерия может быть следующим. Например: под воздействием одного из неблагоприятных факторов городской среды отмечено снижение показателей здоровья в обследованной группе жителей города, по сравнению с контрольной группой жителей села. Значение критерия Стьюдента t, с помощью которого проверялась статистическая значимость выявленных различий, составило 1,8. Число степеней свободы в этом наблюдении было равно 25. Тогда критическая точка распределения t критерия при Р=0,05 составляет 2,06.(КнаблКкр, 1,82,06). Таким образом, вероятность нулевой гипотезы слишком высока, что бы её можно было отвергнуть Т.е. нулевая гипотеза не может быть отвергнута. Следовательно, выявленные различия между жителями города и села статистически не значимы. В случае использования одностороннего критерия критическая точка того же t критерия (1,8) будет равна 1,71.(КнаблКкр, 1,81,71). При таком уровне значимости нулевая гипотеза Н0 может быть отвергнута и, соответственно, различия можно признать статистически достоверными. Поскольку в данной ситуации речь шла о воздействии неблагоприятного фактора внешней среды, ожидать улучшения здоровья в опытной группе под воздействием неблагоприятного фактора не представляется реальным. Поэтому можно ориентироваться на результаты анализа с помощью одностороннего критерия. (В опытной группе может быть только хуже, чем в контрольной). В данном примере это существенно, так как при использовании двустороннего критерия признать результаты статистически достоверными нельзя.

Следует помнить о том, что если нулевая гипотеза все же принимается, то это не значит, что тем самым она доказана. Один факт, подтверждающий какое-либо положение, еще не доказывает его. Т.е. в этой ситуации можно только утверждать, что полученные результаты не противоречат предположению об отсутствии различий. Для подтверждения гипотезы, как правило, необходимы дополнительные исследования или подтверждающие гипотезу дополнительные данные, которые получены каким либо другим путем и. Отвергается гипотеза, как правило, более категорично, поскольку в математической статистике достаточно одного факта, чтобы отвергнуть любое сомнительное предположение.

В отношении статистических гипотез следует придерживаться общего правила: доказать на основании однократной или косвенной проверки гипотезу нельзя, а отвергнуть - можно.

Помимо вероятности () попадания критерия в критическую область при условии, что нулевая гипотеза справедлива, целесообразно учитывать и вероятность попадания критерия в критическую область, когда нулевая гипотеза неверна и, следовательно, справедлива конкурирующая. Такая вероятность называется мощностью критерия. Т.е. мощность критерия – есть вероятность попадания критерия в критическую область, при условии, что справедлива конкурирующая гипотеза. Следовательно, если вероятность ошибки принять неправильную гипотезу (ошибка второго рода) равна , то мощность равна 1-. Таким образом, чем больше мощность критерия, тем меньше вероятность ошибки второго рода.

На первый взгляд кажется, что для повышения точности статистических данных нужно просто уменьшить вероятности ошибок первого и второго рода. Однако при неизменном объеме выборки, одновременно увеличить и невозможно. При попытке уменьшить вероятность одной ошибки, неизбежно возрастает вероятность другой. Поэтому, вероятности ошибок выбирают с учетом возможных последствий этих ошибок. Если к более тяжким последствиям ведут ошибки первого рода, то необходимо брать как можно меньшее значение . Если более тяжелые последствия вызывают ошибки второго рода, то стараются снизить . Единственный способ снизить одновременно вероятности статистических ошибок первого и второго рода - увеличение объема выборок.