Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
42_43_44.docx
Скачиваний:
74
Добавлен:
25.03.2015
Размер:
80.82 Кб
Скачать

44 Вторичная статистическая обработка данных

Вторичная статистическая обработка.

К вторичным относят такие методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности. Вторичные методы можно подразделить на способы оценки значимости различий и способы установления статистических взаимосвязей.

Статистические гипотезы.

Статистические гипотезы – это предположения исследователя о результатах измерений, выраженные в формализованном лаконичном виде.

Гипотезы как бы «дают заказ» на вывод исследования.

Статистические гипотезы разделяются на 4 типа.

Статистические гипотезы

    1. Нулевые

    2. Альтернативные

    3. Направленные

    4. Ненаправленные

Но – нулевая гипотеза

Она делает предположение о том, что различия между сравниваемыми выборками отсутствуют. Её математический смысл состоит в том, что Хср.1 –Хср.2→0, т.е. различие между выборками стремится к нулю. На самом деле различия могут отклоняться от 0, но быть не достоверными или не доказанными.

Принятие нулевой гипотезы можно выразить такими словами:

«Достоверных различий между выборками не обнаружено».

Как правило, исследователь стремится опровергнуть нулевую гипотезу, и доказать следующее: во-первых, то, что различия между выборками есть, и, во-вторых, то, что они достоверны.

Н1 А) – альтернативная гипотеза ( противостоящая нулевой гипотезе)

Её смысл заключается в том, что различия между выборками есть и что они достоверны.

Как правил, легче получается отвергнуть нулевую гипотезу, чем доказать альтернативную. Но если отвергли нулевую гипотезу, то это ещё не означает, что автоматически следует принять альтернативную, хотя на практике обычно поступают именно так.

С помощью доказательства альтернативной гипотезы, безусловно, отвергается нулевая гипотеза. Если не смогли доказать альтернативную гипотезу, то вынуждено принимается нулевая гипотеза.

Однако встречаются и такие случаи, когда исследователь пытается доказать именно нулевую гипотезу, т.е. отсутствие достоверных различий между сравниваемыми выборками. 

Ненаправленная гипотеза – доказываем то, что выборки достоверно различаются, но не доказываем чем именно.  

Направленная гипотеза – под влиянием исследуемого фактора в определенном направлении (больше или, наоборот, меньше) изменяется исследуемый признак в экспериментальной выборке.

Подготовка данных для применения статистических методов (проверка нормальности распределения, создание и уравновешивание дисперсионных комплексов, проверка достоверности экстремальных значений и др.).

В случае нормального распределения асимметрия и эксцесс равны 0 – Закон Гаусса.

Асимметрия – это показатель симметричности / скошенности кривой распределения, а эксцесс определяет ее островершинность. 

Асимметрия – преобладание низких или высоких значений

При левостронней асимметрии ее показатель является положительным и в распределении преобладают более низкие значения признака. При правостронней – показатель положительный и преобладают более высокие значения. У всех симметричных распеделений (в том числе и у нормального распределения) величина асимметрии равна нулю.

Эксцесс – преобладание средних или крайних значений

Если в распределении преобладают значения близкие к среднему арифметическому, то формируется островершинное распределение. В этом случае показатель эксцесса стремится к положительной величине. У нормального распределения эксцесс равен нулю. Если у распределения 2 вершины (бимодальное распределение), то тогда эксцесс стремится к отрицательной величине.

Свойства закона Гаусса

1 площадь под нормальной кривой всегда равна 1 и соответствует вероятности достоверного события

2 в случае нормального распределения действует правило трех сигма:

-в интервале М ±ơ (генеральное среднее и дисперсия) – 68,3%

- М ±2ơ - 95,5%

- М ±3ơ –99,7%

ТО вероятность того, что индивидуальный результат испытуемого будет лежать за пределами интервалов - М ±3ơ=0,3%. Такие результаты принято считать нетипичными, экстремальными и возможно недостоверными.

3 алгоритм проверки достоверности экстремальных значений при помощи 3сигма:

-дано одно из значений выборки существенно больше\меньше остальных значений выборки. Известно, что признак х имеет нормальное распределение. Х (М;ơ)

Xi << гораздо меньше всех значений Xi, исключаем подозрительное значение из выборки.

-для оставшихся значений находим

-для оставшихся значений находим стандартное отклонение S

-проверяем неравенство x i<-3S (xn> +3S), если это неравенство выполнено значит, что x i нетипичное и его необходимо исключить.

4 проверка нормальности распределения (метод Пустыльника)

Общий принцип А и Е точно равны 0 быть не могут, но даже, если они мало отличаются от нуля распределение можно считать нормальным.

Надо сравнить выборочное А и Е с критическими значениями, если они будут меньше критических, то распределение нормального.

Если ǀАǀ<Акр и ǀЕǀ<Екр распределение признака можно считать нормальным

Нормальное распределение получается в том случае, если на признак оказывают влияние большое количество разнонаправленных факторов одни способствуют, другие препятствуют развитию признака.

Нормальное распределение имеет следующие признаки:

-генеральное среднее

-генеральная дисперсия – мера разброса значения и чем она больше, тем кривая будет более распластаной, чем меньше – тем компактнее.

Создание и уравновешивание дисперсионных комплексов

Для применения дисперсионного анализа создается дисперсионный комплекс, который представляет собой таблицы каждой линейки которой соответствует определенное сочетание градации факторов

В ячейках записываются индивидуальные результаты испытуемых, которые были получены в определенных условиях или в результате действия факторов

Пример: необходимо выяснить влияет ли уровень развития кратковременной памяти на успеваемость по англ.языку.

Уровень развития кратковрем.памяти

Оценка по англ.языку

Высокий

7,8,7,6,9

Средний

4,6,8,7,5

низкий

4,5,4,6,6

Фактор –уровень развития кратковременной памяти

Результативный признак – успеваемости по английскому языку.

1. Создание комплексов. Лучше всего для каждого испытуемого создать отдельную кар­точку, куда были бы занесены данные по всем исследованным призна­кам. Дело в том, что в процессе анализа у исследователя могут изме­ниться гипотезы. Потребуется создавать, быть может, не один, а мно­жество дисперсионных комплексов, различающихся как по факторам, так и по результативным признакам. Карточки помогут нам быстро создавать новые дисперсионные комплексы. Благодаря карточкам мы сразу увидим, равномерно ли распределяются данные по градациям в случае, если за фактор мы решили принять один из исследованных пси­хологических признаков. С помощью карточек мы можем помочь себе выделить три, четыре или более градаций этого фактора, например уровни мотивации, настойчивости, креа­тив­ности и др.

2. Уравновешивание комплексов. Комплекс, в котором каждая ячейка представлена одинаковым количеством наблюдений, называется равномерным. Равномерность комплекса позволяет нам обойти требование равенства дисперсий в ка­ждой из ячеек комплекса.

Равномерные комплексы позволяют также избежать значитель­ных трудностей, которые неизбежно возникают при обсчете неравно­мерных, или неортогональных, комплексов.

В случае если в разных градациях комплекса оказалось неравное количество наблюдений, необходимо отсеять некоторые из них. Если в комплексе со связанными выборками кто-либо из испытуемых не был подвергнут одному из условий действия переменной (градаций факто­ра), то его данные исключаются. Если же комплекс включает незави­симые выборки, каждая из которых была подвергнута определенному условию воздействия (градации фактора), то «лишние» испытуемые в какой-либо из ячеек комплекса отсеиваются путем случайного выбора необходимого количества карточек.

3. Проверка нормальности распределения результативного признака. Дисперсионный анализ относится к группе параметрических мето­дов и поэтому его следует применять только тогда, когда известно или доказано, что распределение признака является нормальным. Строго говоря, перед тем как применять дисперсионный анализ, мы должны убедиться в нормальности распределения результативного признака. Нормальность распределения результативного признака можно проверить путем расче­та показателей асимметрии и эксцесса и сопоставления их с критическими значениями

Проверка гипотез с помощью выбранных статистических критериев, формулирование выводов, имеющих определенную доверительную вероятность.

-На основе результатов первичной стат.обработки выдвигаются гипотезы (предположения)

-Определение типа задачи, а так же критерия, который позволит решить задачу данного типа

-Проверка ограничения критерия (условия применения)

-Формулировка основной гипотезы и конкурирующей гипотезы . Гипотезы должны быть чётко формализованы в терминах

-Задание уровня значимости , на котором в дальнейшем и будет сделан вывод о справедливости гипотезы. Он равен вероятности допустить ошибку первого рода (вероятность доказать то, чего нет).

-Вычисление наблюдаемого значения критерия

-Определение критического значения критерия по спец.таблицам в зависимости от объема выборки (число степеней свободы (к)=n-1) и уровня значимости.

-Построение критической области. Из области значений выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство . Это множество и называется критической областью.

-Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы .

Виды статистических критериев: параметрические, непараметрические, многофункциональные критерии

Параметрические критерии -Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии) и требует предварительной проверки нормальности распределения. (t-критерий Стьюдента; Критерий Фишера)

Непараметрические критерии -Группа статистических критериев, которые вместо значений выборки оперированют частотами или рангами.( U-критерий Манна-Уитни, Критерий Пирсона)

Многофункциональные статистические критерии - это критерии, которые могут использоваться по отношению к самым разнообразным | данным, выборкам и задачам.

Это означает, что данные могут быть представлены в любой шкале, начиная от номинативной (шкалы наименований).

Это означает также, что выборки могут быть как независимыми, так и "связанными", то есть мы можем с помощью многофункциональных критериев сравнивать и разные выборки испытуемых, и показатели одной и той же выборки, измеренные в разных условиях. Позволяют решать задачи сопос­тавления уровней исследуемого признака, сдвигов в значениях исследуемого признака и сравнения распределений ( критерий φ* Фишера (угловое преобразование Фишера))

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]