- •Основные понятия, используемые в математической обработке данных.
- •Статистические и научные гипотезы
- •Статистические критерии
- •Правило отклонения Но и принятия н1
- •Методы описательной статистики Представление количественных данных.
- •Характеристики рассеивания
- •Характеристики ассиметрии и эксцесса
- •Нормальный закон распределения случайной величины
- •Проверка нормальности распределения результативного признака
Статистические и научные гипотезы
Научные гипотезы формулируются как предполагаемое решение проблемы. Первична. Ее также называют экспериментальной, т.к. она служит для организации эксперимента.
Статистическая гипотеза – утверждение в отношении неизвестного параметра, сформулированное на языке математической статистики.
Статистическая гипотеза – это предположение о распределении вероятностей, которое мы хотим проверить по имеющимся данным.
Статистические гипотезы подразделяются на нулевые и альтернативные
Нулевая гипотеза (Но) – это гипотеза об отсутствии различий. Это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза (Н1) – это гипотеза о значимости различий. Это то, что мы хотим доказать, поэтому ее иногда называют экспериментальной гипотезой.
Статистические критерии
«Статистический критерий – это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью» (Суходольский Г.В.).
В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, в некоторых критериях придерживаются противоположного правила. Эти правила оговариваются в описании каждого критерия.
Уровни статистической значимости.
Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.
Когда мы указываем, что различия достоверны на 5% уровне значимости, или при р≤0,05, то мы имеем ввиду, что вероятность того, что они недостоверны, составляет 0,05.
Если же мы указываем, что различия достоверны на 1% уровне значимости, или при р≤0,01, то имеем ввиду, что вероятность того, что онивсе-таки недостоверны равна 0,01.
Иначе, уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна.
Правило отклонения Но и принятия н1
Если эмпирическое значение критерия равняется критическому значению, соответствующему р≤0,05 или превышает его, то Но отклоняется, но мы еще не можем определенно принять Н1.
Если эмпирическое значение критерия равняется критическому значению, соответствующему р≤0,01 или превышает его, то Но отклоняется и принимается Н1.
Методы описательной статистики Представление количественных данных.
Для анализа и интерпретации количественных данных необходимо их обобщить.
Первый этап представления – это упорядочивание данных по величине от максимальной до минимальной. Такое представление называют несгруппированным рядом.
К характеристикам распределения, описывающим количественно его структуру и строение, относятся:
•характеристики положения;
•рассеивания;
•асимметрии и эксцесса.
К характеристикам положения относятся следующие оценки центральной тенденции:
Мода (Мо),
медиана (Ме),
квантили
среднее арифметическое ( M ).
мода (Мо) - такая величина признака, которая встречается чаще всего в изучаемом ряду, в совокупности.
При расчете моды может возникнуть несколько ситуаций:
1.Два значения признака, стоящие рядом, встречаются одинаково часто. В этом случае мода равна среднему арифметическому этих двух значений. Например, в следующем ряду данных: 12, 13, 14, 14, 14, 16, 16, 16, 18, 19
Мо= (14+16)/2= 15.
2.Два значения, встречаются также одинаково часто, но не стоят рядом. В этом случае говорят, что ряд данных имеет две моды, т.е. он бимодальный.
3.Если все значения данных встречаются одинаково часто, то говорят, что ряд не имеет
моды.
медиана (Ме) – это такое значение признака, которое делит ряд пополам.
При нечетном числе элементов в ряду данных, медиана равна центральному члену ряда, а при четном среднему арифметическому двух центральных значений ряда.
Среднее арифметическое значение признака, вычисленное для какой-либогруппы, интерпретируется как значение наиболее типичного для этой группы человека. Однако бывают случаи, когда подобная интерпретация несостоятельна (в случае, если существует большая разница между минимальным и максимальным значениями признака).
Квантиль – это такое значение признака, которое делит распределение в заданной пропорции: слева 0,5%, справа 99,5%; слева 2,5%, справа 97,5% и т.п.
Обычно выделяют следующие разновидности квантилей:
1)Квартили Q1, Q2, Q3 – они делят распределение на четыре части по 25% в каждой;
2)Квинтили К1, К2, К3, К4 – они делят распределение на пять частей по 20% в каждой;
3)Децили D1, ...,D9, их девять, и они делят распределение на десять частей по 10% в каждой;
4)Процентили P1, Р2 ...,Р99, их девяносто девять, и они делят распределение на сто частей по 1% в каждой части.
