- •Биометрическая обработка данных на основе компьютерной программы statistica
- •Предисловие
- •Раздел 1. Характеристика программы statistica
- •Организация системы statistica
- •1.2. Статистические методы программы statistica
- •Раздел 2. Параметрические критерии
- •2.1. Описательная статистика Методы описательной статистики (Descriptive statistics) и характеристика статистических совокупностей
- •2.2. Статистические оценки генеральных параметров Оценка ошибок репрезентативности
- •Оценка ошибок репрезентативности
- •Показатель точности оценок
- •Оценка доверительного интервала средней арифметической –
- •Оценка доверительного интервала дисперсии –
- •2.3. Проверка нормальности эмпирического распределения Функции нормального распределения и методы оценки нормальности эмпирического распределения
- •Проверка нормальности эмпирического распределения
- •2.4. Параметрические критерии сравнения средних
- •Раздел 3. Непараметрические критерии
- •3.1. Сравнение независимых выборок
- •Сравнение зависимых групп
- •3.3. Сравнение номинальных (категориальных) переменных
- •Раздел 4. Корреляционный анализ
- •4.1. Параметрические показатели связи
- •4.2. Непараметрические показатели связи
- •Методика расчета коэффициент ранговой корреляции Спирмена ( )
- •Методика расчета коэффициента корреляции Спирмена ( )
- •4.3. Оценка связи между номинальными величинами
- •Раздел 5. Дисперсионный анализ
- •5.1. Однофакторный дисперсионный анализ
- •5.2. Двухфакторный дисперсионный анализ
- •Раздел 6. Регрессионный анализ
- •Раздел 7. Кластерный анализ
- •Раздел 8. Дискриминатный анализ
- •Оглавление
- •625003, Г. Тюмень, Семакова,10
Раздел 2. Параметрические критерии
2.1. Описательная статистика Методы описательной статистики (Descriptive statistics) и характеристика статистических совокупностей
В программе STATISTICA методы описательной статистики (Descriptive statistics) представлены в разделе “Основные статистики”(Basic Statistics and Tables) меню Статистика.
Значения переменных для анализа загружают из приложения или вводят в электронную таблицу с клавиатуры. Для выбора переменных (или переменной), по которым определяются статистические показатели, надо нажать кнопку Variables и в открывшемся окне активизировать нужные переменные (или переменную).
Пример 1. Значениями переменной (Var1) являются результаты взвешивания кроликов одного возраста (кг):
1,9 2,4 3,0 2,7 2,1 1,6 1,2 1,6 2,2 2,1
2,3 1,5 1,3 2,2 2,5 2,3 2,1 1,0 1,8 1,9
1,8 3,2 2,1 2,9 3,0 1,3 2,0 2,6 2,5 1,9
На вкладке Quick (или Summary/Descriptive statistics) программа отражает результаты определения основных статистических показателей. Количество (Valid) N=30. Средняя арифметическая (Mean) =2,1. Показатель средней массы кроликов составляет 2,1 кг.
Минимум и максимум (Minimum & Maximum): min=1,0 кг; max=3,2 кг.
Среднее квадратическое отклонение (Standard Deviations) Sx=± 0,56 кг.
Среднее квадратическое отклонение – величина, показывающая среднее отклонение вариант от средней арифметической.
Статистические показатели для полного анализа выборочной совокупности выбираются на вкладке Advanced установлением флажков напротив соответствующих статистик. При помощи кнопки Select all stats можно выбрать все статистики. Они разделены на три группы.
Показатели положения (Location).
Количество (Valid) N=30.
Средняя арифметическая (Mean) =2,1 кг.
Медиана (Median) Me=2,1 кг. Медиана – это структурная средняя, относительно которой выборка делится на две равные части.
Мода (Мode) Мо=2,1кг. Мода – значение, наиболее часто встречающейся варианты в данной совокупности.
Средняя геометрическая (Geom.mean, g) определяется при оценке средних темпов изменения величины переменной за определенные промежутки времени.
Средняя гармоническая (Harm.mean, ) определяется при работе с переменными величинами, изменяющимися во времени.
Показатели вариации (Variation).
Среднее квадратическое отклонение (Standard Deviations) Sx=±0,56 кг.
Дисперсия (Variance) Sx2=0,31кг.
Ошибка репрезентативности для средней арифметической (стандартная ошибка) =±0,102 кг.
Доверительный интервал генеральной средней (Confidence limit of mean) – область, в которой с определенной доверительной вероятностью находится генеральная средняя арифметическая ( = ±t ·SХ; где t - критерий достоверности для доверительной вероятности Р≥0,95), ≤ ≤ ; 1,89 ≤ ≤2,34.
Коэффициент асимметрии (Skewness, Аs) – показатель, характеризующий симметричность распределения. При нормальном распределении коэффициент асимметрии равен нулю. Если коэффициент асимметрии существенно отличается от нуля, то распределение несимметрично. Определяется коэффициент асимметрии по формуле:
Аs= . Стандартная ошибка асимметрии (Standard errow of Skewness, ) . Коэффициент эксцесса (Kurtosis, Ех) характеризует особенность распределения вариант выборки около своего центра. Определяется коэффициент эксцесса по формуле: Ex= . Стандартная ошибка эксцесса (Standard errow of Kurtosis, ): . Для нормального распределения коэффициент эксцесса также как и коэффициент асимметрии равен нулю. Если коэффициенты асимметрии и эксцесса превосходят критические (стандартные) значения, приведенные в таблицах 1-2 , гипотеза о нормальности распределения не принимается, формулируется вывод о наличии у этого распределения значимой асимметрии или эксцесса.
В выборке одновозрастных кроликов (Пример 1; Раздел 2.1.) значимая асимметрия и эксцесс не наблюдается. Коэффициент асимметрии (Аs=0,039) и коэффициент эксцесса (Ex=-0,44) меньше стандартных значений, приведенных в таблицах 1-2.
3. Процентили.
Минимум и максимум (Minimum & Maximum): min=1,0 кг; max=3,2 кг.
Минимальная и максимальная квартили (Lower & upper quartiles, ). Р25=1,8 кг; Р75=2,5 кг. Квартиль – значение переменной, ниже которой находится часть (25% и 75%) выборки.
Размах (Range) – разность между максимальным и минимальным значениями выборки.
Таблица 1
Критические значения коэффициента асимметрии As
Объем выборки |
Уровни значимости |
Объем выборки |
Уровни значимости |
||
0,05 |
0,01 |
0,05 |
0,01 |
||
25 |
0,711 |
1,061 |
250 |
0,251 |
0,360 |
30 |
0,611 |
0,982 |
300 |
0,230 |
0,329 |
35 |
0,621 |
0,921 |
350 |
0,213 |
0,305 |
40 |
0,587 |
0,869 |
400 |
0,200 |
0,285 |
45 |
0,558 |
0,825 |
450 |
0,188 |
0,269 |
50 |
0,533 |
0,787 |
500 |
0,179 |
0,255 |
60 |
0,492 |
0,723 |
550 |
0,171 |
0,243 |
70 |
0,459 |
0,673 |
600 |
0,163 |
0,233 |
80 |
0,432 |
0,631 |
650 |
0,157 |
0,224 |
90 |
0,409 |
0,596 |
700 |
0,151 |
0,215 |
100 |
0,389 |
0,567 |
750 |
0,146 |
0,208 |
125 |
0,350 |
0,508 |
800 |
0,142 |
0,202 |
150 |
0,321 |
0,464 |
850 |
0,138 |
0,196 |
175 |
0,298 |
0,430 |
900 |
0,134 |
0,190 |
200 |
0,280 |
0,403 |
950 |
0,130 |
0,185 |
|
|
|
1000 |
0,127 |
0,180 |
Таблица 2
Критические значения коэффициента эксцесса Ех
-
Объем выборки
Уровни значимости
0,05
0,01
11
0,907
0,936
16
0,888
0,914
21
0,877
0,900
26
0,869
0,890
31
0,863
0,883
36
0,858
0,877
41
0,854
0,872
46
0,851
0,868
51
0,848
0,865
61
0,843
0,859
71
0,840
0,855
81
0,840
0,855
91
0,835
0,848
101
0,834
0,846
201
0,823
0,832
Квартильный размах (Quartiles range) – разность значений верхней и нижней квартилей. Программа STATISTICA позволяет задать определение значение процентилей. В практике обычно используют процентили: Р3, Р97 ; Р10, Р90 Для анализа изменчивости переменных предусмотрено построение графиков на вкладке Box & Whisker. Выбор показателей для построения графиков проводится на вкладке Options.
Показатели для оценки изменчивости на графике:
- медиана /квартиль/ размах;
- средняя арифметическая / стандартная ошибка / среднее квадратическое отклонение;
- средняя арифметическая / среднее квадратическое отклонение / 1,96*среднее квадратическое отклонение;
- средняя арифметическая / стандартная ошибка /1,96* стандартная ошибка.
Задания для самостоятельной работы
Задание 1.
Охарактеризуйте выборку масса тела краба (Pachygrapsus crassipes) на основе показателей описательной статистики: количество животных,n; минимальное значение, min; максимальное значение, max; средняя арифметическая, ; ошибка средней арифметической, ; дисперсия, Sx2; среднее квадратическое отклонение, Sx; медиана, Ме; мода Мо; верхняя квартиль, ; нижняя квартиль, ; доверительный интервал средней арифметической, t•SX; доверительный интервал средней арифметической, ≤ ≤ ; коэффициент асимметрии, Аs; ошибка коэффициента асимметрии; коэффициент эксцесса, Ех; ошибка коэффициента эксцесса.
6,1 |
9,6 |
11,5 |
13,8 |
7,1 |
8,6 |
11,6 |
13,3 |
6,6 |
8,8 |
10,7 |
12,6 |
7,0 |
10,5 |
11,8 |
12,4 |
8,3 |
11,6 |
11,3 |
14,5 |
9,7 |
11,3 |
12,5 |
15,6 |
9,1 |
10,6 |
13,6 |
14,7 |
9,5 |
10,5 |
Задание 2.
Охарактеризуйте выборку масса (мг) жабр краба (Pachygrapsus crassipes) на основе показателей описательной статистики: количество животных, n; минимальное значение, min; максимальное значение, max; средняя арифметическая, ; ошибка средней арифметической; дисперсия, Sx2; среднее квадратическое отклонение, Sx; медиана, Ме; мода Мо; верхняя квартиль, ; нижняя квартиль, ; доверительный интервал средней арифметической, t•SX; доверительный интервал средней арифметической, ≤ ≤ ; коэффициент асимметрии, Аs; ошибка коэффициента асимметрии; коэффициент эксцесса, Ех; ошибка коэффициента эксцесса.
198 |
167 |
176 |
165 |
144 |
146 |
153 |
158 |
147 |
156 |
91 |
145 |
133 |
138 |
127 |
136 |
125 |
126 |
133 |
136 |
135 |
81 |
125 |
108 |
106 |
116 |
115 |
111 |
117 |
105 |
90 |
86 |
|