Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Биометрическая обработка данных на основе компь...doc
Скачиваний:
30
Добавлен:
11.11.2019
Размер:
1.7 Mб
Скачать

Раздел 2. Параметрические критерии

2.1. Описательная статистика Методы описательной статистики (Descriptive statistics) и характеристика статистических совокупностей

В программе STATISTICA методы описательной статистики (Descriptive statistics) представлены в разделе “Основные статистики”(Basic Statistics and Tables) меню Статистика.

Значения переменных для анализа загружают из приложения или вводят в электронную таблицу с клавиатуры. Для выбора переменных (или переменной), по которым определяются статистические показатели, надо нажать кнопку Variables и в открывшемся окне активизировать нужные переменные (или переменную).

Пример 1. Значениями переменной (Var1) являются результаты взвешивания кроликов одного возраста (кг):

1,9 2,4 3,0 2,7 2,1 1,6 1,2 1,6 2,2 2,1

2,3 1,5 1,3 2,2 2,5 2,3 2,1 1,0 1,8 1,9

1,8 3,2 2,1 2,9 3,0 1,3 2,0 2,6 2,5 1,9

На вкладке Quick (или Summary/Descriptive statistics) программа отражает результаты определения основных статистических показателей. Количество (Valid) N=30. Средняя арифметическая (Mean) =2,1. Показатель средней массы кроликов составляет 2,1 кг.

Минимум и максимум (Minimum & Maximum): min=1,0 кг; max=3,2 кг.

Среднее квадратическое отклонение (Standard Deviations) Sx=± 0,56 кг.

Среднее квадратическое отклонение – величина, показывающая среднее отклонение вариант от средней арифметической.

Статистические показатели для полного анализа выборочной совокупности выбираются на вкладке Advanced установлением флажков напротив соответствующих статистик. При помощи кнопки Select all stats можно выбрать все статистики. Они разделены на три группы.

  1. Показатели положения (Location).

Количество (Valid) N=30.

Средняя арифметическая (Mean) =2,1 кг.

Медиана (Median) Me=2,1 кг. Медиана – это структурная средняя, относительно которой выборка делится на две равные части.

Мода (Мode) Мо=2,1кг. Мода – значение, наиболее часто встречающейся варианты в данной совокупности.

Средняя геометрическая (Geom.mean, g) определяется при оценке средних темпов изменения величины переменной за определенные промежутки времени.

Средняя гармоническая (Harm.mean, ) определяется при работе с переменными величинами, изменяющимися во времени.

  1. Показатели вариации (Variation).

Среднее квадратическое отклонение (Standard Deviations) Sx=±0,56 кг.

Дисперсия (Variance) Sx2=0,31кг.

Ошибка репрезентативности для средней арифметической (стандартная ошибка) =±0,102 кг.

Доверительный интервал генеральной средней (Confidence limit of mean) – область, в которой с определенной доверительной вероятностью находится генеральная средняя арифметическая ( = ±t ·SХ; где t - критерий достоверности для доверительной вероятности Р≥0,95), ; 1,89 ≤ ≤2,34.

Коэффициент асимметрии (Skewness, Аs) – показатель, характеризующий симметричность распределения. При нормальном распределении коэффициент асимметрии равен нулю. Если коэффициент асимметрии существенно отличается от нуля, то распределение несимметрично. Определяется коэффициент асимметрии по формуле:

Аs= . Стандартная ошибка асимметрии (Standard errow of Skewness, ) . Коэффициент эксцесса (Kurtosis, Ех) характеризует особенность распределения вариант выборки около своего центра. Определяется коэффициент эксцесса по формуле: Ex= . Стандартная ошибка эксцесса (Standard errow of Kurtosis, ): . Для нормального распределения коэффициент эксцесса также как и коэффициент асимметрии равен нулю. Если коэффициенты асимметрии и эксцесса превосходят критические (стандартные) значения, приведенные в таблицах 1-2 , гипотеза о нормальности распределения не принимается, формулируется вывод о наличии у этого распределения значимой асимметрии или эксцесса.

В выборке одновозрастных кроликов (Пример 1; Раздел 2.1.) значимая асимметрия и эксцесс не наблюдается. Коэффициент асимметрии (Аs=0,039) и коэффициент эксцесса (Ex=-0,44) меньше стандартных значений, приведенных в таблицах 1-2.

3. Процентили.

Минимум и максимум (Minimum & Maximum): min=1,0 кг; max=3,2 кг.

Минимальная и максимальная квартили (Lower & upper quartiles, ). Р25=1,8 кг; Р75=2,5 кг. Квартиль – значение переменной, ниже которой находится часть (25% и 75%) выборки.

Размах (Range) – разность между максимальным и минимальным значениями выборки.

Таблица 1

Критические значения коэффициента асимметрии As

Объем выборки

Уровни значимости

Объем выборки

Уровни значимости

0,05

0,01

0,05

0,01

25

0,711

1,061

250

0,251

0,360

30

0,611

0,982

300

0,230

0,329

35

0,621

0,921

350

0,213

0,305

40

0,587

0,869

400

0,200

0,285

45

0,558

0,825

450

0,188

0,269

50

0,533

0,787

500

0,179

0,255

60

0,492

0,723

550

0,171

0,243

70

0,459

0,673

600

0,163

0,233

80

0,432

0,631

650

0,157

0,224

90

0,409

0,596

700

0,151

0,215

100

0,389

0,567

750

0,146

0,208

125

0,350

0,508

800

0,142

0,202

150

0,321

0,464

850

0,138

0,196

175

0,298

0,430

900

0,134

0,190

200

0,280

0,403

950

0,130

0,185

1000

0,127

0,180

Таблица 2

Критические значения коэффициента эксцесса Ех

Объем выборки

Уровни значимости

0,05

0,01

11

0,907

0,936

16

0,888

0,914

21

0,877

0,900

26

0,869

0,890

31

0,863

0,883

36

0,858

0,877

41

0,854

0,872

46

0,851

0,868

51

0,848

0,865

61

0,843

0,859

71

0,840

0,855

81

0,840

0,855

91

0,835

0,848

101

0,834

0,846

201

0,823

0,832

Квартильный размах (Quartiles range) – разность значений верхней и нижней квартилей. Программа STATISTICA позволяет задать определение значение процентилей. В практике обычно используют процентили: Р3, Р97 ; Р10, Р90 Для анализа изменчивости переменных предусмотрено построение графиков на вкладке Box & Whisker. Выбор показателей для построения графиков проводится на вкладке Options.

Показатели для оценки изменчивости на графике:

- медиана /квартиль/ размах;

- средняя арифметическая / стандартная ошибка / среднее квадратическое отклонение;

- средняя арифметическая / среднее квадратическое отклонение / 1,96*среднее квадратическое отклонение;

- средняя арифметическая / стандартная ошибка /1,96* стандартная ошибка.

Задания для самостоятельной работы

Задание 1.

Охарактеризуйте выборку масса тела краба (Pachygrapsus crassipes) на основе показателей описательной статистики: количество животных,n; минимальное значение, min; максимальное значение, max; средняя арифметическая, ; ошибка средней арифметической, ; дисперсия, Sx2; среднее квадратическое отклонение, Sx; медиана, Ме; мода Мо; верхняя квартиль, ; нижняя квартиль, ; доверительный интервал средней арифметической, t•SX; доверительный интервал средней арифметической, ≤ ≤ ; коэффициент асимметрии, Аs; ошибка коэффициента асимметрии; коэффициент эксцесса, Ех; ошибка коэффициента эксцесса.

6,1

9,6

11,5

13,8

7,1

8,6

11,6

13,3

6,6

8,8

10,7

12,6

7,0

10,5

11,8

12,4

8,3

11,6

11,3

14,5

9,7

11,3

12,5

15,6

9,1

10,6

13,6

14,7

9,5

10,5

Задание 2.

Охарактеризуйте выборку масса (мг) жабр краба (Pachygrapsus crassipes) на основе показателей описательной статистики: количество животных, n; минимальное значение, min; максимальное значение, max; средняя арифметическая, ; ошибка средней арифметической; дисперсия, Sx2; среднее квадратическое отклонение, Sx; медиана, Ме; мода Мо; верхняя квартиль, ; нижняя квартиль, ; доверительный интервал средней арифметической, t•SX; доверительный интервал средней арифметической, ≤ ≤ ; коэффициент асимметрии, Аs; ошибка коэффициента асимметрии; коэффициент эксцесса, Ех; ошибка коэффициента эксцесса.

198

167

176

165

144

146

153

158

147

156

91

145

133

138

127

136

125

126

133

136

135

81

125

108

106

116

115

111

117

105

90

86