
- •1) Понятие случайного события и операции с событиями.
- •3.Статическое определение вероятности, относительная частота
- •6.Зависимость и независимость событий. Условная вероятность
- •Свойства математического ожидания:
- •Свойства дисперсии:
- •26. Нормальный закон распределения непрерывной случайной величины. Нормальная кривая.
- •30. Общие описательные статистики выборки
- •31. Общие описательные статистики генеральной совокупности
- •36. Требования, предъявляемые к статистическим оценкам
- •43. Проверка гипотезы методом определения уровня вероятности (p-value метод)
- •44. Классическая процедура проверки статистических гипотез
- •45. Точность и надежность оценок
- •46. Понятие доверительной вероятности и доверительного интервала
- •47.Определение доверительного интервала для оценки математического ожидания при известном s (ско)
- •48. Определение доверительного интервала для оценки математического ожидания при неизвестном s (ско)
- •49. Определение доверительного интервала для оценки среднего квадратического отклонения (ско) и дисперсии
- •50. Показатели связи двух случайных величин
- •Показатели вариации.
- •52. Показатель ранговой корреляции Кендалла, проверка соответствующей гипотезы о существенности связи
30. Общие описательные статистики выборки
Результаты агрономических опытов представляют собой выборочные данные, т.к. из общей совокупности отбираются образцы для последующего анализа. Причем, для того, чтобы судить о генеральной совокупности выборка должна быть случайной, т.е. все образцы должны иметь одинаковую вероятность попасть в выборку.
Выборкой объема n из совокупности, распределенной по закону F(x), называется n независимых наблюдений с функцией распределения F(x).
Анализ
данных начинают с упорядочения
(ранжирования) и группировки. Диапазон
значений выборки разбивают на равные
интервалы. Количество интервалов k определяют
из
выражения
и
принимают целочисленным.
Длину
каждого интервала получают,
округляя в сторону увеличения
число ’
Для каждого интервала Аi подсчитывают частоту – количество наблюдений, попавших в него mi.
Частоты,
отнесенные к общему числу наблюдений,
называют относительными
частотами
Ряд ранжированных значений признака, в котором указана частота их встречаемости в данной совокупности называется вариационным рядом.
Графическое представление вариационного ряда в виде столбиковой диаграммы, в которой высоты прямоугольников соответствуют частотам интервалов, называют гистограммой.
Сумму частоты данного интервала с частотами всех интервалов, расположенных левее называют накопленной частотой. Графическое изображение накопленных частот в виде плавной линии называют полигоном.
Выборка характеризуется следующими величинами:
Объем выборки – количество наблюдений представленных в выборке.
Среднее
значение –
мера «центрального положения» наблюдаемой
переменной
Дисперсия –
это средний квадрат отклонений вариантов
от их средней величины в данной
совокупности.
Дисперсия генеральной
совокупности обозначается 2,
дисперсия выборки
– S2.
Дисперсия является мерой изменчивости, вариации признака. Это один из наиболее важных показателей, характеризующих явление. Для определения выборочной дисперсии чаще используется формула
В этом случае оценка дисперсии оказывается несмещенной.
Стандартное
отклонение (или среднее
квадратическое отклонение)
– это квадратный корень из
дисперсии.
31. Общие описательные статистики генеральной совокупности
ойств неизмеримо большой группы объектов на основании анализа свойств относительно небольшой их совокупности.
При этом все существующее в природе множество интересующих нас объектов называется генеральной совокупностью, а относительно небольшое их множество, отобранное нами для изучения - выборочной совокупностью, или выборкой.
Применительно к морфометрии это можно продемонстрировать на следующем примере: допустим мы хотим изучить изменчивость показателя ядерно-цитоплазменного отношения клеток печени (гепатоцитов) мыши на различных этапах жизни животного, т.е. в онтогенетическом аспекте. Все существующие в природе мыши различного возраста будут являться членами генеральной совокупности. Но изучить всех мышей физически невозможно. Поэтому для того, чтобы получить представление об изменчивости интересующего нас параметра мы отбираем из их общего количества (т.е. из генеральной совокупности) относительно небольшую группу мышей (выборку), гепатоциты которых и подвергаются изучению. Выводы, полученные нами при изучении выборки мы распространяем (генерализуем) на всех мышей, т.е. на всю генеральную совокупность.
Для того, чтобы выводы, сделанные на основании изучения выборки были максимально приближены к действительным свойствам генеральной совокупности выборка по своей структуре должна быть пропорциональна всей генеральной совокупности, или как говорят матстатистики репрезентативна ей. Как правило для формирования правильной репрезентативной выборки используется метод случайного отбора.
Строго говоря выборка представляет собой ряд последовательных измерений какого-либо параметра (в вышеприведенном примере - ядерно-цитоплазменного отношения гепатоцитов мыши). Параметр (свойство), который мы измеряем при исследовании называется переменной, т.к. его значения как правило являются неодинаковыми и образуют ряд случайных значений. Для того, чтобы математически описать изменчивость случайных значений и были разработаны методы описательной статистики.
Описательная статистика включает в себя несколько базовых показателей, которые можно разделить на три основных группы: показатели положения и показатели разброса. В целом описательные статистики характеризуют положение выборки относительно числовой прямой, а также форму ее распределения. Понятие о распределении будет введено в следующей статье, пока же остановимся на детальной характеристике описательных статистик.
32. Показатели вариации выборки
Вариация – различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
К показателям вариации относятся:
I группа — абсолютные показатели вариации
размах вариации
среднее линейное отклонение
дисперсия
среднее квадратическое отклонение
II группа — относительные показатели вариации
коэффициент вариации
коэффициент осцилляции
относительное линейное отклонение
Самым элементарным показателем вариации признака является размах вариацииR. Размах вариации показывает лишь крайние (min, max) отклонения признака от общей средней.
Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.
Среднее линейное отклонение — средняя арифметическая абсолютных значений отклонений (модуль отклонений) отдельных вариантов от их средней арифметической:
для несгруппированных данных (простое)
для сгруппированных данных (взвешенное)
33. Коэффициент асимметрии для сгруппированных и несгруппированных данных
Показатели асимметрии На основе момента третьего порядка можно построить показатель, характеризующий степень асимметричности распределения: (22) Данный показатель называют коэффициентом асимметрии. Он может быть рас-считан как по сгруппированным, так и по несгруппированным данным. Симметричным называется распределение, в котором частоты любы двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. По данным примера по урожайности показатель асимметрии составил: , т.е. асимметрия незначительна. Английский статистик К. Пирсон на основе разности между средней величиной и модой предложил другой показатель асимметрии: (23) По данным примера по урожайности показатель составил: Показатель Пирсона зависит от степени асимметричности в средней части ряда распределения, а асимметрии, основанный на моменте третьего порядка, - от крайних значений признака. Т.о., в нашем примере, в средней части распределения асимметрия более значительна. Распределения с сильной правосторонней и левосторонней (положительной и отрицательной)
34.Коэффициент эксцесса для сгруппированных и несгруппированных данных
Коэффицие́нт эксце́сса (коэффициент островершинности) в теории вероятностей — мера остроты пика распределения случайной величины.
.
Пусть
— независимые случайные величины с равной дисперсией. Пусть
. Тогда
,
где
—
коэффициенты эксцесса соответствующих
случайных величин.
35. Многомерные законы распределения (χ2-распределение, Распределение Фишера, распределение Стьюдента)
Распределение хи-квадрат ( 2- распределение)
Пусть 1, 2, …, n - независимые случайные величины, каждая из которых имеет стандартное нормальное распределение N(0, 1). Составим случайную величину
2 = 12 + 22 + …+ n2.
Ее закон распределения называется 2- распределением с nстепенями свободы. Плотность вероятности этой случайной величины вычисляется по формуле:
, D 2=2n.
Здесь
-
гамма-функция Эйлера.
Распределение Стьюдента
Пусть
случайная величина имеет
стандартное нормальное распределение,
а случайная величина n2 - 2-распределение
с n степенями
свободы. Если и n2 -
независимы, то про случайную
величину
говорят,
что она имеет распределение Стьюдента
сnстепенями
свободы. Плотность вероятности этой
случайной величины вычисляется по
формуле:
, x
R, M n =
0, D n =
n/(n-2),
n>2.
При больших n распределение Стьюдента практически не отличается от N(0, 1).
F-распределение Фишера
Пусть
случайные величины n2и m2 независимы
и имеют распределение 2 с n иmстепенями
свободы соответственно. Тогда о случайной
величине
говорят,
что она имеет F-распределение. Плотность
вероятности этой случайной величины
вычисляется по формуле:
, x>0,
- гамма-функция
Эйлера;
, m>2;
, m >
4.