- •I. Теоретическая часть
- •II. Расчетно-графическая часть
- •1. Построение вариационного ряда
- •3. Определение расчетных статистических характеристик (мер положения, рассеивания и характеристики формы кривой распределения): а) определение мер положения:
- •4. Графическое изображение вариационных рядов
- •5. Изучение формы кривой распределения
- •6. Проверка статистических гипотез
- •8. Определение объема выборки
- •III. Порядок выполнения расчетно-графической Работы
- •1.Построение вариационного ряда (Xmin - … - Xmax)
- •2. Группировка вариационного ряда
- •3. Определение мер положения, рассеивания и параметров формы кривой распределения:
- •4. Изучение формы распределения
- •5. Графическое представление сгруппированных рядов данных натурных наблюдений
- •6. Проверка статистических гипотез:
- •7. Построение доверительных интервалов
- •8. Определение объема выборки
- •Приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
4. Графическое изображение вариационных рядов
Графическое изображение сгруппированных вариационных рядов облегчает их анализ и позволяет в первом приближении судить о форме кривой генеральной совокупности. Для графического изображения рядов распределения применяют гистограмму (кривая распределения плотности вероятностей, дифференциальная кривая распределения). Гистограмма строится следующим образом: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величинам границ интервалов вариационного ряда; на отрезках строятся прямоугольники с высотами, равными приведенным частотам (приведенная частота - это относительная частота отнесенная к длине интервала, относительная частота определяется делением эмпирической частоты каждого интервала на объем выборки. Гистограмму принято преобразовывать в полигон распределения путем соединения середин верхних сторон прямоугольников отрезками. График, построенный по результатам натурных наблюдений, обуславливает вид эмпирической кривой распределения.
5. Изучение формы кривой распределения
Для получения приблизительного представления о форме кривой распределения строят гистограмму. Число наблюдений, по которому строится эмпирическое распределение, обычно невелико и представляет собой выборку из искомой генеральной совокупности. Эмпирические данные в определенной степени связаны со случайными ошибками, возникновение которых зачастую неизвестно, что искажает истинную закономерность изменение величины признака. При увеличении числа наблюдений одновременно с увеличением количества интервалов и уменьшением их длины полигон постепенно перерастает в кривую распределения.
Кривая распределения характеризует теоретическое (аналитическое) распределение, т.е. распределение, которое получилось бы при полном погашении всех случайных причин, искажающих основную закономерность. Исследование формы распределения включает решение следующих задач:
В практике статистического исследования природоохранной деятельности приходится встречаться с самыми разными видами распределений. Как правило, однородные совокупности имеют одновершинную форму, многовершинность свидетельствует о неоднородности изучаемой совокупности.
Выявление общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Для симметричных распределений среднее арифметическое, мода и медиана совпадают, коэффициент асимметрии равен нулю (Cs = 0). При правосторонней (Cs > 0) между показателями центра распределения существует следующее соотношение Мo < Ме < Хср. Отрицательный знак показателя асимметрии (Cs < 0) свидетельствует о наличии левосторонней асимметрии. Между показателями центра распределения в этом случае имеем Мo > Ме > Хср. На рис.1 изображены кривые распределения, имеющие различные значения коэффициента асимметрии .
Оценку степени существенности асимметрии выборки можно определить с помощью средней квадратичной ошибки, которая зависит от объема наблюдений и рассчитывается по формуле:
|
. |
(12) |
Если отношение |Cs|/WCs > 3, асимметрия существенна и распределение признака в генеральной совокупности не является симметричным.
Рис.1. Кривые плотности распределения вероятностей
с различными значениями коэффициента асимметрии:
а — симметричная кривая Cs = 0;
б — асимметричная кривая при Cs < 0;
в — асимметричная кривая при Cs > 0.
Для симметричных распределений оценивается существенность эксцесса. Эксцесс представляет собой выпад вершины кривой распределения плотности вероятностей вверх или вниз от вершины кривой нормального распределения (кривая Гаусса). Если величина коэффициента эксцесса положительная, то распределение островершинное, отрицательная — плосковершинное. Средняя квадратичная ошибка эксцесса рассчитывается по формуле:
|
. |
(13) |
Если отношение |Ce|/WCe < 3, то эксцесс не свойственен распределению признака в генеральной совокупности.
Оценка существенности показателей асимметрии и эксцесса для генеральной совокупности (при |Сs| /WCs < 3, |Ce|/WCe<3) позволяет сделать вывод о возможном использовании для анализа эмпирического материала кривую нормального закона распределения (кривая Гаусса).
Если случайная величина имеет плотность распределения
|
, |
(14) |
то она подчиняется нормальному закону распределения. Нормальное распределение является двух параметрическим, т.е. для его построения необходимо определить среднее арифметическое и среднее квадратическое отклонение. Данная функция затабулирована (приложение 1). Для получения функции распределения необходимо выражение 14 проинтегрировать. Для приведения кривых к одному началу случайные величины нормируются и центрируются по следующему механизму: из каждого значения вариационного ряда вычитается среднее арифметическое, результат от разности делится на среднее квадратическое отклонение. В данном случае полученный новый ряд величин имеет следующие характеристики: Xср = 0 и = 1. Формула плотности распределения вероятностей нормированной и центрированной случайной величины запишется в следующем виде:
|
, |
(15) |
Данная функция затабулирована [3, 5, 17].
Приведем некоторые свойства нормальной кривой распределения:
-
Значения функции определены на всей протяженности числовой прямой;
-
Кривая симметрична относительно максимальной ординаты;
-
Максимальная ордината соответствует Мо = Ме = Хср, а ее величина равна 1/2;
-
Кривая асимптотически приближается к оси абсцисс, чем больше значения отклоняются от Хср, тем реже они встречаются;
-
Одинаковые по абсолютному значению, но противоположные по знаку отклонения случайной величины от среднего арифметического равновероятны;
-
Кривые имеют две точки перегиба, находящиеся на расстоянии от Хср;
-
При Хср = сonst увеличением кривая становится более пологой, при = const с изменением Хср кривая не изменяет своей формы, а лишь сдвигается вправо или влево по оси абсцисс;
-
Отклонение случайной величины от среднего арифметического на определяет площадь фигуры, равную 68,3% от общей площади, в промежутке Хср 2 находится 95,4% всех значений признака, Хср 3 приходится 99,7%.
Использование нормального закона распределения основано на центральной предельной теореме, которая формулируется следующим образом: нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных факторов, действие этих факторов независимо, и ни одна из причин не имеет преобладающего влияния над другими.