- •Теоретическая часть
- •II. Расчетно-графическая часть
- •4. Графическое изображение кривых распределения.
- •5. Изучение формы кривой распределения.
- •Построение вариационного ряда ( ):
- •3.Определение мер положения, рассеивания и параметров формы кривой распределения
- •4. Изучение формы кривой распределения
- •5. Графическое представление сгруппированных рядов данных натурных наблюдений
- •6. Проверка статистических гипотез.
4. Графическое изображение кривых распределения.
Графическое изображение сгруппированных вариационных рядов распределения облегчает их анализ и позволяет в первом приближении судить о форме кривой генеральной совокупности. Для графического изображения рядов распределения применяют гистограмму (кривая распределения плотности вероятностей, дифференциальная кривая распределения). Гистограмма строится следующим образом: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величинам границ интервалов вариационного ряда, на отрезках строятся прямоугольники с высотами, равными относительным частотам (относительная частота определяется отношением частоты каждого интервала объему выборки и характеризует вероятность попадания случайной величины в интервал). Гистограмму принято преобразовывать в полигон распределения путем соединения середин верхних сторон прямоугольников отрезками. График, построенный по результатам натурных наблюдений, обуславливает вид эмпирической кривой распределения.
Дополнительно к гистограмме строится суммарная кривая распределения (интегральная функция распределения). В практике гидрологических расчетов принято использовать обратную функцию суммарной кривой распределения, называемую обеспеченностью. Обеспеченность характеризует вероятность превышения данной случайной величины. Принцип построения суммарной кривой распределения приводится на примере.
5. Изучение формы кривой распределения.
Для получения приблизительного представления о форме кривой распределения строят графики распределения (гистограмму и полигон распределения). Число наблюдений, по которому строится эмпирическое распределение, обычно невелико и представляет собой выборку из исследуемой генеральной совокупности. Эмпирические данные в определенной степени связаны со случайными ошибками, возникновение которых зачастую неизвестно, что искажает основную закономерность изменение величины признака. При увеличении числа наблюдений одновременно с увеличением количества интервалов и уменьшением их длины полигон постепенно перерастает в кривую распределения.
Кривая распределения характеризует теоретическое (аналитическое) распределение, т.е. распределение, которое получилось бы при полном погашении всех случайных причин, искажающих основную закономерность. Исследование формы распределения включает решение следующих задач:
Определение общего характера распределения;
Выравнивание эмпирического распределения (построение аналитической кривой распределения);
Проверка соответствия найденного теоретического распределения эмпирическому.
В практике статистического исследования природоохранной деятельности приходится встречаться с самыми разными видами распределений. Как правило, однородные, совокупности имеют одновершинную форму, многовершинность свидетельствует о неоднородности изучаемой совокупности.
Выявление общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Для симметричных распределений среднее арифметическое, мода и медиана совпадают, коэффициент асимметрии равен нулю (С, = 0). При правосторонней (С, > 0) между показателями центра распределения существует следующее соотношение М0 < Ме< Хср. Отрицательный знак показателя асимметрии (Cs < 0) свидетельствует о наличии левосторонней асимметрии. Между показателями центра распределения в этом случае имеем М0 > Mt> ХСр.
Оценку степени существенности асимметрии выборки можно определить с помощью средней квадратичной ошибки, которая зависит от объема наблюдений и рассчитывается по формуле:
Wcs=
Если отношение \CS\/Wcs > 3, асимметрия существенна и распределение признака в генеральной совокупности не является симметричным.
Для симметричных распределений оценивается существенность эксцесса. Эксцесс представляет собой выпад вершины эмпирической кривой распределения вверх или вниз от вершины кривой нормального распределения (кривая Гаусса). Если величина коэффициента эксцесса положительная, то распределение островершинное, отрицательная — плосковершинное. Средняя квадратичная ошибка эксцесса рассчитывается по формуле:
Wce=
Если отношение \Ce\!Wce < 3, то эксцесс не свойственен распределению признака в генеральной совокупности.
Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о возможном использовании для анализа эмпирического материала кривых по типу нормального закона распределения.
Если случайная величина имеет плотность распределения то она подчиняется нормальному закону распределения. Нормальное распределение является двух параметрическим, т.е. для его построения необходимо определить среднее арифметическое и среднее квадратическое отклонение. Для приведения кривых к одному началу случайные величины нормируются и центрируются по следующему механизму: из каждого значения вариационного ряда вычитается среднее арифметическое, результат от разности делится на среднее квадратическое отклонение. В данном случае полученный новый ряд величин имеет следующие характеристики: Хср = 0 и σ = 1, Исходя из принципа нормирования и центрирования составлены таблицы теоретических кривых распределения. Количественные значения, имеющие плотность распределения вероятности случайных величин называются нормированной и центрированной функцией нормального закона распределения.
Приведем некоторые свойства нормальной кривой распределения;
Значения функции определены на всей протяженности числовой прямой;
Кривая симметрична относительно максимальной ординаты;
Максимальная ордината соответствует Mо= Ме= Хср
Кривая асимптотически приближается к оси абсцисс, чем больше
значения отклоняются от Хср, тем реже они встречаются;
5)Одинаковые по абсолютному значению, но противоположные по знаку отклонения случайной величины от среднего арифметического равновероятны;
6)Кривые имеют две точки перегиба, находящиеся на расстоянии ± σ от Хср;
7)При ХСр - const увеличением σ кривая становится более пологой, при σ = const с изменением Хср кривая не изменяет своей формы, а лишь сдвигается вправо или влево по оси абсцисс;
8)Отклонение случайной величины от среднего арифметического на ± σ определяет площадь фигуры, равную 68,3% от общей площади, в промежутке Хср ± 2 σ находится 95,4% всех значений признака, Хср ± 3 σ приходится 99,7%.
Использование нормального закона распределения основано на центральной предельной теореме, которая формулируется следующим образом: нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных факторов, действие этих факторов независимо, и ни одна из причин не имеет преобладающего влияния над другими.
6. Проверка статистических гипотез
Статистические критерии можно разделить на следующие группы: критерии однородности и критерии согласия. С помощью критериев однородности исследователь пытается на основе отрывочных данных удлинить ряд данных натурных наблюдений. Экспериментатор проверяет на однородность несколько рядов натурных наблюдений с целью объединения их в один. Необходимость использования критериев однородности обусловлена стремлением получить более совершенные расчетные параметры кривых распределения (с увеличением объема выборки расчетные величины приобретают количественную стабильность, увеличивается существенность каждой характеристики, проявляются закономерности распределения случайных величин). Критериев однородности достаточно много. Наиболее распространенными в практических расчетах являются критерии Фишера и Стьюдента (параметрические критерии, - в основе которых лежит предположение о принадлежности случайных величин к нормальному закону распределения), из непараметрических можно выделить критерий Вилкоксона (нет предположений о законах распределения сравниваемых выборок).
Критерии согласия позволяют подобрать к эмпирическому распределению конкретное теоретическое. Наиболее распространенным в практических расчетах является критерий Пирсона или X2.
Цель использования критериев заключается в определении закономерностей возникновения случайных величин, их свойств, которые определяют сущность прогнозов и играют важную роль в управлении природными явлениями;
Использование статистических критериев осуществляется следующим образом:
а) Выдвигается нулевая гипотеза (Н0): при использовании критериев, например, однородности — исследуемые ряды однородны. Далее на основании выбранного критерия, пытаемся доказать или опровергнуть выдвинутое предположение (Но).
б) Используя зависимости статистического критерия, получаем расчетное значение критерия.
в) Определение области допустимых значений, т.е. тот промежуток на числовой прямой, на котором подтверждается нулевая гипотеза. Область допустимых значений определяется следующим образом:
определяют уровень значимости а, характеризующий вероятность ошибочного решения, в практических расчетах его принимаю равным 0,05. При выбранном уровне значимости доверительная вероятность составляет 95%, что удовлетворяет требованиям практических расчетов;
число степеней свободы (данная величина различна в зависимости от используемого критерия, но в большинстве случаев зависит от объема выборки).
С помощью таблиц или расчетных формул при выбранном уровне значимости и числе степеней свободы рассчитывается критическое значение статистического критерия. Критическое значение характеризует границу между областью допустимых значений и критической областью. Попадание расчетного значения в область допустимых значений подтверждает нулевую гипотезу, исследуемые ряды объединяем в один ряд и проводим статистическую обработку (определяем расчетные параметры). При использовании критериев согласия, если расчетное значение статистического критерия попадает в область допустимых значений, утверждаем, что эмпирическое распределение согласуется с конкретным аналитическим законом распределения, и свойства данного закона распределения можно использовать при анализе данных натурных наблюдений.
ПОРЯДОК ВЫПОЛНЕНИЙ РАСЧЕТНО-ГТАФИЧЕСКОЙ РАБОТЫ.
Допустим, что в результате натурного эксперимента получены следующие количественные значения концентрации конкретного загрязняющего вещества (примерами могут служить нормируемые загрязняющие вещества в окружающей среде: биогены, нефтепродукты, тяжелые металлы, фенолы и т.д.) в определенном пункте контроля. Целью расчета является получение основных статистических характеристик и их анализ, подбор генеральной совокупности по результатам натурных наблюдений.
Исходные данные
|
17.35 |
|
17.47 |
|
21.66 |
|
15.56 |
|
22.41 |
|
24.47 |
|
19.79 |
|
20.62 |
|
24.75 |
|
16.34 |
|
18.99 |
|
16.76 |
|
25.65 |
|
19.37 |
|
26.62 |
|
15.53 |
|
14.59 |
|
19.55 |
|
19.03 |
|
19.57 |
|
19.31 |
|
21.34 |
|
15.23 |
|
14.97 |
|
19.44 |
|
19.64 |
|
21.06 |
|
21.78 |
|
27.77 |
|
20.19 |