- •Содержание
- •Раздел 1. Общие вопросы подготовки к исследовательской работе 8
- •Раздел 2. Анализ распределения 38 Предисловие
- •Введение в математические методы моделирования
- •Раздел 1. Общие вопросы подготовки к исследовательской работе Глава 1. Объекты и метод исследований математическими методами в лесном хозяйстве
- •1.1. Примеры лесохозяйственных задач, решаемых с использованием математических методов
- •1.2. Основные определения, используемые в математических методах моделирования
- •1.3. Вероятностный характер статистических выводов
- •1.4. Метод исследования переменных (случайных) величин
- •Глава 2. Измерение переменных величин и измерительные системы
- •2.1. Измерение физических величин. Понятие об измерениях
- •2.2. Ошибки измерений
- •2.3. Свойства случайных ошибок
- •2.4. Измерительные системы
- •2.5. Международная система единиц (си), (si).
- •2.6. Единицы, не входящие в си (si)
- •2.7. Физические величины, часто применяемые в лесных измерениях
- •2.8. Шкалы измерений
- •Раздел 2. Анализ распределения Глава 1. Распределения случайных величин
- •1.1. Что означает понятие «распределения» в статистических исследованиях?
- •1.2. Наблюдение. Формирование выборок
- •Глава 2. Методы первичной обработки и анализа результатов измерений
- •2.1. Ранжирование данных наблюдения
- •2.2. Группировка данных в вариационный ряд
- •2.3. Графическое изображение вариационного ряда
- •Глава 3. Статистические показатели распределения
- •3.1. Статистики положения значений случайной величины
- •3.2. Статистики изменчивости значений случайной величины
- •3.3. Закон больших чисел
- •3.4. Среднее квадратичное отклонение в нормальном распределении
- •3.5. Статистики формы ряда распределения
2.3. Графическое изображение вариационного ряда
Полигон распределения
Полигон строится в прямоугольной системе координат. На горизонтальной оси откладываются серединные значения классов, по вертикальной оси - соответствующие этим значениям частоты. Чтобы график был максимально информативным и эстетичным необходимо при построении соблюдать три правила. Во-первых, длина вертикальной оси должна составлять примерно 5/8 длины горизонтальной оси. Во-вторых, точка начала отсчета на оси Х (точка пересечения с осью У) должна начинаться с нижней границы первого интервала. В противном случае значительная часть рабочего поля графика займет пустота, и чем дальше минимальное значение отстоит от нуля, тем больше пустого места на графике. В третьих, подписи по осям должны содержать округленные интервальные значения.
Работы по построению графика начинаются с определения предполагаемой длины горизонтальной оси (ось Х). Если измерять длину оси в сантиметрах, то длина оси не желательна меньше числа классов. В противном случае будут неудобства с определением местоположения середин классов. В рассматриваемом примере имеется вариационный ряд, состоящий из 8 классов. Следовательно, удобно взять длину оси Х 8 см, можно 16 см и т.д. Из сказанного следует, что вначале нужно рассчитать масштаб по оси Х, т.е. определить, сколько сантиметров оси удобно занять под один класс. Можно воспользоваться таким алгоритмом, (17):
Mx = (Xmax - Xmin )/Lx, (17),
где: Mx - величина, показывающая, сколько единиц переменной величины (следует округлить) откладывать в 1 см оси Х;
Xmax - максимальное значение признака;
Xmin - минимальное значение признака;
Lx - длина оси Х.
Точка начала отсчета (пересечение координат) на оси «Х» должна соответствовать нижней границе первого класса. В соответствие с вычисленным масштабом на оси Х нанести точки и цифровые значения середин классов. Посчитать фактическую длину оси «Х».
Рассчитать оптимальную длину оси «У» по алгоритму (18), результат округлить до целого числа.
Ly = 5/8 * Lx. (18)
По оси «У» откладываются частоты. Поскольку на нижней границе первого класса нет ни одного значения переменной величины, то отсчет на оси «У» начинается с нуля. Для вычисления масштаба по оси «У» необходимо максимальную частоту разделить на расчетную длину оси «У» и результат округлить до целого числа. Полученное число будет соответствовать количеству вариант переменной величины, которое следует откладывать в 1 см оси «У». Следует подписать частоты по оси «У» для точек, соответствующих каждому сантиметру или через два см и т.д.
Таким образом, шкалы по осям «Х» и «У» построены. Можно переходить к определению местоположения точек на графике. Точка ставится на месте пересечения перпендикуляров, восстанавливаемых из середины класса на оси «Х» и определенной методом интерполирования точки на оси «У», соответствующей частоте этого класса.
Полученные точки на рабочем поле графика следует соединить прямыми отрезками, полученную ломаную линию замкнуть на нижнюю границу первого класса на оси «Х», последнюю точку - на верхнюю границу последнего класса. Замкнутая плоская фигура в форме многоугольника, образованная ломаной линией частот и отрезком оси Х от минимального до максимального значения переменной величины, называется полигоном распределения, (рис 7). Полигон в условном масштабе характеризует распределение вариант в выборке из генеральной совокупности переменной величины.
По форме полигона распределения можно судить об однородности выборки, степени изменчивости вариант в выборке. Однако говорить об однородности или неоднородности генеральной совокупности, из которой получена выборка, можно только в том случае, если при сборе материала была достигнута устойчивость в распределении. Устойчивость достигается при достаточно большом объеме выборки.
Р
исунок
7 – График распределения Рисунок 8 –
График распределения.
Гистограмма
Некоторые исследователи используют другой вид графика для вариационного ряда. После того, как на график нанесены частотные точки, их не соединяют отрезками прямой линии, а проводят ординаты из верхних и нижних границ интервалов до уровня частот. Вершины ординат интервала соединяют прямыми отрезками, параллельными оси «Х» и проходящими через точку частоты класса. Таким образом, частота каждого класса выглядит в форме столбика, высота которого в масштабе равна частоте интервала. Такие графики называют гистограммами или столбчатыми диаграммами, или частотными гистограммами (рис 8). Назначение их такое же, как и полигонов распределения, т.е. они также призваны решать три задачи: - выявить грубые ошибки, обнаружить выбросы и показать эмпирический ряд распределения.
Кумулята
В отличие от первых двух графиков, использующих середины классов и частоты, кумулята строится по данным границ классов и накопленных частот. Смысл графика в том, чтобы показать аккумулированные частоты, отсюда и его название - кумулята. Ниже представлена таблица исходных данных для построения кумуляты, выписанных из частотной таблицы.
Таблица 16 – Исходные данные высот 75-летнего сосняка
Верхние границы |
7,0 |
9,0 |
11,0 |
13,0 |
15,0 |
17,0 |
19,0 |
21,0 |
23,0 |
Накопленные частоты |
0 |
5 |
18 |
40 |
67 |
83 |
94 |
98 |
100 |
В таблице показана верхняя граница 7,0 м и накопленная частота ноль деревьев. Здесь 7,0 - это верхняя граница класса, предшествующего вариационному ряду исследуемой выборки деревьев. В нем нет ни одного дерева, так как минимальная высота деревьев выборки составляет 7,6 м. Использование предшествующего класса удобно тем, что позволяет проследить закономерность накапливания частот, начиная от первого до последнего дерева в выборке.
Длина оси «Х» и разбивка на классы та же, что и в предыдущих графиках. Отличие в том, что подписываются только верхние границы классов. Верхняя граница предшествующего класса 7 м размещается в начале оси на пересечении координат.
Длина оси «У» тоже равна 5/8 длины оси Х. Однако масштаб надо пересчитать, так как откладываются накопленные частоты, а максимальная накопленная частота равна объему выборки 100 вариант. Алгоритм вычисления масштаба:
My = N / Ly. (21)
Масштаб My показывает, сколько вариант следует откладывать в одном сантиметре оси «У». Разумеется, это число надо округлять до целого значения.
Точки на графике получают на пересечении координат, восстанавливаемых из верхних границ классов на оси «Х» и интерполированных точек для частот по оси «У». Соединив прямыми отрезками точку верхней границы предшествующего класса, с точками накопленных частот вариационного ряда, получают линию накопленных частот эмпирического распределения, рис 5.
Р
исунок
5 – График накопленных частот
Задачи, которые решают с помощью кумуляты, более сложные. Накопленные частоты и кумуляту используют для получения выровненных частот.
Полигон, гистограмму и кумуляту можно также построить по частостям и накопленным частостям. Преимущество частостей над частотами состоит в том, что по ним можно видеть вероятности, так как частость есть отношение частоты к объему выборки. При достижении устойчивости частость может быть сколь угодно близкой к вероятности.
Таблица 16 – Частости распределения деревьев по высоте 75-летнего древостоя
Середины классов |
8 |
10 |
12 |
14 |
16 |
18 |
20 |
22 |
Частости |
0,05 |
0,13 |
0,22 |
0,27 |
0,16 |
0,11 |
0,04 |
0,02 |
Таблица 17 – Накопленные частости распределения деревьев по высоте 75-летнего древостоя
Верхние границы классов |
7,0 |
9,0 |
11,0 |
13,0 |
15,0 |
17,0 |
19,0 |
21,0 |
23,0 |
Накопленные частости |
0,0 |
0,05 |
0,18 |
0,40 |
0,67 |
0,83 |
0,94 |
0,98 |
1,00 |
Полигон и кумулята
частостей высоты деревьев.
Рисунок 6 – Полигон частостей Рисунок 7 – Кумулята частостей
После построения полигона или гистограммы распределения частот проводится их анализ на предмет наличия максимума или максимумов и степени крутизны возрастания или убывания частот. По отношению к ординате среднего арифметического значения оценивается симметричность левой и правой ветвей графика. Наличие нескольких максимумов указывает на неоднородность выборки, в ней присутствуют элементы разных генеральных совокупностей. Выше обращалось внимание, что многовершинность может быть и следствием недостаточного объема выборки, что устраняется увеличением объема выборки. В противном случае выборку надо признать неоднородной и, если возможно, следует разбить ее на однородные совокупности. Правда, сделать это объективно в камеральных условиях практически невозможно. Необходимы дополнительные полевые наблюдения с предварительной оценкой генеральной совокупности на предмет её разделения на две совокупности.
Симметричность и крутость графиков имеет большое значение в связи со статистическими закономерностями и выводами о надежности выборочных статистических показателей, но об этом будет ниже в главе 4.
