
- •Ю.Ю. Герасимов, в.К. Хлюстов
- •Математические методы и модели в расчетах на эвм: применение в лесоуправлении и экологии
- •Часть 1. Вариационная статистика
- •Глава 1.
- •1.1. Общие положения
- •1.2. Основные понятия статистики
- •1.3. Основы теории вероятностей
- •1.3.1. Понятие случайной величины
- •1.3.2. Классическое и статистическое определения вероятности события
- •1.3.3. Основные теоремы теории вероятностей
- •1.4. Контрольные вопросы и задания
- •Глава 2.
- •2.1. Постановка задачи
- •2.2. Классификация и группировка вариант
- •2.3. Графическое представление вариационных рядов
- •2.4.1. Показатели центральной тенденции
- •2.4.2. Показатели вариации
- •2.4.3. Достоверность статистических показателей
- •2.4.4. Показатели скошенности и крутизны
- •2.5. Доверительный интервал
- •2.6. Контрольные вопросы и задания
- •Глава 3.
- •3.1. Постановка задачи
- •3.2. Нормальное распределение
- •3.3. Логнормальное распределение
- •3.4.2. Бета-распределение
- •3.5. Распределение Пуассона
- •3.6. Семейство кривых распределения Джонсона
- •3.7. Семейство кривых Пирсона
- •Контрольные вопросы и задания
- •Глава 4.
- •4.1. Постановка задачи
- •4.3. Сравнение эмпирического распределения с теоретическим (критерий "хи-квадрат")
- •4.5. Сравнение дисперсий двух эмпирических совокупностей
- •4.6. Сравнение частот взвешенных рядов по критерию
- •4.7. Использование пакетов прикладных программ
- •4.8. Контрольные вопросы и задания
- •Глава 5.
- •5.1. Постановка задачи
- •5.2. Однофакторный комплекс
- •5.3. Двухфакторный комплекс
- •5.4. Использование ms Excel для проведения дисперсионного анализа
- •5.4.1. Однофакторный дисперсионный анализ
- •5.4.2. Двухфакторный дисперсионный анализ без повторения
- •5.5. Контрольные вопросы и задания
- •Глава 6.
- •6.1. Постановка задачи
- •6.2. Коэффициент корреляции
- •6.3. Корреляционное отношение
- •6.4. Схема полного корреляционного анализа
- •6.5. Использование пакетов прикладных программ Вычисление коэффициента корреляции с использованием ms Excel
- •Контрольные вопросы и задания
- •Глава 7.
- •7.1. Постановка задачи
- •7.2. Статистический анализ одномерных моделей
- •Уравнение прямой линии
- •Уравнение гиперболы
- •Уравнение показательной кривой
- •Окончательный выбор типа уравнения регрессии
- •7.4. Множественная регрессия
- •7.5. Применение ms Excel для расчета регрессии
- •Часть 2. Исследование операций
- •Глава 8.
- •8.1. Общие положения
- •8.2. Основные понятия системного анализа
- •8.3. Основные понятия исследования операций
- •8.4. Постановка задач принятия оптимальных решений
- •8.5. Контрольные вопросы и задания
- •Глава 9.
- •9.1. Постановка задачи
- •9.2. Графическое решение задачи линейного программирования
- •9.3. Задача линейного программирования в стандартной форме
- •Преобразования неравенств
- •Преобразование неограниченных по знаку переменных
- •2.4. Основы симплекс - метода линейного программирования
- •9.5. Метод искусственных переменных
- •9.6. Анализ чувствительности в линейном программировании
- •9.7. Решение задач линейного программирования на эвм
- •9.8. Контрольные вопросы и задания
- •Глава 10.
- •10.1. Постановка задачи
- •10.2. Метод ветвей и границ
- •10.3. Рекомендации по формулировке и решению задач цп
- •10.4. Задачи оптимизации раскроя
- •XA 0, xB 0, k 0 - целые.
- •XA 0, xB 0, k 0 - целые.
- •10.5. Постановка задачи дискретного программирования
- •Решение задач целочисленного и дискретного программирования на эвм
- •10.7. Контрольные вопросы и задания
- •Глава 11.
- •11.1. Общие понятия
- •11.2. Практические рекомендации при постановке задач динамического программирования
- •11.3. Оптимальное распределение ресурсов
- •11.4. Оптимальное управление запасами
- •11.5. Оптимальная политика замены оборудования
- •11.6. Контрольные вопросы и задания
- •Глава 12.
- •12.1. Постановка задачи
- •12.2. Применение стохастического программирования
- •12.3. Метод статистического моделирования
- •12.4. Контрольные вопросы и задания
- •Глава 13.
- •13.1. Постановка задач нелинейного программирования
- •13.2. Безусловная однопараметрическая оптимизация
- •13.2.1. Методы исключения интервалов
- •13.2.2. Методы полиномиальной аппроксимации
- •13.2.3. Методы с использованием производных
- •13.2.4. Сравнение методов безусловной однопараметрической оптимизации
- •13.3. Безусловная многопараметрическая оптимизация
- •13.3.1. Постановка задачи
- •13.3.2. Методы прямого поиска
- •13.3.3. Градиентные методы
- •13.4. Нелинейная условная оптимизация
- •13.4.1. Постановка задач условной нелинейной оптимизации
- •13.4.2. Методы штрафных функций
- •13.4.3. Методы прямого поиска
- •13.4.4. Методы линеаризации
- •13.5. Решение задач нелинейной оптимизации на эвм
- •13.6. Контрольные вопросы и задания
- •Приложение 1 Значения t - распределения Стьюдента при доверительной вероятности р и числе степеней свободы k
- •Плотность вероятности нормального распределения
- •Приложение 3 Значения χ2 при доверительной вероятности р и числе степеней свободы k
- •Продолжение приложения 3
- •Значения -функции
- •Приложение 5 Значения - в распределении Джонсона
- •Продолжение приложения 5
- •Продолжение приложения 5
- •Продолжение приложения 5
- •Приложение 6
- •Продолжение приложения 6
- •Продолжение приложения 6
- •Продолжение приложения 6
- •Приложение 7
- •Продолжение приложения 7
- •Продолжение приложения 7
- •Продолжение приложения 7
2.4.2. Показатели вариации
Средняя величина не дает достаточного представления о свойствах изучаемой совокупности. Являясь показателем центральной тенденции, т. е. наиболее представительной характеристикой изучаемого объекта, она не характеризует степени разнообразия (изменчивости, варьирования) составляющих его единиц. Действительно, ряды из вариант 1, 3, 4, 5, 7 и 3, 4, 4, 4, 5 характеризуются одинаковой средней арифметической х=4, но отличаются по степени вариации значений признака.
Определение меры изменчивости признака или качества рассматриваемого объекта или явления считается не менее важной задачей, чем характеристика средних величин. Более того, доверие к средней величине может быть определено лишь постольку, поскольку дана оценка варьированию величин в рассматриваемой совокупности вариант.
Главной целью статистических методов является выявление вариации, которая характеризуется рядом показателей:
размах варьирования;
дисперсия;
среднее квадратическое отклонение;
коэффициент вариации.
Размах варьирования. Разность между наибольшим и наименьшим значением признака называется размахом, который является грубым показателем варьирования признака. В двух вышеприведенных рядах, состоящих из пяти вариант, он равен 7-1=6 и 5-3=2, т. е. указывает, что в общем вариация в первой группе цифр в 3 раза больше, чем во второй. Однако, опираясь лишь на два крайних члена ряда, величина размаха не учитывает внутреннего, между этими крайними значениями, рассеяния вариант. Кроме того, крайние значения как редко встречающиеся члены ряда весьма неустойчивы по своему размеру и сильно зависят от объема выборочных наблюдений. Несмотря на это, при малых выборках, повторяемых несколько раз, размах варьирования нашел широкое применение.
Среднее квадратическое отклонение и дисперсия. Основным показателем вариации (изменчивости) считается среднее квадратическое отклонение, которое определяется как корень квадратный из средней арифметической квадратов отклонений вариант от их средней арифметической величины.
Среднее квадратическое отклонение для выборки обозначают через s, а для генеральной совокупности -. Согласно определению:
s
=
=
,
(2.11)
В математической статистике оперируют средним квадратом отклонений (s2 для выборки и 2 для генеральной совокупности), называемым дисперсией, которая рассчитывается по формуле (2.12).
s2
=
=
(2.12)
Для расчетов по вариационному ряду среднее квадратическое отклонение выразится формулой:
s=
=
=
,
(2.13)
а дисперсия
s2
=
=
=
(2.14)
В уравнениях (2.11-2.14)
x1, x2, ..., xn - варианты ряда (средние значения классов);
M - средняя арифметическая;
n1, n2, ..., nn - частоты в классах;
N - общий объем ряда.
Оценивая величину по выборочному значению s, при обработке выборки с числом наблюдений N меньше 100 в качестве делителя в формулах (2.11) - (2.14) принимают не N, а N-1. Это число называют числом степеней свободы. Такое название объясняется тем, что в статистике при вычислении любых средних величин используют число независимых величин. При вычислении s одно из отклонений оказывается несвободным. Оно равно сумме всех остальных, взятых с обратным знаком.
Таким образом, общей формулой для нахождения среднего квадратического отклонения будет:
s
=
=
,
(2.15)
а для дисперсии
s2
=
=
(2.16)
При обработке вариационных рядов формулы принимают вид:
s=
=
=
,
(2.17)
s2
=
=
=
(2.18)
Среднее квадратическое отклонение называется также стандартным отклонением. Полученная величина является именованной и выражается в тех же единицах измерения, что и отдельные значения признака.
Средняя величина M и среднее квадратическое отклонение s дают полную количественную характеристику любой эмпирической совокупности, подчиняющейся закону нормального распределения. Средняя арифметическая отображает действие на признак основных факторов. Среднее квадратическое отклонение, характеризующее варьирование значений признака вокруг центра распределения, является мерой степени влияния на признак различных второстепенных причин, вызывающих варьирование.
В результате действия этих причин наиболее частыми будут варианты с небольшими отклонениями. Чем отклонения больше, тем варианты встречаются реже. Это положение подробно рассмотрено в учебной литературе при анализе свойств нормального распределения вероятностей случайного события x. В статистических совокупностях с нормальным (или близким к нормальному) распределением частот 68,3% вариант имеют значения, не превосходящие ± и только 31,7% вариант по своей величине выходят за эти пределы. Отсюда вероятность того, что любая взятая наугад варианта ряда находится вне пределов ± равна 0,317. За пределами ±2 лежит всего 4,5%, а за пределами ±3 - 0,3% общего числа вариант. Следовательно, вероятность того, что взятая наугад варианта ряда окажется отклоняющейся от на величину, большую 2 и З, соответственно равна 0,045 и 0,003.
Пример 2.9 использования функции ДИСП() MS Excel для оценивания дисперсии по выборке.
Синтаксис: ДИСП(число1;число2; ...), где число1, число2, ... - это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности.
Замечания:
ДИСП предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, вычисляйте дисперсию, используя функцию ДИСПР.
Логические значения, такие, как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, пользуйтесь функцией рабочего листа ДИСПА.
Пример. На рис. 2.7 приведено окно программы MS Excel, демонстрирующее применение функции ДИСП() для определения выборочной средней арифметической s2 распределения диаметров деревьев, записанных в ячейках А2-А21 (см. пример 2.1).
ДИСП (A2:A21) равняется 34,5 см2.
Коэффициент вариации. Коэффициент вариации, как и s или, является показателем изменчивости признака, выражая ее в относительных единицах. Он представляет собой среднее квадратическое отклонение отдельных вариант ряда от средней величины, выраженное в процентах:
v = (s / M) 100%. (2.19)
Являясь показателем, не зависящим от принятых единиц измерения вариант, коэффициент вариации может применяться для сравнительной оценки величины варьирования различных признаков. Вместе с тем он в значительной степени зависит от величины средней арифметической, и поэтому его применение должно быть ограничено случаями, когда имеет место естественное от нуля начало отсчета или когда ряды распределения имеют сходные начала отсчета.
Коэффициент дифференциации. Устранить указанное ограничение позволяет коэффициент дифференциации, который без группировки вариант в классы рассчитывается по формуле:
.
(2.20)
Для совокупностей со сгруппированными вариантами формула принимает вид:
,
(2.21)
где
Xo – значение первого класса ряда распределения;
С – ширина классового промежутка.
При начале ряда распределения в пересечении осей координат, величины коэффициентов вариации и дифференциации совпадают.
Поскольку
в лесоводственных и таксационных
исследованиях
для нормальной
кривой распределения применяется
вероятность 0,99865 (
3),
то на ее основе разработана классификация
степени дифференциации:
Величина коэффициента Степень дифференциации
дифференцаации
до 13% слабая
14 - 27% умеренная
28 – 38% средняя (нормальная)
39- 53% значительная
54-70% большая
более 70% очень большая