
- •Ю.Ю. Герасимов, в.К. Хлюстов
- •Математические методы и модели в расчетах на эвм: применение в лесоуправлении и экологии
- •Часть 1. Вариационная статистика
- •Глава 1.
- •1.1. Общие положения
- •1.2. Основные понятия статистики
- •1.3. Основы теории вероятностей
- •1.3.1. Понятие случайной величины
- •1.3.2. Классическое и статистическое определения вероятности события
- •1.3.3. Основные теоремы теории вероятностей
- •1.4. Контрольные вопросы и задания
- •Глава 2.
- •2.1. Постановка задачи
- •2.2. Классификация и группировка вариант
- •2.3. Графическое представление вариационных рядов
- •2.4.1. Показатели центральной тенденции
- •2.4.2. Показатели вариации
- •2.4.3. Достоверность статистических показателей
- •2.4.4. Показатели скошенности и крутизны
- •2.5. Доверительный интервал
- •2.6. Контрольные вопросы и задания
- •Глава 3.
- •3.1. Постановка задачи
- •3.2. Нормальное распределение
- •3.3. Логнормальное распределение
- •3.4.2. Бета-распределение
- •3.5. Распределение Пуассона
- •3.6. Семейство кривых распределения Джонсона
- •3.7. Семейство кривых Пирсона
- •Контрольные вопросы и задания
- •Глава 4.
- •4.1. Постановка задачи
- •4.3. Сравнение эмпирического распределения с теоретическим (критерий "хи-квадрат")
- •4.5. Сравнение дисперсий двух эмпирических совокупностей
- •4.6. Сравнение частот взвешенных рядов по критерию
- •4.7. Использование пакетов прикладных программ
- •4.8. Контрольные вопросы и задания
- •Глава 5.
- •5.1. Постановка задачи
- •5.2. Однофакторный комплекс
- •5.3. Двухфакторный комплекс
- •5.4. Использование ms Excel для проведения дисперсионного анализа
- •5.4.1. Однофакторный дисперсионный анализ
- •5.4.2. Двухфакторный дисперсионный анализ без повторения
- •5.5. Контрольные вопросы и задания
- •Глава 6.
- •6.1. Постановка задачи
- •6.2. Коэффициент корреляции
- •6.3. Корреляционное отношение
- •6.4. Схема полного корреляционного анализа
- •6.5. Использование пакетов прикладных программ Вычисление коэффициента корреляции с использованием ms Excel
- •Контрольные вопросы и задания
- •Глава 7.
- •7.1. Постановка задачи
- •7.2. Статистический анализ одномерных моделей
- •Уравнение прямой линии
- •Уравнение гиперболы
- •Уравнение показательной кривой
- •Окончательный выбор типа уравнения регрессии
- •7.4. Множественная регрессия
- •7.5. Применение ms Excel для расчета регрессии
- •Часть 2. Исследование операций
- •Глава 8.
- •8.1. Общие положения
- •8.2. Основные понятия системного анализа
- •8.3. Основные понятия исследования операций
- •8.4. Постановка задач принятия оптимальных решений
- •8.5. Контрольные вопросы и задания
- •Глава 9.
- •9.1. Постановка задачи
- •9.2. Графическое решение задачи линейного программирования
- •9.3. Задача линейного программирования в стандартной форме
- •Преобразования неравенств
- •Преобразование неограниченных по знаку переменных
- •2.4. Основы симплекс - метода линейного программирования
- •9.5. Метод искусственных переменных
- •9.6. Анализ чувствительности в линейном программировании
- •9.7. Решение задач линейного программирования на эвм
- •9.8. Контрольные вопросы и задания
- •Глава 10.
- •10.1. Постановка задачи
- •10.2. Метод ветвей и границ
- •10.3. Рекомендации по формулировке и решению задач цп
- •10.4. Задачи оптимизации раскроя
- •XA 0, xB 0, k 0 - целые.
- •XA 0, xB 0, k 0 - целые.
- •10.5. Постановка задачи дискретного программирования
- •Решение задач целочисленного и дискретного программирования на эвм
- •10.7. Контрольные вопросы и задания
- •Глава 11.
- •11.1. Общие понятия
- •11.2. Практические рекомендации при постановке задач динамического программирования
- •11.3. Оптимальное распределение ресурсов
- •11.4. Оптимальное управление запасами
- •11.5. Оптимальная политика замены оборудования
- •11.6. Контрольные вопросы и задания
- •Глава 12.
- •12.1. Постановка задачи
- •12.2. Применение стохастического программирования
- •12.3. Метод статистического моделирования
- •12.4. Контрольные вопросы и задания
- •Глава 13.
- •13.1. Постановка задач нелинейного программирования
- •13.2. Безусловная однопараметрическая оптимизация
- •13.2.1. Методы исключения интервалов
- •13.2.2. Методы полиномиальной аппроксимации
- •13.2.3. Методы с использованием производных
- •13.2.4. Сравнение методов безусловной однопараметрической оптимизации
- •13.3. Безусловная многопараметрическая оптимизация
- •13.3.1. Постановка задачи
- •13.3.2. Методы прямого поиска
- •13.3.3. Градиентные методы
- •13.4. Нелинейная условная оптимизация
- •13.4.1. Постановка задач условной нелинейной оптимизации
- •13.4.2. Методы штрафных функций
- •13.4.3. Методы прямого поиска
- •13.4.4. Методы линеаризации
- •13.5. Решение задач нелинейной оптимизации на эвм
- •13.6. Контрольные вопросы и задания
- •Приложение 1 Значения t - распределения Стьюдента при доверительной вероятности р и числе степеней свободы k
- •Плотность вероятности нормального распределения
- •Приложение 3 Значения χ2 при доверительной вероятности р и числе степеней свободы k
- •Продолжение приложения 3
- •Значения -функции
- •Приложение 5 Значения - в распределении Джонсона
- •Продолжение приложения 5
- •Продолжение приложения 5
- •Продолжение приложения 5
- •Приложение 6
- •Продолжение приложения 6
- •Продолжение приложения 6
- •Продолжение приложения 6
- •Приложение 7
- •Продолжение приложения 7
- •Продолжение приложения 7
- •Продолжение приложения 7
4.3. Сравнение эмпирического распределения с теоретическим (критерий "хи-квадрат")
При решении вопроса о различии между эмпирическим распределением и теоретическим нулевая гипотеза заключается в том, что генеральная совокупность, выборкой из которой является данное эмпирическое распределение, распределена по предполагаемому теоретическому закону, а отклонение эмпирического распределения от теоретического есть просто отклонение выборочного распределения от генерального (из-за случайного характера образования выборки).
Проверку гипотез о законах распределения производят с помощью специально разработанных критериев. Один из них - критерий согласия 2 (предложен К.Пирсоном в 1890 г.) - нашел широкое применение в лесном хозяйстве. Критерий представляет собой сумму квадратов отклонений эмпирических частот n от теоретических n', отнесенную к теоретическим частотам:
.
(4.2)
Распределение вероятных значений случайной величины 2 является непрерывным и асимметричным. Оно зависит от числа степеней свободы k и приближается к нормальной кривой по мере увеличения числа испытаний N. Для того, чтобы оценки были более точными, выборка должна содержать не менее 50 вариант. Поэтому часто считают, что применение критерия 2 требует того, чтобы в крайних классах вариационного ряда содержалось не менее пяти вариант. Если в крайних классах содержится меньше, чем пять вариант, то вычисленные и эмпирические частоты объединяются до указанного минимума и соответственно уменьшают число классов вариационного ряда. Число степеней свободы устанавливают по вторичному числу классов с учетом ограничений свободы вариации, которая бывает разной. Так, при оценке эмпирических распределений, следующих нормальному закону, число степеней свободы k=N-3 (с учетом трех ограничений вариации этого закона).
Для проверки нулевой гипотезы нужно фактически полученную величину ф2 сравнить с ее критическим значением st2. Если ф2st2, то нулевая гипотеза должна быть отвергнута на принятом уровне значимости с числом степеней свободы k. Значения теоретических критериев st2 приведены в Приложении 3.
Пример 4.3. Проверим гипотезу о согласии между теоретическим (логнормальная модель) и эмпирическими рядами распределения диаметра из табл. на рис. 4.2. Вычисленное в MS Excel значение ф2 = 2,78. Число степеней свободы k=8-3=5. Табличное значение критерия при k=5 при =0,1 равно 012 = 15,09. Следовательно, вычисленная статистическая характеристика попадает в зону допустимых значений, и гипотеза о соответствии ряда распределения логнормальному закону не отвергается.
4.4. Сравнение средних значений двух эмпирических совокупностей (критерий Стьюдента)
Английский математик В. Госсет в 1908 г. нашел закон распределения величины
,
Рис. 4.2.
в которой генеральный параметр заменен на его выборочную характеристику s, т.е. нашел закон распределения значений
.
(4.3)
Оказалось, что отношение разности между выборочной и генеральной средними к ошибке выборочной средней непрерывно распределяется согласно следующей формуле:
для
-
< t<
+,
(4.4)
где
С - константа, зависящая только от числа степеней свободы;
k = n-1.
Из приведенной зависимости следует то, что t-распределение зависит только от объема выборки n, причем с увеличением n t-распределение быстро приближается к нормальному с параметрами =0 и =1 и уже при n30 не отличается от него.
Для практического использования t-распределения составлена специальная таблица, в которой содержатся критические значения tst для разных уровней значимости и чисел степеней свободы k ( Приложение 1). Сравнивая друг с другом две независимые выборки, взятые из нормально распределенных совокупностей с параметрами 1 и 2 , обозначим 1 - 2 = D, а дисперсию этой разницы 2D. Значения генеральных параметров неизвестны, однако можно найти величины выборочных средних M1, M2, разность между ними M1 - M2 = d и ошибку разницы sd. Ошибка разности средних sd определяется по следующим формулам:
(4.5)
или
.
Так как, согласно H0 - гипотезе 1 - 2 = 0, то t-критерий выражается в виде отношения разности выборочных средних к своей ошибке, т.е.
t = d / sd . (4.6)
H0 - гипотезу отвергают, если фактически установленная величина t-критерия tф превысит или окажется равной критическому значению tst для принятого уровня значимости и числа степеней свободы k = n1+n2-2, т.е. tф tst .
Вышеизложенное применение t-критерия предполагает, что дисперсии сравниваемых групп одинаковы. Если это не так, то величину критерия и число степеней свободы находят по формулам:
,
(4.7)
.
(4.8)
Пример 4.4. Необходимо выяснить эффективность воздействия двухприемных постепенных рубок главного пользования на естественное лесовозобновление в сухих лишайниковых сосняках. Опыт может быть поставлен следующим образом: в качестве контроля закладывается делянка, на которой проводится сплошная рубка деревьев, в качестве опытного варианта служит двухприемная постепенная рубка. Площадки по учету возобновления одного размера размещаются в систематическом порядке вдоль делянок. При подсчете возобновления сосны получились результаты, приведенные на рис. 4.4, из которых следует, что средние значения для опытной и контрольной делянок не совпадают. Однако это еще не дает основания считать доказанной эффективность применения постепенных рубок в лишайниковых сосняках.
На рис. 4.3. приведена последовательность нахождения значений t-критерия tф = 2,01 и числа степеней свободы k=26 рассматриваемой задачи с использованием программы MS Excel. Так как tф < t01 (26) 2,7 (см. Приложение 1), то нулевая гипотеза не отвергается. Следовательно, расхождение между опытом и контролем можно считать незначимым, т.е. применение постепенных рубок в сухих лишайниковых сосняках не обеспечивает увеличения естественного возобновления леса.
Рис. 4.3.
Пример 4.5. Каждый из двух сортов условной растениеводческой продукции высевался на семи делянках одного размера. На рис. 4.4 приведена урожайность в кг. Урожай сорта II на одной из делянок был поврежден и поэтому не включен в дальнейшую обработку. Там же приведена последовательность нахождения значений t-критерия рассматриваемой задачи с использованием программы MS Excel.
Так как средний урожай сорта I (M1 = 8,27) выше, чем для сорта II (M2 = 6,78), то напрашивается вывод, что вообще сорт I более урожайный. Но такой вывод может оказаться ложным, т.к. каждое из чисел 8,27 и 6,78 есть не генеральное, а выборочное среднее. Другая случайная выборка, также состоящая из 7 делянок, наверняка дала бы для M1 значение, отличное от 8,27; в частности, это новое значение могло бы оказаться меньше, чем 8,27. С другой стороны, и для M2 выборка дала бы значение, отличное от 6,78, в частности, могло бы получиться число большее, чем 6,78. Поэтому повторение всего опыта с обоими сортами могло бы дать результат M1 < M2. Очевидно, вероятность такого исхода тем меньше, чем больше отношение M1 - M2 к sd.
Таким образом, опять приходим к критерию Стьюдента для оценки значимости того, что M1 превышает M2. Значение t-критерия tф = 3,15, а число степеней свободы k=11. Так как tф > t01 (11) 2,17 (см. Приложение 1), то нулевая гипотеза отвергается.
Рис. 4.4.