- •Н.К. Чертко, а.А. Карпиченко
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Статистические показатели распределения
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •Влияние высоких доз торфа на урожай ячменя
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •Матрица таксономических метрик
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Решетка для вычисления информационных показателей
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •Итоговые значения коэффициентов корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Корреляционная матрица r для восьми параметров агроландшафта
- •Корреляционная матрица r с приближенными значениями общностей
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Этапы вычисления приближенных значений коэффициентов
- •Вычисление коэффициентов при факторе f2
- •Этапы вычисления приближенных значений коэффициентов
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •Исходные данные для землеустроительной задачи
- •8.3. Правила работы с матрицей
- •Исходные данные транспортной задачи
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •Базисный допустимый план (матрица 1)
- •Результаты первого перераспределения поставок (матрица 2)
- •Результаты второго распределения поставок (матрица 3)
- •Результаты третьего распределения поставок (матрица 4)
- •8.5. Дельта-метод Аганбегяна
- •Рабочая матрица прироста затрат
- •Первый вариант перемещения поставки
- •Второе перемещение поставки
- •Третье перемещение поставки
- •Четвертое перемещение поставки
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •Форма записи исходных данных в четырехблочную матрицу
- •8.6.5. Многопродуктовая транспортная задача
- •Мощности и спросы по торфу
- •Мощности и спросы по бурому углю
- •Оптимальный вариант распределения поставок в условных единицах
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •Матрица кратчайших расстояний между вершинами и индексы доступности вершин
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Выращивание сельскохозяйственных культур в разрезе областей
- •Глава 10 динамические ряды
- •Виды трендовых моделей
- •10.1. Показатели динамического ряда
- •Уровень производства промышленной продукции (пп) предприятия
- •10.2. Сглаживание динамических рядов
- •Сглаживание динамического ряда укрупнением интервалов и скользящим средним
- •10.3. Выравнивание по способу наименьших квадратов
- •Выравнивание динамического ряда по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n и уровня значимости α
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
- •Глава 9 146
- •Глава 10 166
- •Глава 11 174
- •Глава 12 179
Однофакторный дисперсионный анализ
Варианты опыта (фактор) |
Урожай ячменя по повторностям, ц/га* |
По повторностям (признакам) (i) | ||||||
()2 |
Mi | |||||||
Контроль (фон) |
6889 |
20,75 | ||||||
Фон+200 т/га торфа |
15 625 |
31,25 | ||||||
Фон+300 т/га торфа |
20 164 |
35,50 | ||||||
Фон+400 т/га торфа |
21 025 |
36,25 | ||||||
По факторам (k) |
121 |
124 |
126 |
124 |
495
15935 |
63703 |
Мобщ 30,93 | |
3821 |
3986 |
4102 |
4026 | |||||
14 641 |
15 376 |
15 876 |
15 376 | |||||
Mk |
30,25 |
31,00 |
31,50 |
31,00 |
= 61 269 |
Примечание: * В числителе – опытные данные, в знаменателе – квадраты этих показателей
Следующий этап работы – нахождение сумм квадратов отклонений, т. е. расчленение общего варьирования признака на составные части исходя из равенства:
Θ = Θ1 + Θ2 + Θ3,
где Θ – сумма квадратов отклонений по общему варьированию данных, Θ1 – по группам фактора (варианты опыта), Θ2 – по повторностям опыта, Θ3 – по остаточному варьированию, вызванному неучтенными факторами.
Общая сумма квадратов отклонений вычисляется следующим образом:
Θ = Σ(Σx2i,k) – (ΣΣxi,k)2 / N
Подставив данные из табл. 2.1, получим: Θ =15 935 – 4952: 16 = 621. Затем находим сумму квадратов отклонений по группам фактора (варианты опыта) по формуле:
Θ1 = [Σ(Σxi)2 – (ΣΣxi,k)2/k] / i, (2.1)
где k – число групп фактора, т. е. 4; i – число повторностей, т. е. 4. В данном случае должно выдержаться равенство N = ki = 4∙4 = 16. По формуле (2.1) вычислим:
Θ1 = [63703 – 4952 : 4] : 4 = 611,75.
Сумму квадратов отклонений по повторностям опыта находим по формуле
Θ2 = [Σ(Σxk)2 – (ΣΣxi,k)2/i] / k, (2.2)
где i – число повторностей, т. е. 4; k — число слагаемых в каждой сумме Σxk, т. е. 4.
Вычисляем Θ2 по формуле (2.2):
Θ2 = [61269 – 4952 : 4] : 4 = 3,25.
Таблица 2.2
Результаты однофакторного дисперсионного анализа
Варьирование данных |
Сумма квадратов отклонений Θ |
Степень свободы ν |
Дисперсия σ2 = Θ/ν |
Критерий Фишера | |
Fф |
Fт | ||||
Общее по опыту |
621,00 |
15 |
41,40 |
– |
– |
По вариантам опыта |
611,75 |
3 |
203,91 |
304,31 |
8,81 |
По повторностям |
3,25 |
3 |
1,08 |
1,61 |
8,81 |
Случайное (остаточное) |
6,00 |
9 |
0,67 |
– |
– |
Сумма квадратов отклонений по остаточному варьированию определяется из равенства
Θ3 = Θ – Θ1 – Θ2. (2.3)
Подставив значение вычисленных сумм соответствующих квадратов отклонений в формулу (2.3), получим
Θ3 = 621 – 611,75 – 3,25 = 6,00
Проводим дисперсионный анализ данных урожая ячменя (табл. 2.2). Вносим в таблицу рассчитанные суммы квадратов отклонений (Θ, Θ1, Θ2, Θ3). Число степеней свободы получаем следующим образом: по общей сумме квадратов отклонений ν = N – 1 = 16 – 1 = 15; по вариантам опыта ν1 = n1 – 1 = 4 – 1 = 3; по повторностям ν2 = n2 – 1 = 4 – 1 = 3; по остаточной сумме ν3 = ν – ν1 – ν2 = 15 – 3 – 3 = 9.
Дисперсия определяется путем деления сумм квадратов отклонений (Θ, Θ1, Θ2, Θ3) на соответствующие им числа степеней свободы (ν, ν1, ν2, ν3), что можно выразить в общем виде формулой σ2 = Θ/ν, получим σ2= 621 : 15=41,40.
Оценку сходства или различия между вариантами опыта можно проводить по критерию Фишера, критерию Стьюдента или НСР.
Поскольку Fф > Fт (см. табл. 2.2 и прил. 5), то это позволяет сделать вывод, что внесение больших доз торфа положительно влияет на величину урожая ячменя в агроландшафте.
Наиболее распространен в дисперсионном анализе для оценки результатов опыта критерий НСР, алгоритм которого приводим ниже. Вначале определяем среднее квадратическое отклонение из дисперсии, полученной в результате случайного варьирования (см. табл. 2.2): , затем вычисляем обобщенную ошибку среднего: . Поскольку ошибка среднего для всех сравниваемых вариант одна и та же, формула для расчета ошибки разности может быть преобразована:. Наименьшую существенную разность рассчитываем по формуле (1.24). Используя исходные данные, вычислим НСР по указанному выше алгоритму:
; ;
; НСР0,95 = 0,58 ∙ 2,26 = 1,31
НСР0,99 = 0,58 ∙ 3,25 = 1,88
Из полученных результатов дисперсионного анализа вытекает следующий вывод (табл. 2,3). Величина НСР0,95 и НСР0,99 меньше величины прибавки урожая зерна ячменя, поэтому внесение высоких доз торфа положительно влияет на урожай. Лучший результат получен в варианте с дозой внесения торфа 400 т/га, где прибавка зерна ячменя составила 15,5 ц/га.
В случае необходимости можно рассчитать ошибки частных средних арифметических: по повторностям:
mп = == 0,41
по вариантам опыта:
mв = == 0,41.
Ошибку общего среднего арифметического используют для вычисления точности опыта. Показатель точности опыта для общего среднего арифметического вычисляется следующим образом:
pМобщ = (mобщ/Mобщ) · 100 = (0,41 : 30,90) · 100 = 1,32 %.
Поскольку р = 1,32%, т. е. < 3 %, то опыт признается достаточно точным
Таблица 2.3