- •Н.К. Чертко, а.А. Карпиченко
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Статистические показатели распределения
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •Влияние высоких доз торфа на урожай ячменя
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •Матрица таксономических метрик
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Решетка для вычисления информационных показателей
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •Итоговые значения коэффициентов корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Корреляционная матрица r для восьми параметров агроландшафта
- •Корреляционная матрица r с приближенными значениями общностей
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Этапы вычисления приближенных значений коэффициентов
- •Вычисление коэффициентов при факторе f2
- •Этапы вычисления приближенных значений коэффициентов
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •Исходные данные для землеустроительной задачи
- •8.3. Правила работы с матрицей
- •Исходные данные транспортной задачи
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •Базисный допустимый план (матрица 1)
- •Результаты первого перераспределения поставок (матрица 2)
- •Результаты второго распределения поставок (матрица 3)
- •Результаты третьего распределения поставок (матрица 4)
- •8.5. Дельта-метод Аганбегяна
- •Рабочая матрица прироста затрат
- •Первый вариант перемещения поставки
- •Второе перемещение поставки
- •Третье перемещение поставки
- •Четвертое перемещение поставки
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •Форма записи исходных данных в четырехблочную матрицу
- •8.6.5. Многопродуктовая транспортная задача
- •Мощности и спросы по торфу
- •Мощности и спросы по бурому углю
- •Оптимальный вариант распределения поставок в условных единицах
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •Матрица кратчайших расстояний между вершинами и индексы доступности вершин
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Выращивание сельскохозяйственных культур в разрезе областей
- •Глава 10 динамические ряды
- •Виды трендовых моделей
- •10.1. Показатели динамического ряда
- •Уровень производства промышленной продукции (пп) предприятия
- •10.2. Сглаживание динамических рядов
- •Сглаживание динамического ряда укрупнением интервалов и скользящим средним
- •10.3. Выравнивание по способу наименьших квадратов
- •Выравнивание динамического ряда по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n и уровня значимости α
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
- •Глава 9 146
- •Глава 10 166
- •Глава 11 174
- •Глава 12 179
Влияние высоких доз торфа на урожай ячменя
Вариант опыта |
Урожай ячменя по повторностям |
Среднее |
Прибавка | |||
Контроль (фон) |
20 |
21 |
22 |
20 |
20,75 |
– |
Фон+200 т/га |
30 |
32 |
32 |
31 |
31,25 |
10,50 |
Фон+300 т/га |
35 |
36 |
35 |
36 |
35,50 |
14,75 |
Фон+400 т/га |
36 |
35 |
37 |
37 |
36,25 |
15,50 |
НСР0,95, ц/га |
1,31 |
|
|
|
|
|
НСР0,99, ц/га |
1,88 |
|
|
|
|
|
р |
1,32 % |
|
|
|
|
|
Аналогичным образом вычисляется точность опыта для частных средних арифметических по вариантам опыта и по повторностям:
pв = (mв/Mв) ∙ 100; pп = (mп/Mп) ∙ 100.
2.2. Двухфакторный дисперсионный анализ
Если в дисперсионный анализ включают несколько факторов, влияющих на результативный признак, то они должны быть независимыми друг от друга. Рассмотрим обработку данных с двумя факторами, каждый из которых делится на две группы. Для этого составляем комбинационный дисперсионный комплекс (табл. 2.4). Каждый фактор характеризуется тремя наблюдениями (повторностями). Аналогичную схему можно использовать для двухфакторного анализа с большим числом групп и повторностей в каждом факторе.
Двухфакторный дисперсионный анализ можно представить в виде равенства:
Θ = Θ1 + Θ2 + Θ3+ Θ4+ Θ5, (2.4)
где Θ – общая сумма квадратов; Θ1, Θ2 – сумма квадратов отклонений для фактора I и II соответственно; Θ3 – сумма квадратов отклонений, возникающих при взаимодействии факторов I и II; Θ4 – сумма квадратов отклонений по повторностям; Θ5 – остаточная сумма квадратов отклонений неучтенных факторов.
Следует определить влияние метеорологических условий (фактор I) и мелиорации (фактор II) на урожай биомассы трав в агроландшафте.
Таблица 2.4
Двухфакторный дисперсионный комплекс
Повторность опыта по фактору II |
Биомасса, кг/м3 |
My | |||
Группы по фактору I | |||||
1982 г. (сухой) |
1984 г. (влажный) | ||||
Группа по фактору I (неосушенный агроландшафт) | |||||
Первая |
|
| |||
Вторая |
|
| |||
Третья |
|
| |||
|
961 |
5,16 | |||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
|
Группа по фактору II (осушенный агроландшафт) | |||||
Первая |
|
| |||
Вторая |
|
| |||
Третья |
|
| |||
|
784 |
4,66 |
Мобщ = =4,90 | |||||
729 |
1024 | ||||
Mx |
4,50 |
5,33 |
|
При обработке данных исходной информации (см. табл. 2.4) порядок расчета не отличается от описанного выше алгоритма однофакторного дисперсионного комплекса (см. § 2.1). Дальнейшие расчеты проводятся в следующем порядке.
Общую сумму квадратов отклонений находим по формуле
где N – общий объем выборки.
Сумма квадратов отклонений по фактору I вычисляется по формуле
где пх – число групп фактора I (пх = 2); kх – число вариант в каждой отдельной сумме (kх = 6).
Сумма квадратов отклонений по фактору II вычисляется аналогично определению суммы квадратов отклонений по фактору I:
Сумма квадратов отклонений, вызываемых взаимодействием факторов I и II, определяется следующим образом:
, (2.5)
где –сумма квадратов сумм значений вариант по группам выборки комбинационной таблицы (162 + 152 + 112 + 172 = 891); пz – число сумм вариант по группам; kz – число слагаемых вариант в каждой группе выборки.
Подставляем данные в формулу (2.5):
Θ3 = [891 – (59)2 : 4] : 3 – 2,08 – 0,75 = 4,08
Сумма квадратов отклонений по повторностям Θ4 определяется по формуле (2.6) путем подстановки конкретных данных задачи:
, (2.6)
где пх,у – число сумм по повторностям (по 3); kх,у – число слагаемых в каждой сумме (равное 4); – сумма квадратов сумм исходных данных по повторностям фактора I сверху вниз: [(5+4) + (3+5)]2+ [(6+5) + (4+6)]2 + [(5+6) + + (4+6)]2 = 1171. Подставив данные в исходную формулу (2.6), получим
Θ4 = [1171 – (59)2 : 3] : 4 = 2,67
Сумму квадратов отклонений по остаточному варьированию определяем из равенства (2.4):
Θ4 = 10,92 – 2,08 – 0,75 – 4,08 – 2,67 = 1,14.
Затем вычисляем число степеней свободы: для Θ ν = N – 1 = 12 – 1 = =11; для Θ1 и Θ2 число степеней свободы равно числу градаций фактора минус единица: ν1 = n1 – 1 = 2 – 1 = 1; ν2 = n2 – 1 = 2 – 1 = 1; для Θ3 ν3 = ν1 ∙ ν2 = 1 ∙ 1 = 1; для Θ4 число степеней свободы равно числу повторностей минус единица: ν4 = 3 – 1 = 2; для Θ5 этот показатель определяется следующим образом: ν5 = ν – ν1 – ν2 – ν3 – ν4 = 11 – 1 – 1 – 1 – 2 = 6.
Показатели дисперсии (табл. 2.5) вычисляются путем деления значений сумм квадратов отклонений на соответствующие значения степеней свободы (например, 10,92:11 = 0,99).
Фактический критерий Фишера определяется путем деления каждой из величин дисперсий на значение остаточной. Критическое значение критерия Фишера находим в прил. 5 на пересечении значений большей и меньшей степеней свободы, которые устанавливаем по величине сравниваемых дисперсий (см. табл. 2.5). Например, по фактору II отношение дисперсий равно Fф = 3,94. В данном случае большей будет дисперсия по фактору II σ2=0,75 с числом степеней свободы ν = 1, для меньшей величины остаточной дисперсии σ2 = 0,19 и ν = 6. Пересечение ν =1 и ν = 6 дает величину Fт = 5,99 для Р = 0,95. Если Fф > Fт, то действие данного фактора признается существенным, при Fф < Fт – несущественным.
Таблица 2.5