- •Н.К. Чертко, а.А. Карпиченко
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Статистические показатели распределения
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •Влияние высоких доз торфа на урожай ячменя
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •Матрица таксономических метрик
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Решетка для вычисления информационных показателей
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •Итоговые значения коэффициентов корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Корреляционная матрица r для восьми параметров агроландшафта
- •Корреляционная матрица r с приближенными значениями общностей
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Этапы вычисления приближенных значений коэффициентов
- •Вычисление коэффициентов при факторе f2
- •Этапы вычисления приближенных значений коэффициентов
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •Исходные данные для землеустроительной задачи
- •8.3. Правила работы с матрицей
- •Исходные данные транспортной задачи
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •Базисный допустимый план (матрица 1)
- •Результаты первого перераспределения поставок (матрица 2)
- •Результаты второго распределения поставок (матрица 3)
- •Результаты третьего распределения поставок (матрица 4)
- •8.5. Дельта-метод Аганбегяна
- •Рабочая матрица прироста затрат
- •Первый вариант перемещения поставки
- •Второе перемещение поставки
- •Третье перемещение поставки
- •Четвертое перемещение поставки
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •Форма записи исходных данных в четырехблочную матрицу
- •8.6.5. Многопродуктовая транспортная задача
- •Мощности и спросы по торфу
- •Мощности и спросы по бурому углю
- •Оптимальный вариант распределения поставок в условных единицах
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •Матрица кратчайших расстояний между вершинами и индексы доступности вершин
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Выращивание сельскохозяйственных культур в разрезе областей
- •Глава 10 динамические ряды
- •Виды трендовых моделей
- •10.1. Показатели динамического ряда
- •Уровень производства промышленной продукции (пп) предприятия
- •10.2. Сглаживание динамических рядов
- •Сглаживание динамического ряда укрупнением интервалов и скользящим средним
- •10.3. Выравнивание по способу наименьших квадратов
- •Выравнивание динамического ряда по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n и уровня значимости α
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
- •Глава 9 146
- •Глава 10 166
- •Глава 11 174
- •Глава 12 179
Расчет данных для уравнения линейной множественной регрессии
y |
x |
z |
y2 |
x2 |
z2 |
xy |
xz |
yz |
300 |
14,5 |
82 |
90000 |
210,25 |
6724 |
4350 |
1189 |
24600 |
350 |
15,0 |
95 |
122500 |
225,00 |
9025 |
5250 |
1425 |
33250 |
370 |
15,6 |
105 |
136900 |
243,36 |
11025 |
5772 |
1638 |
38850 |
420 |
17,2 |
120 |
176400 |
295,84 |
14400 |
7224 |
2064 |
50400 |
450 |
18,5 |
130 |
202500 |
342,25 |
16900 |
8325 |
2405 |
58500 |
500 |
19,3 |
140 |
250000 |
372,49 |
19600 |
9650 |
2702 |
70000 |
Σ 2390 |
100,1 |
672 |
978300 |
1689,19 |
77674 |
40571 |
11423 |
275600 |
My = 398,33 |
Mx = 16,68 |
Mz = 112 |
|
|
|
|
|
|
Вычисленные в табл. 6.5 показатели подставляем в систему уравнений (6.10):
Решаем систему уравнений относительно а, b, с. Получаема = –3,26;b= 5,01;c = 2,84. Подставляем значенияа, b, с в общую формулу уравнения множественной регрессии (6.9):
y = –3,26 +5,01x + 2,84z (6.15)
Затем находим теоретические значения у'. Для этого подставляем в формулу (6.15) экспериментальные данные поxиzи заносим в табл. 6.6 для расчета критерия хи-квадрат. Поскольку χ2ф= 0,602 < χ2т = 11,1 приР= 0,95 для ν = 5, то можно сделать вывод, что расчет биомассы по данным температуры (х) и осадкам (z)достаточно точный.
Для определения ошибки уравнения линейной множественной регрессии показатели рассчитываем по формулам (6.12–6.14):
Σ= 978300 – 6 ∙ 398,332= 29299,4;
Σayax =40571 – 6 ∙ 398,33 ∙ 16,68 = 706,14;
Σayaz =275600 – 6 ∙ 398,33 ∙ 112 = 7922,3.
Затем подставляем полученные значения в формулу (6.11):
г/м2.
Таким образом, прогнозируя урожай биомассы трав за период вегетации по температуре и осадкам, мы рискуем ошибиться в среднем на 9,35 г/м2, т. е. на 2,3 %.
Таблица 6.6
Расчет данных для критерия хи-квадрат
y |
у' |
у – у' |
(у – у')2 | |
300 |
302,2 |
–2,26 |
5,11 |
0,017 |
350 |
341,7 |
8,31 |
69,06 |
0,202 |
370 |
373,1 |
–3,09 |
9,55 |
0,026 |
420 |
423,7 |
–3,71 |
13,76 |
0,032 |
450 |
458,6 |
–8,62 |
74,30 |
0,162 |
500 |
491 |
8,97 |
80,46 |
0,164 |
|
|
Σ –0,4 |
252,241 |
χ2=0,603 |
Уравнения регрессии широко используются в научных исследованиях и в практических целях.
Глава 7 факторный анализ
7.1. Сущность и возможности применения
При изучении взаимного влияния многих процессов и явлений в последнее время все чаще обращаются к методам многомерного статистического анализа, в частности факторного анализа. Методы многомерного статистического анализа требуют применения сложной вычислительной техники.
Факторный анализ основывается на использовании статистических знаний (вычислении стандартных отклонений, знании корреляционного и регрессионного анализов). В большинстве случаев исследуется система корреляций, отраженных в корреляционной матрице. Факторный анализ представляет собой ветвь математической статистики, цель которого – разработка моделей, понятий и методов, позволяющих анализировать и интерпретировать массивы экспериментальных данных независимо от их физической природы. Анализ данных включает краткое описание распределения объектов, установление взаимоотношения процессов и явлений, отражающихся в виде параметров.
Используемый набор моделей и методов предназначен для «сжатия» информации, содержащейся в корреляционной матрице. В основе различных моделей факторного анализа лежит следующая гипотеза: параметры – это косвенные характеристики объекта или явления и представляют в совокупности тот или иной фактор. В связи с этим задача факторного анализа состоит в том, чтобы показать наблюдаемые параметры в виде линейных комбинаций факторов. Изменение фактора не всегда одинаково отражается на параметрах, поэтому среди последних могут быть выделены группы, реагирующие на каждый из факторов порознь. Параметры, входящие в одну и ту же группу, сильно коррелируют между собой; параметры, входящие в разные группы, слабо коррелируют между собой. Задача выявления факторов понимается как разбиение параметров на группы таким образом, чтобы можно было описать взаимоотношения между параметрами.
Разработано несколько вариантов факторного анализа с использованием коэффициентов только линейной корреляции (нелинейная корреляция вызывает затруднения при обработке материала). Наиболее употребительны при этом метод главных компонент, метод главных факторов и центроидный метод. Определение главных компонент и главных факторов производится с помощью ЭВМ.
Наиболее типичной формой представления данных является матрица. Это прямоугольная (или квадратная) таблица чисел, вертикальный ряд которой (столбец) обозначается индексом j, горизонтальный (строка) – индексом i. Любой элемент матрицы обозначается символом a с индексами, первый указывает номер строки, второй – номер столбца, которым соответствует данный элемент (в общем виде aij). Матрица обозначается прописной буквой (A, B и т. д.). О матрице, имеющей т строк и п столбцов, говорят, что ее порядок составляет т∙п. Квадратная матрица n∙п имеет порядок п. В общем виде матрица записывается следующим образом:
В факторном анализе с использованием правил матричной алгебры часто встречается операция умножения матриц. Для того чтобы умножить матрицу А на матрицу В, необходимо следующее условие: матрица A должна иметь столько столбцов, сколько строк в матрице В. Сам процесс умножения протекает по правилу «строка на столбец». Это правило означает, что каждый элемент матрицы произведения представляет собой сумму произведений элементов строки первой матрицы на соответствующие элементы столбца второй матрицы, например:
Матрица-произведение будет иметь всегда столько строк, сколько их было в первой матрице, и столько столбцов, сколько их было во второй матрице: (p ∙ q) ∙ (q ∙ r)= (p ∙ r).
Существует ряд математических методов, которые по информации, заложенной в матрице, позволяют провести классификацию объектов. Такие методы объединены в многомерный анализ, а при наличии одной строки в матрице – в одномерный анализ.
В факторном анализе используются следующие виды матриц: диагональная (в ней отличны от нуля только элементы, лежащие на главной диагонали), скалярная (все элементы диагональной матрицы равны между собой), единичная (все элементы главной диагонали равны единице), обратная (аналогична обратному числу в арифметике).
Элементами исходной матрицы в факторном анализе являются коэффициенты корреляции. В ходе анализа вычисляется также общая дисперсия σ2, указывающая, в каких границах находятся значения параметров, которые характеризуют фактор. Кроме общей дисперсии в анализе учитывается факторная дисперсия (общность) и специфическая дисперсия, связанная с некоторой переменной и характеризующая только ее. Дисперсию, обусловленную ошибкой, стремятся свести к минимуму.
В итоге составляется факторная матрица. Элементы столбцов матрицы представляют собой факторные нагрузки, или коэффициенты факторного отображения, выраженные коэффициентами корреляции данной переменной с данным фактором. Таким образом, коэффициенты факторного отображения характеризуют фактор и его влияние на все параметры.
Результат факторного анализа можно также выразить в виде графика, который наглядно иллюстрирует полученные выводы. Каждую из двух связанных друг с другом переменных можно изобразить как вектор, т. е. отрезок прямой, имеющий определенную длину и направление. Величина корреляции между переменными равна произведению абсолютных величин обоих векторов на косинус угла между ними: r1,2 = h1h2cos α1,2, где r1,2 – коэффициент корреляции; h1– длина вектора, соответствующая первой переменной 1; h2 – длина вектора, соответствующая переменной 2; cos α1,2 – угол между векторами h1 и h2.