- •26.10.2007 Г., протокол № 2
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Вычисление коэффициентов при факторе f2
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •8.3. Правила работы с матрицей
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •8.5. Дельта-метод Аганбегяна
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •8.6.5. Многопродуктовая транспортная задача
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Глава 10 динамические ряды
- •10.1. Показатели динамического ряда
- •10.2. Сглаживание динамических рядов
- •10.3. Выравнивание по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
6.4. Множественная регрессия
Если при установлении зависимости между признаками используется больше одной независимой переменной, то применяют множественный регрессионный анализ. Проведение такого анализа возможно в следующих условиях: распределение зависимой переменной при различных значениях независимых должно быть близко к нормальному; дисперсия зависимой переменной при разных значениях признаков х должна считаться одинаковой. С увеличением числа признаков и в случаях нелинейной множественной регрессии необходимо использовать ЭВМ. Поэтому рассмотрим простой вариант множественной линейной регрессии без применения ЭВМ, когда один признак зависит от двух факторов. Общее уравнение линейной множественной регрессии имеет вид
y = a + bx + cz (6.9)
Для вычисления параметров а, b, с составляется следующая система уравнений:
(6.10)
Соответствие между теоретическими (у') и эмпирическими (у) значениями признака устанавливают с помощью критериев хи-квадрат или Стьюдента (см. п. 1.6). При необходимости ошибка уравнения линейной множественной регрессии определяется по формуле:
,
(6.11)
где а, b, с – значения параметров уравнения множественной регрессии; п – число сопряженных значений вариант; k – число коэффициентов уравнения регрессии (а, b, с плюс свободный член).
Другие параметры для (6.11) вычисляются по формулам:
Σ
= Σy2
– n
;
(6.12)
Σayax = Σxy – nMyMx; (6.13)
Σayaz = Σyz – nMyMz. (6.14)
Пример. При изучении зависимости между биомассой трав (у, г/м2) в агроландшафте, с одной стороны, температурой (х, °С) и количеством атмосферных осадков (z, мм) с другой, установлена прямая односторонняя зависимость у от х и z. С практической точки зрения целесообразно составить уравнение множественной регрессии, которое можно было бы использовать для прогноза биомассы по температуре и количеству выпавших осадков. Данные по х, у, z представляют собой средние многолетние показатели за период вегетации (май, июнь):
-
y
300
350
370
420
450
500
x
14,5
15,0
15,6
17,2
18,5
19,3
z
82
95
105
120
130
140
Таблица 6.5
Расчет данных для уравнения линейной множественной регрессии
y |
x |
z |
y2 |
x2 |
z2 |
xy |
xz |
yz |
300 |
14,5 |
82 |
90000 |
210,25 |
6724 |
4350 |
1189 |
24600 |
350 |
15,0 |
95 |
122500 |
225,00 |
9025 |
5250 |
1425 |
33250 |
370 |
15,6 |
105 |
136900 |
243,36 |
11025 |
5772 |
1638 |
38850 |
420 |
17,2 |
120 |
176400 |
295,84 |
14400 |
7224 |
2064 |
50400 |
450 |
18,5 |
130 |
202500 |
342,25 |
16900 |
8325 |
2405 |
58500 |
500 |
19,3 |
140 |
250000 |
372,49 |
19600 |
9650 |
2702 |
70000 |
Σ 2390 |
100,1 |
672 |
978300 |
1689,19 |
77674 |
40571 |
11423 |
275600 |
My = 398,33 |
Mx = 16,68 |
Mz = 112 |
|
|
|
|
|
|
Вычисленные в табл. 6.5 показатели подставляем в систему уравнений (6.10):
Решаем систему уравнений относительно а, b, с. Получаем а = –3,26; b = 5,01; c = 2,84. Подставляем значения а, b, с в общую формулу уравнения множественной регрессии (6.9):
y = –3,26 + 5,01x + 2,84z (6.15)
Затем находим теоретические значения у'. Для этого подставляем в формулу (6.15) экспериментальные данные по x и z и заносим в табл. 6.6 для расчета критерия хи-квадрат. Поскольку χ2ф = 0,602 < χ2т = 11,1 при Р = 0,95 для ν = 5, то можно сделать вывод, что расчет биомассы по данным температуры (х) и осадкам (z)достаточно точный.
Для определения ошибки уравнения линейной множественной регрессии показатели рассчитываем по формулам (6.12–6.14):
Σ
= 978300 – 6 ∙ 398,332 = 29299,4;
Σayax = 40571 – 6 ∙ 398,33 ∙ 16,68 = 706,14;
Σayaz = 275600 – 6 ∙ 398,33 ∙ 112 = 7922,3.
Затем подставляем полученные значения в формулу (6.11):
г/м2.
Таким образом, прогнозируя урожай биомассы трав за период вегетации по температуре и осадкам, мы рискуем ошибиться в среднем на 9,35 г/м2, т. е. на 2,3 %.
Таблица 6.6
