- •Н.К. Чертко, а.А. Карпиченко
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Статистические показатели распределения
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •Влияние высоких доз торфа на урожай ячменя
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •Матрица таксономических метрик
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Решетка для вычисления информационных показателей
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •Итоговые значения коэффициентов корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Корреляционная матрица r для восьми параметров агроландшафта
- •Корреляционная матрица r с приближенными значениями общностей
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Этапы вычисления приближенных значений коэффициентов
- •Вычисление коэффициентов при факторе f2
- •Этапы вычисления приближенных значений коэффициентов
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •Исходные данные для землеустроительной задачи
- •8.3. Правила работы с матрицей
- •Исходные данные транспортной задачи
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •Базисный допустимый план (матрица 1)
- •Результаты первого перераспределения поставок (матрица 2)
- •Результаты второго распределения поставок (матрица 3)
- •Результаты третьего распределения поставок (матрица 4)
- •8.5. Дельта-метод Аганбегяна
- •Рабочая матрица прироста затрат
- •Первый вариант перемещения поставки
- •Второе перемещение поставки
- •Третье перемещение поставки
- •Четвертое перемещение поставки
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •Форма записи исходных данных в четырехблочную матрицу
- •8.6.5. Многопродуктовая транспортная задача
- •Мощности и спросы по торфу
- •Мощности и спросы по бурому углю
- •Оптимальный вариант распределения поставок в условных единицах
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •Матрица кратчайших расстояний между вершинами и индексы доступности вершин
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Выращивание сельскохозяйственных культур в разрезе областей
- •Глава 10 динамические ряды
- •Виды трендовых моделей
- •10.1. Показатели динамического ряда
- •Уровень производства промышленной продукции (пп) предприятия
- •10.2. Сглаживание динамических рядов
- •Сглаживание динамического ряда укрупнением интервалов и скользящим средним
- •10.3. Выравнивание по способу наименьших квадратов
- •Выравнивание динамического ряда по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n и уровня значимости α
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
- •Глава 9 146
- •Глава 10 166
- •Глава 11 174
- •Глава 12 179
Исходные данные для расчета коэффициента корреляции
хi |
хi – Мх |
(хi – Мх)2 |
уi |
уi – Му |
(уi – Му)2 |
(хi – Мх) . (уi – Му) |
69 |
–14 |
196 |
18 |
–42 |
1764 |
558 |
70 |
–13 |
169 |
48 |
–12 |
144 |
156 |
72 |
–11 |
121 |
42 |
–18 |
324 |
198 |
75 |
–8 |
64 |
31 |
–29 |
841 |
232 |
83 |
0 |
0 |
56 |
–4 |
16 |
0 |
90 |
7 |
49 |
84 |
24 |
576 |
168 |
90 |
7 |
49 |
56 |
–4 |
16 |
–28 |
91 |
8 |
64 |
68 |
8 |
64 |
64 |
95 |
12 |
144 |
90 |
30 |
900 |
360 |
95 |
12 |
144 |
107 |
47 |
2209 |
564 |
∑ 830 |
∑ 0 |
∑ 1000 |
∑ 600 |
∑ 0 |
∑ 6854 |
∑ 2302 |
Мх 83 |
Му 60 |
|
|
|
Поскольку rвыч= 0,88 > rтабл= 0,77 приР= 0,99 и ν = 8, то зависимость между содержанием подвижного марганца и гидролитической кислотностью достоверная линейная положительная.
Определим также достоверность зависимости с использованием критерия Стъюдента t по формуле (5.5):tr = 0,88 . /= 5,27.
Поскольку tвыч= 5,27 > tтабл= 3.36 при ν = 8 иР= 0,99 (см. прил. 4), то зависимость между данными показателями доказана (достоверна).
В рассмотренном примере оба критерия подтвердили достоверную линейную положительную зависимость между содержанием подвижного марганца и гидролитической кислотностью
Таким образом, достоверность связи устанавливается путем сравнения r (η) расчетного (фактического) и r (η) теоретического (табличного). Если r(η)выч > r(η)табл при учете степени свободы (ν) вариационных рядов и уровня вероятности P = 0,95 и 0,99, то зависимость между признаками доказана без учета величины r(η). Регрессионный анализ обычно является продолжением корреляционного в случае если r (η) ≥ ± 0,7.
Коэффициент детерминации (причинности) R2 (D2) – это коэффициент корреляции, возведенный в квадрат, например, R2 = r2 = 0,22 = 0,04. С помощью коэффициента детерминации можно установить долю влияния анализируемого факторного признака на результативный признак. В случае, когда R2 = 0,04, можно утверждать, что доля влияющего фактора (x) на признак (y) составляет 4 %. Следовательно, на долю других факторов приходится 96 % влияния.
5.2. Нелинейная корреляция
Зависимость между признаками не всегда выражается в виде прямой линии. Если рассеяние точек на графике приближается к кривой линии (см. рис.5.1, в, г), то зависимость устанавливается с использованием корреляционного отношения (η), величина которого изменяется только от 0 до 1. Для него теоретические значения приводятся отдельно в таблице или находятся при перерасчете его в критерий Стъюдента. При нелинейной корреляции вычисляется корреляционное отношение (η).
Для установления формы связи иногда используется критерий криволинейности в случаях, когда кривая линия мало отличается от прямой. Существует несколько способов оценки степени криволинейности. Рассмотрим два из них.
Первый способ менее точный. Оценка степени криволинейности определяется по разности коэффициента корреляции и корреляционного отношения использованием неравенства: η2 – r2 ≥ 0,1. Корреляция считается криволинейной, если полученный результат соответствует этому неравенству. Предварительно следует рассчитать между сравниваемыми выборками r и η.
Второй способ оценки степени криволинейности связан с применением критерия Стъюдента:
t = 0,5 ≥ 3.
Если tвыч < 3 или tвыч < tтабл, то рассматриваемая связь несущественно отклоняется от прямолинейной, поэтому относим ее к линейной. В других случаях связь между признаками относят к криволинейной и рассчитывается корреляционное отношение.
Корреляционное отношение, как и коэффициент корреляции, используется для оценки прямой и обратной зависимости между признаками.
Оценка прямой нелинейной зависимости между признаками. Нелинейная зависимость прямая определяется как параболическая. Расчет корреляционного отношения производится по формуле с использованием функции у:
, (5.6)
где – среднее арифметическое частных групп поyi; n – число вариант в частной группе; –My – отклонение общего среднего (My) от средних арифметических частных групп ().
Ошибка корреляционного отношения независимо от способа расчета вычисляется следующим образом:
mη = (5.7)
Критерий Стьюдента определяется с использованием η:
tη = η / mη. (5.8)
Если tвыч > tтабл, то корреляционное отношение признается достоверным.
Пример. Следует установить, существует ли зависимость между температурой воздуха (х, оС) и упругостью водяного пара (у, мбар) по шести метеорологическим постам Беларуси исходя из следующих данных:
-
xi
14,7
14,9
15,3
15,6
16,0
16,7
yi
13,3
13,7
14,2
14,5
14,7
14,6
При построении графика получена кривая близкая к параболе (рис. 5.4).
По исходным данным (табл. 5.2) рассчитываем корреляционное отношение между хиу. Выборку разбиваем на частные группы по значенияму. Их должно быть не менее трех. В нашем примере выделены частные две группы для сокращения расчета. Для частных групп рассчитываются средние () и отклонение их от общей средней для выборки (Му), а также отклонения индивидуальных вариант выборки (уi) от общей средней (Му). Сумму отклонений в квадрате из табл. 5.2 заносим в формулу (5.6) и вычисляем η.
ηу== 0,79.
Ошибку корреляционного отношения находим по формуле (5.7):
mη== 0,31.
Достоверность результатов определяем по критерию Стъюдента (5.8):
tη= 0,78 / 0,31 = 2,51.
Поскольку tη= 2,51 <tтабл= 2,78 приР 0,95 для ν = 4 (см. прил. 4), то значение корреляционного отношения следует признать не доказанным, а зависимость между температурой воздуха и упругостью водяного пара положительна, но не достоверна.
Рис. 5.4. Кривая зависимости упругости водяного пара (х) от температуры воздуха
Таблица 5.2