- •Н.К. Чертко, а.А. Карпиченко
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Статистические показатели распределения
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •Влияние высоких доз торфа на урожай ячменя
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •Матрица таксономических метрик
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Решетка для вычисления информационных показателей
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •Итоговые значения коэффициентов корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Корреляционная матрица r для восьми параметров агроландшафта
- •Корреляционная матрица r с приближенными значениями общностей
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Этапы вычисления приближенных значений коэффициентов
- •Вычисление коэффициентов при факторе f2
- •Этапы вычисления приближенных значений коэффициентов
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •Исходные данные для землеустроительной задачи
- •8.3. Правила работы с матрицей
- •Исходные данные транспортной задачи
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •Базисный допустимый план (матрица 1)
- •Результаты первого перераспределения поставок (матрица 2)
- •Результаты второго распределения поставок (матрица 3)
- •Результаты третьего распределения поставок (матрица 4)
- •8.5. Дельта-метод Аганбегяна
- •Рабочая матрица прироста затрат
- •Первый вариант перемещения поставки
- •Второе перемещение поставки
- •Третье перемещение поставки
- •Четвертое перемещение поставки
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •Форма записи исходных данных в четырехблочную матрицу
- •8.6.5. Многопродуктовая транспортная задача
- •Мощности и спросы по торфу
- •Мощности и спросы по бурому углю
- •Оптимальный вариант распределения поставок в условных единицах
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •Матрица кратчайших расстояний между вершинами и индексы доступности вершин
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Выращивание сельскохозяйственных культур в разрезе областей
- •Глава 10 динамические ряды
- •Виды трендовых моделей
- •10.1. Показатели динамического ряда
- •Уровень производства промышленной продукции (пп) предприятия
- •10.2. Сглаживание динамических рядов
- •Сглаживание динамического ряда укрупнением интервалов и скользящим средним
- •10.3. Выравнивание по способу наименьших квадратов
- •Выравнивание динамического ряда по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n и уровня значимости α
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
- •Глава 9 146
- •Глава 10 166
- •Глава 11 174
- •Глава 12 179
Глава 1 элементы математической статистики
Источником материала для статистической обработки могут быть собственные экспериментальные исследования, статистическая информация, аналитические данные других исследователей, фондовые материалы, литературные источники, географические карты, аэрофотоснимки. При изучении территориальных комплексов низших рангов (фаций, урочищ), промышленных предприятий, объектов сельскохозяйственного назначения наиболее ценными для статистической обработки являются материалы собственных исследований. При изучении объектов среднего ранга возрастает роль отраслевых и специальных карт вместе с авторскими данными и литературными источниками. Для исследования объектов высоких рангов (области, провинции, регионы) используются карты, литературные источники, обобщающие материалы по объектам более низких рангов.
1.2. Генеральная совокупность и выборка
Первичным элементом в статистике является единица наблюдения (варианта, дата): 3 4 3 4 3 3 3 3. Их ряд образуют статистическую совокупность, которая характеризует объект исследования. Большинство единиц наблюдения имеют вероятностный, случайный характер. По виду исследуемые признаки могут быть качественными и количественными. Количественные признаки имеют числовое выражение, качественные – словесное (образование начальное, среднее, высшее). Качественным признакам при статистической обработке присваивают балл или ранг соответственно их смыслу (начальное образование – 1 балл, среднее – 2, высшее – 3). Исследуемые признаки можно подразделить на факторные (факториальные) и результативные (результирующие); вторые изменяются под влиянием первых. Все единицы наблюдения, входящие в статистическую совокупность, объединены единством места и времени исследования.
Чрезмерное увеличение объема любой исходной информации ведет к увеличению «информационного шума» (погрешностей), который подавляет искомую исследователем информацию. Это отражается на вариабельности (изменчивости, случайности) процессов и явлений.
По времени наблюдение может быть текущим (непрерывным) и единовременным (в один и тот же момент времени в разных точках – метеонаблюдения на постах). По охвату исследование может быть сплошное и не сплошное. Эта особенность определяет ход и методику статистического анализа.
Сплошное статистическое исследование (перепись всего населения республики) образует генеральную совокупность. Общее число членов генеральной совокупности называют объемом генеральной совокупности. Из-за больших размеров генеральной совокупности или из-за отсутствия определенных границ этой совокупности (Белорусская гряда) оно проводится редко. На исследование генеральной совокупности затрачивается много средств и времени, поэтому ограничиваются методом выборочного исследования (не сплошного) из генеральной совокупности. Выборка образует совокупность наблюдений, полученных с целью объективной характеристики и получения информации о генеральной совокупности. Число ее членов называют объемом выборочной совокупности.
Выборочное исследование можно проводить такими методами, как монографический, основного массива и выборочным. Монографический метод используется для описания объекта с какими-либо особенностями (зонирование города с развитой машиностроительной промышленностью). Выводы могут быть распространены только на группу аналогичных объектов. Метод основного массива дает представление о конкретном объекте, поэтому переносить полученные закономерности на другие объекты нельзя (бассейн р. Неман). Наиболее распространен метод выборочного исследования из генеральной совокупности.
Выборка может быть представлена следующими основными типами отбора: случайным, направленным (типическим), смешанным.
При случайном отборе все объекты имеют одинаковую возможность попасть в выборку. В его основе лежит перемешивание. Для этого можно использовать таблицу случайных чисел (прил. 2). Начав с любой четырехзначной колонки и, двигаясь по столбцу сверху вниз или снизу вверх, выписывают первые или последние однозначные цифры для объема выборки до 9, двухзначные – для объема выборки от 10 до 99, трехзначные – для объема выборки от 100 до 999 и т. д. По второму варианту из объектов в списке (алфавитном или ином) в выборку включают каждый третий или пятый, или десятый (механическая выборка) и т. д.
Случайная выборка может не отвечать условиям исследования из-за неоднородности. Тогда производят целенаправленный (когортный) отбор, выбирая для исследования типичные объекты. Правила отбора остаются те же, что и при случайном отборе.
Смешанный отбор производят в тех случаях, когда необходимо дать характеристику неоднородного объекта. Например, холмисто-моренный ландшафт делят фации с однородными условиями, в каждой из которых производят случайный отбор. Полученные результаты объединяют в одну выборку.
Соблюдения правил составления выборки дают возможность наиболее полно и точно, т. е. репрезентативно, характеризовать генеральную совокупность. Величина ошибки репрезентативности зависит от изменчивости изучаемого признака. Чем больше разброс значений изучаемого признака, тем больше статистическая ошибка. Отбор для выборки должен быть также научно обоснованным с учетом принятых методических правил, т. е. рендомизированным. В таких случаях при меньшем числе наблюдений уменьшается вероятность систематических ошибок наблюдений.
На втором этапе статистического исследования проводят сводку и группировку данных. Варианты группировок следующие: разделение анализируемой статистической совокупности на группы по тем или иным признакам; объединение мелких однородных групп в более крупные; комплексная группировка на основе многих учетных признаков, даже если они разнородные.
Типологическая группировка выделяет в совокупности качественно однородные в существенном отношении группы. Группировка по своей сути представляет собой процесс классификации. В государственной статистике используют классификаторы – специальные справочники, инструкции, указания.
Самым сложным является определение объема наблюдений в исследованиях, который необходим для получения надежного представления о характере изменчивости признака в генеральной совокупности. Если объект исследуется впервые, то определить объем выборки трудно. В большинстве случаев достаточно точные результаты получают при объеме выборки около 100. Оптимальный объем выборки обычно пропорционален степени изменчивости признака. Если признак сильно изменяется, то количество измерений следует увеличить. Предложены также другие способы определения величины выборочной совокупности при исследованиях: по таблице достаточно больших чисел (прил. 1), а также расчетным способом. В обоих случаях количество наблюдений определяется исходя из величины допускаемой вероятности, с какой предполагается делать заключения, и величины точности опыта. Например, при допускаемом уровне вероятности Р = 0,95 (95 %) и точности опыта р = 5 % число наблюдений по таблице достаточно больших чисел составит 384. Если точность опыта увеличить до 1 %, то число наблюдений следует увеличить до 9603.
Чаще всего ориентировочный объем (N) выборочной совокупности рассчитывают по формулам, в которых вероятность заменяют степенью варьирования:
N = σ2 / m2М ,
где σ – среднее квадратическое отклонение; mМ – ошибка среднего арифметического.
Допустим, варьирование признака (колебание температуры) составляет 7 °С, тогда число наблюдений выборочной совокупности с ошибкой среднего арифметического m = ± 0,5 °С составит: N = σ2 / m2М = 72 / 0,52 = =196.
Объем выборочной совокупности можно также определить по ожидаемому коэффициенту вариации (V) и точности опыта (р) с учетом поправочного коэффициента (1,96) для уровня вероятности 0,95 и 0,99:
N = (1,96 · V)2 / р2.
Пример. Для расчета коэффициента увлажнения в зависимости от количества выпадающих осадков и испарения с ожидаемой точностью опыта 3 % и коэффициента вариации 30 % потребуется следующий объем выборочной совокупности N = (1,96 · 30)2/ 32= 384.
Определение объема выборочной совокупности необходимо для получения достоверной информации о генеральной совокупности путем расчета минимального, но объективного количества наблюдений. Полученные параметры по выборке могут служить приблизительными оценками аналогичных параметров генеральной совокупности, т. е. указывать пределы в которых они заключены (М ± mМ; σ ± mσ).