- •Содержание
- •Введение
- •1. Парная корреляция и регрессия
- •1.1. Спецификация модели
- •1.2. Линейная корреляция и регрессия
- •1.3. Нелинейная регрессия
- •1.4. Проверка значимости линейного уравнения регрессии
- •1.5. Корреляция для нелинейной регрессии
- •1.6. Предпосылки метода наименьших квадратов
- •1.7. Обобщенный метод наименьших квадратов
- •2. Множественная корреляция и регрессия
- •2.1. Множественный корреляционный анализ
- •2.2. Спецификация модели
- •2.3. Частные уравнения регрессии
- •2.4. Выбор формы уравнения множественной регрессии
- •Оценка параметров уравнения множественной регрессии
- •2.6. Многошаговый регрессионный анализ
- •3.1.2. Способы выявления структурной неоднородности
- •3.2. Методы последовательного разбиения
- •3.3. Методы многомерной классификации
- •3.3.1. Мера сходства
- •3.3.2. Модели кластерного анализа
- •4.2. Числовые характеристики экономического развития
- •4.3. Состав динамического ряда
- •4.4. Моделирование одномерных динамических рядов
- •4.4.1. Типы экономического развития и их трендовые модели
- •4.4.2. Построение трендовых моделей
- •4.4.3. Сглаживание временных рядов
- •4.4.4. Моделирование тенденции временного ряда при наличии структурных изменений
- •4.4.5. Влияние автокорреляции на структуру временного ряда
- •4.5. Многомерные временные ряды
- •4.5.1. Сущность и особенности многомерных динамических рядов
- •4.5.2. Способы построения множественной регрессионной модели по временным рядам
- •5.1.2. Связь однородности статистической совокупности с типом моделей
- •5.2. Динамическое моделирование взаимосвязей в структурно-однородных совокупностях
- •5.2.1. Методы построения пространственно-динамических
- •Моделей
- •5.2.2. Выбор вида пространственно-динамической модели
- •5.2.3. Динамизация параметров связи
- •5.3.2. Построение динамических моделей на основе временных выборок
- •6. Системы эконометрических уравнений
- •6.1.Общие понятия и способы представления систем эконометрических уравнений
- •6.2. Структурная и приведенная формы модели
- •6.3. Проблемы идентификации структурной модели
- •6.4. Оценка параметров структурной модели
- •6.5. Двухшаговый метод наименьших квадратов
- •7. Динамические эконометрические модели
- •7.1. Общая характеристика моделей с распределенным лагом и моделей авторегрессии
- •7.2. Оценка параметров авторегрессионных моделей
- •7.3. Интерпретация параметров модели с распределенным лагом
- •7.4. Интерпретация параметров модели авторегрессии
- •7.5. Изучение структуры лага и выбор вида модели с распределенным лагом
- •7.6. Лаги Алмон
- •8. Статистическое прогнозирование динамических рядов
- •8.1. Сущность и виды статистических прогнозов
- •8.2. Методы статистического прогнозирования
- •8.2.1. Экстраполяция динамических рядов
- •8.2.2. Прогнозирование на основе экспоненциального сглаживания
- •8.2.3. Прогнозирование на основе регрессионных и авторегрессионных моделей
- •Список литературы
3.3. Методы многомерной классификации
Многомерная классификация идентифицируется как распределение объектов по группам, схожим по определенным критериям.
Расчету соответствующих показателей с использованием рассматриваемых в данном разделе методов должна предшествовать постановка задачи многомерной классификации, т.к. группировки являются относительными, т.е. всегда направленными на достижение определенных содержательных целей. Поэтому необходимо формирование целевой функции классификации как меры сходства объектов (признаков) и как критерия качества классификации.
Для проведения такой классификации необходимо:
осуществить постановку задачи: определить цель, выбрать набор признаков классификации, определить меру сходства объектов, выбрать алгоритм и программу классификации;
рассмотреть различные варианты классификации;
оценить полученные результаты.
Исходные данные для расчетов задаются в виде матрицы размерности «объект-признак», строки которой соответствуют значениям признаков, характеризующих каждый отдельный объект, а столбцы – значениям признаков для рассматриваемой совокупности объектов.
3.3.1. Мера сходства
Для определения значений целевой функции классификации необходимо количественно оценить меру сходства и компактности объектов с использованием различных групп характеристик, таких как: коэффициенты подобия (меры близости объектов), коэффициенты связи, коэффициенты расстояния в метрическом пространстве
Коэффициент подобия, как относительный показатель, используется для определения степени близости между парами объектов, каждый из бинарных признаков описания которых, может принимать значения или 0 или 1. Формула расчета наиболее простого коэффициента подобия у двух сравниваемых объектов:
, (3.2)
где – число совпадающих признаков;
m – общее число признаков, по которым осуществляется сравнение.
Коэффициенты связи представляют собой коэффициенты корреляции (формула (1.2)), в том числе, ранговой корреляции, т.е. между качественными признаками [7].
Функции расстояния могут быть представлены различными характеристиками, основными из которых являются следующие.
Хэммингово расстояние (для бинарных признаков)
. (3.3)
Пространство признаков представляет собой в данном случае m-мерный двоичный куб, расстояние между вершинами которого, равно числу несовпадающих разрядов n-разрядных двоичных векторов описания объектов и .
Евклидово расстояние (для количественных признаков)
, (3.4)
где значение признака на i-том объекте.
Данная характеристика не учитывает взаимную неравномерность осей пространства.
Функция Махаланобиса (обобщение предыдущих функций)
, (3.5)
где ;
ковариационная матрица признаков размерности ;
T – знак транспонирования.
Выбор конкретной меры сходства определяется структурой пространства признаков и целью классификации.
Кроме выбора меры сходства необходимо определить критерий качества классификации, представляющий собой меру компактности признаков. Его расчет основан на сравнении межгрупповой и внутригрупповой дисперсий [7]. Возможны комбинированные критерии качества, представляющие собой сочетание признаков компактности классов и максимальной удаленности классов друг от друга.
Различные критерии качества приводят к различным результатам (классификациям). Рекомендуется использовать несколько различных критериев и сравнивать полученные результаты разделения объектов.