
- •11. Многомерные методы экспериментальной оптимизации.
- •12. Симплекс-метод экспериментальной оптимизации. Последовательный симплексный метод Этот метод требует проведения минимально возможного числа опытов при определении направления движения.
- •13. Метод Бокса-Уилсона.
- •14. Анализ главных компонент. Вычислительная процедура.
- •15. Анализ главных компонент. Геометрическая интерпретация.
- •16. Модель и основная теорема факторного анализа.
- •17. Основные этапы факторного анализа
- •18. Меры близости и различия в кластерном анализе. Функции расстояния и сходства Неотрицательная вещественная функция называется функцией расстояния (метрикой), если:
- •19. Метод k-средних в кластерном анализе.
- •20. Иерархический кластерный анализ. Проблема индексации.
- •21. Графическое представление результатов кластерного анализа.
- •22. Многомерное шкалирование. Метрический и неметрический подходы.
- •23. Многомерное шкалирование. Теорема Янга-Хаусхолдера. Метрическое шкалирование в метрическом шкалировании укажем два метода: ординация Орлочи и метод главных проекций Торгерсона.
- •24. Ортогональные методы многомерного шкалирования.
- •25. Неметрическое шкалирование. Схема алгоритма Каскала.
- •26. Критерии качества шкалирования.
23. Многомерное шкалирование. Теорема Янга-Хаусхолдера. Метрическое шкалирование в метрическом шкалировании укажем два метода: ординация Орлочи и метод главных проекций Торгерсона.
Ординация Орлочипредставляет собой сравнительно простой
геометрический метод. По матрицеGвначале выбирают две наиболее различающиеся
(удаленные) точки
(i,j
= 1,2,…,N).
Прямая, проходящая через эти две точки, принимается за первую ось. Обозначим ее A1A2(рис.15).
Рис.15. Ординация Орлочи
Проекции (координаты) остальных точек на первую ось, как видно из рис. 15, составят
.
Строится матрица
расстояний по найденным координатам,
которая сравнивается с матрицей различий.
Если соответствие приемлемое, решение
достигнуто; в противном случае необходимо
искать вторую ось, проходящую через
точку, наиболее удаленную от прямой
.Очевидно,
это точка, которая доставит максимум
,j=3,4,…,N.
Координаты остальных точек – проекции на полученные оси – можно получить геометрическим построением либо аналитически. Однако повышение размерности приводит к сложностям получения оценок. К тому же решение оказывается излишне чувствительным к данным, поскольку оно определяется всего по нескольким точкам.
В методе
главных проекций Торгерсона предполагается,
что матрица G– матрица евклидовых расстояний между
объектами, не содержащая ошибок. По
матрицеGнеобходимо определить размерность
пространства и проекции точек на его
оси. Пусть– расстояния между точкамиi,
j,
k(рис.16).
Рис. 16. Графическая иллюстрация скалярного произведения
Вычислим симметричную
матрицу Bi
размерностиN×N
с элементамиbjk
, представляющими скалярное
произведение векторов с началом в точкеiи концами в точкахj
иk:.
Любая из N точек может быть взята в качествеi-й. Таким образом можно получитьN возможных матрицBi. Согласно теореме Янга-Хаусхолдера:
1. Если какая-либо Bi (i=1,2,…,n) является положительно полуопределенной (ППО), то различия между объектами можно рассматривать как расстояния между точками в вещественном евклидовом пространстве.
2. Ранг любой ППО матрицы соответствует размерности rмножества точек. (Напомним, то ранг ППО матрицы равен числу положительных собственных значений.)
3. Любую ППО матрицу можно факторизовать в виде Bi=XX′. ЭлементыХесть проекции точек-объектов наr ортогональных осей вr-мерном вещественном пространстве с центром в точкеi.
Для того чтобы уменьшить влияние возможных ошибок, начало координат помещают в центр тяжести всех объектов. Тогда координаты искомых (центрированных) точек будут иметь вид:
.
Матрица скалярных
произведений
новых переменных должна факторизоваться
в виде
.
Подставляя сюда выражение для
центрированных переменных и выражая
координаты через расстояния можно
получить, что
,
где
.
Легко
видеть, что
.
Матрицу
называют матрицей сдвойным
центрированием.Факторизация
матрицы
проводится так же, как и в факторном
анализе (см. п. 11.2).
В алгоритме Торгерсона предполагается, что матрица различий является и матрицей расстояний, т.е. G = D. Это требование можно ослабить, допуская, что матрица различий может быть преобразована в матрицу расстояний с помощью аддитивной константы, т.е.D = G + C,
где С– матрица, по главной диагонали которой стоят нули, а остальные элементы – одно и то же числос(аддитивная константа).
Эта константа должна быть такой, чтобы разместить объекты в вещественном пространстве возможно меньшей размерности. Так, для матрицы
аддитивная
константа есть с=5.
Преобразованная
матрица
стала матрицей расстояний пяти точек на плоскости (рис.17).
Рис.17. Конфигурация точек для матрицы расстояний D
Отметим, что при с<5 разместить объекты в вещественном евклидовом пространстве невозможно (не выполняется правило треугольника), прис>5 размерность превышает 2.