Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ekzamen_bilety.doc
Скачиваний:
18
Добавлен:
04.06.2015
Размер:
4.05 Mб
Скачать

Последовательный симплексный метод Этот метод требует проведения минимально возможного числа опытов при определении направления движения.

Симплексом в n-мерном пространстве называют многогранник с (n+1)-й вершиной. Если расстояния между вершинами симплекса одинаковы, такой симплекс называют регулярным. Симплексный метод включает в себя следующие основные процедуры:

1. Линейное преобразование входных переменных с таким расчетом, чтобы изменение каждой из них на единицу одинаково сказывалось бы на изменении выходной переменной.

2. Построение регулярного симплекса и реализация опытов в вершинах симплекса.

3. Отбрасывание вершины с минимальным значением целевой величины и построение нового симплекса, который образуется оставшимися вершинами исходного симплекса и новой вершиной, получаемой зеркальным отображением отброшенной вершины относительно противоположной ей -мерной грани исходного симплекса. Координаты этой новой вершины рассчитываются по формуле:,

где − номер отброшенной вершины.

4. Проведение эксперимента в вершине и возврат к п. 3. Если оказывается, что выходная переменная в новой вершине приняла значение меньшее, чем в остальных вершинах симплекса, то следует возвратиться к предыдущему симплексу. Во избежание зацикливания в качестве отбрасываемой выбирают вершину, в которой выходная переменная имеет величину, следующую по порядку за наихудшей вершиной симплекса. Аналогично следует поступать, если новая вершина выходит за пределы симплекса.

5. Если при перемещении симплекса за шагов некоторая вершина сохраняет свое положение, то симплекс совершит оборот относительно этой вершины. Это означает достижение области оптимума. Другим условием достижения оптимума является выполнение неравенства:, где – малая величина (порог), – среднее значение выходной величины в вершинах симплекса.

К числу достоинств симплексного метода наряду с экономичностью по числу опытов и простотой вычислений следует отнести также возрастание эффективности метода с ростом числа входных переменных, устойчивость выделения направления движения, поскольку оно определяется только соотношением целевых величин, а не их абсолютными значениями.

Графическая иллюстрация симплексного метода при двух входных переменных приведена на рис.5. Здесь поверхность отклика задается линиями уровня.

x2

x1

Рис. 5. Схема последовательного симплексного метода

  1. Ортогональные методы многомерного шкалирования.

Ортогональные методы многомерного шкалирования.

В метрическом шкалировании укажем два метода: ординация Орлочи и метод главных проекций Торгерсона.

Ординация Орлочипредставляет собой сравнительно простой геометрический метод. По матрицеGвначале выбирают две наиболее различающиеся (удаленные) точки

(i,j = 1,2,…,N).

Прямая, проходящая через эти две точки, принимается за первую ось. Обозначим ее A1A2(рис.15).

Рис.15. Ординация Орлочи

Проекции (координаты) остальных точек на первую ось, как видно из рис. 15, составят .

Строится матрица расстояний по найденным координатам, которая сравнивается с матрицей различий. Если соответствие приемлемое, решение достигнуто; в противном случае необходимо искать вторую ось, проходящую через точку, наиболее удаленную от прямой .Очевидно, это точка, которая доставит максимум,j=3,4,…,N.

Координаты остальных точек – проекции на полученные оси – можно получить геометрическим построением либо аналитически. Однако повышение размерности приводит к сложностям получения оценок. К тому же решение оказывается излишне чувствительным к данным, поскольку оно определяется всего по нескольким точкам.

В методе главных проекций Торгерсона предполагается, что матрица G– матрица евклидовых расстояний между объектами, не содержащая ошибок. По матрицеGнеобходимо определить размерность пространства и проекции точек на его оси. Пусть– расстояния между точкамиi, j, k(рис.16).

Рис. 16. Графическая иллюстрация скалярного произведения

Вычислим симметричную матрицу Bi размерностиN×N с элементамиbjk , представляющими скалярное произведение векторов с началом в точкеiи концами в точкахj иk:.

Любая из N точек может быть взята в качествеi-й. Таким образом можно получитьN возможных матрицBi. Согласно теореме Янга-Хаусхолдера:

1. Если какая-либо Bi (i=1,2,…,n) является положительно полуопределенной (ППО), то различия между объектами можно рассматривать как расстояния между точками в вещественном евклидовом пространстве.

2. Ранг любой ППО матрицы соответствует размерности rмножества точек. (Напомним, то ранг ППО матрицы равен числу положительных собственных значений.)

3. Любую ППО матрицу можно факторизовать в виде Bi=XX. ЭлементыХесть проекции точек-объектов наr ортогональных осей вr-мерном вещественном пространстве с центром в точкеi.

Для того чтобы уменьшить влияние возможных ошибок, начало координат помещают в центр тяжести всех объектов. Тогда координаты искомых (центрированных) точек будут иметь вид:

.

Матрица скалярных произведений новых переменных должна факторизоваться в виде. Подставляя сюда выражение для центрированных переменных и выражая координаты через расстояния можно получить, чтогде.

Легко видеть, что .

Матрицу называют матрицей сдвойным центрированием.Факторизация матрицыпроводится так же, как и в факторном анализе (см. п. 11.2).

ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 15

  1. Модель однофакторного дисперсионного анализа. Разложение суммы квадратов.

Разложение суммы квадратов в однофакторном ДА.

В п.4.2 рассматривался вопрос включения в регрессию качественных переменных. В случае, когда регрессорами являются только качественные переменные, общепринятым методом исследования выступает дисперсионный анализ (ДА).

В зависимости от числа регрессоров, называемых в ДА факторами, говорят об одно-, двух-, многофакторном ДА. Сами факторы полагаются неслучайными (модель с постоянными эффектами) либо случайными (модель со случайными эффектами). В модели с постоянными эффектами речь идет в основном о сравнении средних значений количественной переменной при различных значенииях факторов, тогда как в моделях со случайными эффектами интересует доля изменчивости, вносимая отдельными факторами. Ниже рассматривается первая модель, для которой ДА часто называют одно-, двух-, многофакторной классификацией.

Однофакторный дисперсионный анализ

Имеется количественная переменная у, определяемая качественной переменной, иначе фактором, принимающимрдискретных значений (уровней). Так, фактором может быть «поставщик», уровнями – определенные фирмы-поставщики, переменнойу– срок службы поставляемого товара. В качестве исходных данных выступает выборка, содержащая ряд наблюдений на каждом из уровней (по нескольку экземпляров определенного товара от каждого поставщика). Необходимо ответить на вопрос – различаются ли по сроку службы объекты от разных поставщиков.

Модель однофакторного анализа: , (5.1)

где – наблюденные значения,Niобъем выборки для i-го уровня фактора. Параметрmобозначает некоторую точку отсчета,ai– эффект (вклад)i-го уровня фактора,uij– независимые, нормально распределенные случайные возмущения, удовлетворяющие предпосылке 5 классической регрессии.

Модель (5.1) не позволяет однозначно оценить параметры, поскольку можно добавить к mи вычесть изaiпроизвольную константу. Неоднозначность снимается условием репараметризацииN1a1+N2a2+…+Npap=0. (5.2)

Оценивание параметров производится по методу наименьших квадратов (МНК). Для минимизации остаточной суммы квадратовнайдем первые производные:

;

.

Обозначим . Из выражений для производных с учетом (5.2) получаем:

. (5.3)

(Точка на месте индекса означает усреднение по этому индексу.)

Результаты измерений принято представлять в виде табл.11.

Таблица 11

Уровни фактора

Наблюдения

Сумма внутри уровня

Среднее по уровню

1

1

р

p.

  1. Неметрическое шкалирование. Схема алгоритма Краскала.

Неметрическое шкалирование. Схема алгоритма Каскала.

Рассмотрим один из известных алгоритмов неметрического многомерного шкалирования, предложенный Дж. Краскалом. Пусть – оценки координат, гдеi– номер точки;kномер координаты;– оценка расстояний по-метрике;ранговые образы расстояний, иначеотклонения. Эти величины должны соответствовать, насколько это возможно, оценкам расстояний, но с сохранением условия монотонности:. (12.1)

Для оценки степени расхождения вводят меру соответствия (S-стресс):

либо, где– среднее арифметическое оцененных расстояний.

Наряду с S-стрессом используетсяSS-стресс, где в числителе оценки расстояний и отклонения заменены их квадратами.SS-стресс обеспечивает более быструю сходимость, если матрица различий симметрична.

Алгоритм Краскала состоит из пяти основных этапов:

1) формирование стартовой конфигурации, то есть получение начальных оценок координат (размерность пространства предполагается известной);

2) стандартизация расстояний и оценок координат;

3) неметрический этап, в ходе которого вычисляются отклонения;

4) метрический этап: перерасчет оценок координат;

5) подсчет меры соответствия.

Если мера улучшилась, то возвращаются к этапу 2; в противном случае работа алгоритма завершается.

Рассмотрим перечисленные этапы подробнее. Стартовая конфигурация строится по методу Торгерсона (ортогональное проектирование). Затем по координатам найденных точек вычисляется матрица расстояний с элементами .

На втором этапе в ходе первой итерации текущие расстояния и координаты – те, которые получены из стартовой конфигурации. Для всех итераций, кроме первой, в качестве текущего расстояния и оценок используются те, что были получены на метрическом этапе предыдущей итерации.

Стандартизация оценок расстояний и координат состоит в делении их на сумму квадратов . Очевидно, подобное преобразование делает сумму квадратов расстояний равной единице, что снижает вероятность получения вырожденного решения и упрощает вычисления, особенно при использованииS1-стресса, выражение для которого приобретает вид. (12.2)

ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 16

  1. Анализ главных компонент. Геометрическая интерпретация.

Анализ главных компонент. Геометрическая интерпретация.

Геометрическая интерпретация главных компонент.Дляn-мерного векторас ковариационной матрицейСможно построить так называемый эллипсоид рассеяния:,

где – вектор средних значений элементов.

Точки, соответствующие наблюдениям вектора а, будут располагаться примерно в очертаниях этого эллипсоида. На рис. 11 приведена двумерная иллюстрация эллипсоида рассеяния.

В методе главных компонент исходные наблюдения предполагаются центрированными. Переход к центрированным наблюдениям означает перенос начала координат в точку . Затем оси координат поворачивают на уголтак, чтобы осьшла вдольглавной оси эллипсоида рассеяния. Наблюдения в новых координатахистанут независимыми.

Рис.11. Двумерный эллипсоид рассеяния

Чем теснее наблюдения группируются около главной оси эллипсоида рассеяния, являющейся теперь новой координатой , тем менее значащим является для исследователя разброс точек в направлении оси, а следовательно, и сама эта координата (рис.12).

Рис.12. «Вытянутый» эллипсоид рассеяния

  1. Критерии качества шкалирования.

ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 17

  1. Модель однофакторного дисперсионного анализа. Разложение суммы квадратов.

Разложение суммы квадратов в однофакторном ДА.

В п.4.2 рассматривался вопрос включения в регрессию качественных переменных. В случае, когда регрессорами являются только качественные переменные, общепринятым методом исследования выступает дисперсионный анализ (ДА).

В зависимости от числа регрессоров, называемых в ДА факторами, говорят об одно-, двух-, многофакторном ДА. Сами факторы полагаются неслучайными (модель с постоянными эффектами) либо случайными (модель со случайными эффектами). В модели с постоянными эффектами речь идет в основном о сравнении средних значений количественной переменной при различных значенииях факторов, тогда как в моделях со случайными эффектами интересует доля изменчивости, вносимая отдельными факторами. Ниже рассматривается первая модель, для которой ДА часто называют одно-, двух-, многофакторной классификацией.

Однофакторный дисперсионный анализ

Имеется количественная переменная у, определяемая качественной переменной, иначе фактором, принимающимрдискретных значений (уровней). Так, фактором может быть «поставщик», уровнями – определенные фирмы-поставщики, переменнойу– срок службы поставляемого товара. В качестве исходных данных выступает выборка, содержащая ряд наблюдений на каждом из уровней (по нескольку экземпляров определенного товара от каждого поставщика). Необходимо ответить на вопрос – различаются ли по сроку службы объекты от разных поставщиков.

Модель однофакторного анализа: , (5.1)

где – наблюденные значения,Niобъем выборки для i-го уровня фактора. Параметрmобозначает некоторую точку отсчета,ai– эффект (вклад)i-го уровня фактора,uij– независимые, нормально распределенные случайные возмущения, удовлетворяющие предпосылке 5 классической регрессии.

Модель (5.1) не позволяет однозначно оценить параметры, поскольку можно добавить к mи вычесть изaiпроизвольную константу. Неоднозначность снимается условием репараметризацииN1a1+N2a2+…+Npap=0. (5.2)

Оценивание параметров производится по методу наименьших квадратов (МНК). Для минимизации остаточной суммы квадратовнайдем первые производные:

;

.

Обозначим . Из выражений для производных с учетом (5.2) получаем:

. (5.3)

(Точка на месте индекса означает усреднение по этому индексу.)

Результаты измерений принято представлять в виде табл.11.

Таблица 11

Уровни фактора

Наблюдения

Сумма внутри уровня

Среднее по уровню

1

1

р

p.

  1. Нелинейные методы шкалирования.

ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 18

  1. Разложение суммы квадратов в однофакторном дисперсионном анализе.

Разложение суммы квадратов в однофакторном ДА.

В п.4.2 рассматривался вопрос включения в регрессию качественных переменных. В случае, когда регрессорами являются только качественные переменные, общепринятым методом исследования выступает дисперсионный анализ (ДА).

В зависимости от числа регрессоров, называемых в ДА факторами, говорят об одно-, двух-, многофакторном ДА. Сами факторы полагаются неслучайными (модель с постоянными эффектами) либо случайными (модель со случайными эффектами). В модели с постоянными эффектами речь идет в основном о сравнении средних значений количественной переменной при различных значенииях факторов, тогда как в моделях со случайными эффектами интересует доля изменчивости, вносимая отдельными факторами. Ниже рассматривается первая модель, для которой ДА часто называют одно-, двух-, многофакторной классификацией.

Однофакторный дисперсионный анализ

Имеется количественная переменная у, определяемая качественной переменной, иначе фактором, принимающимрдискретных значений (уровней). Так, фактором может быть «поставщик», уровнями – определенные фирмы-поставщики, переменнойу– срок службы поставляемого товара. В качестве исходных данных выступает выборка, содержащая ряд наблюдений на каждом из уровней (по нескольку экземпляров определенного товара от каждого поставщика). Необходимо ответить на вопрос – различаются ли по сроку службы объекты от разных поставщиков.

Модель однофакторного анализа: , (5.1)

где – наблюденные значения,Niобъем выборки для i-го уровня фактора. Параметрmобозначает некоторую точку отсчета,ai– эффект (вклад)i-го уровня фактора,uij– независимые, нормально распределенные случайные возмущения, удовлетворяющие предпосылке 5 классической регрессии.

Модель (5.1) не позволяет однозначно оценить параметры, поскольку можно добавить к mи вычесть изaiпроизвольную константу. Неоднозначность снимается условием репараметризацииN1a1+N2a2+…+Npap=0. (5.2)

Оценивание параметров производится по методу наименьших квадратов (МНК). Для минимизации остаточной суммы квадратовнайдем первые производные:

;

.

Обозначим . Из выражений для производных с учетом (5.2) получаем:

. (5.3)

(Точка на месте индекса означает усреднение по этому индексу.)

Результаты измерений принято представлять в виде табл.11.

Таблица 11

Уровни фактора

Наблюдения

Сумма внутри уровня

Среднее по уровню

1

1

р

p.

  1. Меры близости в кластерном анализе.

Меры близости и различия в кластерном анализе.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]