Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы к вопросам 2012_01_03.doc
Скачиваний:
644
Добавлен:
22.02.2016
Размер:
1.64 Mб
Скачать

19. Пакет Statgraphics. Анализ зависимостей между величинами: регрессионный и корреляционный анализ. Анализ временных рядов

Простая регрессия. Для заданных переменных X и Y в пакете выполняется расчет параметров линейной регрессии (y=a+b*x), корреляционный анализ, показывающий силу связи м/у исслед. переменными. Кроме того, можно из списка предлагаемых пакетом выбрать другую зависимость, напр. экспоненциальную, показательную. Автоматически рассчитываются параметры уравнения значения коэффициента корреляции. Множественная регрессия. Исследователь может задать предполагаемый вид уравнения регрессии. В ходе расчетов можно изменять вид независ. переменных. Вид уравнения выводится на экран.

Временной ряд – это последовательность измерений в последовательные моменты времени. Анализ временных рядов включает широкий спектр разведочных процедур и исследовательских методов, которые ставят две основные цели: a) определение природы временного ряда и b) прогнозирование (предсказание будущих значений временного ряда по настоящим и прошлым значениям). Обе эти цели требуют, чтобы модель ряда была идентифицирована и, более или менее, формально описана. в Statgraphics можете экстраполировать временной ряд на основе найденной модели, т.е. предсказать его будущие значения.

20. Пакет Statgraphics. Многомерный анализ: метод главных компонент, кластерный, дискриминантный анализ

Модуль “Многомерные методы” предназначен для изучения и раскрытия взаимоотношений множества факторов (переменных). Если пользователь занимается исследованиями в областях, где объекты исследования характеризуются большим числом признаков, данный модуль поможет сортировать и группировать данные, определять отношения между переменными, выдвигать и проверять различные гипотезы. Для этого в модуле функционирует пять мощных процедур, обеспечивающих проведение Кластерного анализа, анализа по методу Главных Компонент, Дискриминантного анализа.

Дискриминантный анализ исследует различия между группами, построенными с помощью значений (кодов) независимой (группирующей) переменной. Однако в дискриминантном анализе, как правило, одновременно рассматривается более одной независимой переменной и определяются "типы" (классы) значений этих переменных. Именно, в дискриминантном анализе находят такие линейные комбинации зависимых переменных, которые наилучшим образом определяют принадлежность наблюдения к определенному классу, причем число классов известно заранее.

Анализ Главных компонент. Линейный метод понижения размерности, в котором определяются попарно ортогональные направления максимальной вариации исходных данных, после чего данные проектируются на пространство меньшей размерности, порожденное компонентами с наибольшей вариацией. В основном процедура выделения главных компонент подобна вращению, максимизирующему дисперсию (варимакс) исходного пространства переменных.

Общие методы Кластерного анализа: Объединение (древовидная кластеризация), Двувходовое объединение и Метод K средних. Объединение или метод древовидной кластеризации используется при формировании кластеров несходства или расстояния между объектами. Рассмотрим горизонтальную древовидную диаграмму. Диаграмма начинается с каждого объекта в классе (в левой части диаграммы). Постепенно (очень малыми шагами) вы "ослабляете" ваш критерий о том, какие объекты являются уникальными, а какие нет. Другими словами, вы понижаете порог, относящийся к решению об объединении двух или более объектов в один кластер. В результате, вы связываете вместе всё большее и большее число объектов и агрегируете (объединяете) все больше и больше кластеров, состоящих из все сильнее различающихся элементов. Окончательно, на последнем шаге все объекты объединяются вместе.

Двувходовое объединение. Модуль Кластерный анализ содержит эффективную двувходовую процедуру объединения, позволяющую проводить кластеризацию в обоих направлениях. Однако двувходовое объединение используется в обстоятельствах, когда ожидается, что и наблюдения и переменные одновременно вносят вклад в обнаружение осмысленных кластеров. Трудность с интерпретацией полученных результатов возникает вследствие того, что сходства между различными кластерами могут происходить из (или быть причиной) некоторого различия подмножеств переменных. Поэтому получающиеся кластеры являются по своей природе неоднородными.