Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры 2007-2008 Информатика.doc
Скачиваний:
122
Добавлен:
22.02.2016
Размер:
474.11 Кб
Скачать

17. Пакет Statgraphics. Одномерный статистический анализ: оценка числ. Харак-к, подбор з-на распред-ия случ. Величин

Для элементов заданной выборки исследуемой. величины пакет позволяет определить оценки всех числ. характеристик (мода, медиана, геометр. Среднее, максимум, станд. ошибка и т.д.), предложенных в пакете, или исследователь может указать интересующие его характеристики. Для исследуемой величины в качестве исходного закона распределения Statgraphics предлагает нормальный закон. Пользователь может выбрать из списка гипотетеческих распределений другой, напр., равномерный или закон распределения Вейбулла. При этом автоматически определяются оценки числ. характеристик для выбранного закона.

18. Пакет Statgraphics. Сравнение неск-ких случ. Величин: сравнение числ. Харак-ик и законов распределения

Пакет позволяет выполнить сравнение числовых характеристик для 2-х и более случ. величин. пользователь указывает имена величины, для которых будет выполнятся сравнение. В появившемся окне анализа вызывает панель основных статистик и в списке числовых характеристик указывает интересующие его или все. В результате на экран выводится список характеристик и их оценки для выбр. случ. величин. Кроме того, Statgraphics позволяет выполнить сравнение случ. величин и по законам распределения

19. Пакет Statgraphics. Анализ зависимостей м/у величинами: регрессионный и корреляционный анализ. Анализ временных рядов.

Простая регрессия. Для заданных переменных X и Y в пакете выполняется расчет параметров линейной регрессии (y=a+b*x), корреляционный анализ, показывающий силу связи м/у исслед. переменными. Кроме того, можно из списка предлагаемых пакетом выбрать другую зависимость, напр. экспоненциальную, показательную. Автоматически рассчитываются параметры уравнения значения коэффициента корреляции. Множественная регрессия. Исследователь может задать предполагаемый вид уравнения регрессии. В ходе расчетов можно изменять вид независ. переменных. Вид уравнения выводится на экран.

Временной ряд – это последовательность измерений в последовательные моменты времени. Анализ временных рядов   включает широкий спектр разведочных процедур и исследовательских методов, которые ставят две основные цели: a) определение природы временного ряда и b) прогнозирование (предсказание будущих значений временного ряда по настоящим и прошлым значениям). Обе эти цели требуют, чтобы модель ряда была идентифицирована и, более или менее, формально описана. в Statgraphics можете экстраполировать временной ряд на основе найденной модели, т.е. предсказать его будущие значения

20. Пакет Statgraphics. Многомерный анализ: метод главных компонент, кластерный, дискриминантный анализ

Модуль “Многомерные методы” предназначен для изучения и раскрытия взаимоотношений множества факторов (переменных). Если пользователь занимается исследованиями вобластях, где объекты исследования характеризуются большим числом признаков, данный модуль поможет сортировать и группировать данные, определять отношения между переменными, выдвигать и проверять различные гипотезы. Для этого в модуле функционирует пять мощных процедур, обеспечивающих проведение Кластерного анализа, анализа по методу Главных Компонент, Дискриминантного анализа.

Дискриминантный анализ исследует различия между группами, построенными с помощью значений (кодов) независимой (группирующей) переменной. Однако в дискриминантном анализе, как правило, одновременно рассматривается более одной независимой переменной и определяются "типы" (классы) значений этих переменных. Именно, в дискриминантном анализе находят такие линейные комбинации зависимых переменных, которые наилучшим образом определяют принадлежность наблюдения к определенному классу, причем число классов известно заранее.

Анализ Главных компонент. Линейный метод понижения размерности, в котором определяются попарно ортогональные направления максимальной вариации исходных данных, после чего данные проектируются на пространство меньшей размерности, порожденное компонентами с наибольшей вариацией. В основном процедура выделения главных компонент подобна вращению, максимизирующему дисперсию (варимакс) исходного пространства переменных.

Общие методы Кластерного анализа: Объединение (древовидная кластеризация), Двувходовое объединение и Метод K средних. Объединение или метод древовидной кластеризации используется при формировании кластеров несходства или расстояния между объектами. Рассмотрим горизонтальную древовидную диаграмму. Диаграмма начинается с каждого объекта в классе (в левой части диаграммы). Постепенно (очень малыми шагами) вы "ослабляете" ваш критерий о том, какие объекты являются уникальными, а какие нет. Другими словами, вы понижаете порог, относящийся к решению об объединении двух или более объектов в один кластер. В результате, вы связываете вместе всё большее и большее число объектов и агрегируете (объединяете) все больше и больше кластеров, состоящих из все сильнее различающихся элементов. Окончательно, на последнем шаге все объекты объединяются вместе.

Двувходовое объединение. Модуль Кластерный анализ содержит эффективную двувходовую процедуру объединения, позволяющую проводить кластеризацию в обоих направлениях. Однако двувходовое объединение используется в обстоятельствах, когда ожидается, что и наблюдения и переменные одновременно вносят вклад в обнаружение осмысленных кластеров. Трудность с интерпретацией полученных результатов возникает вследствие того, что сходства между различными кластерами могут происходить из (или быть причиной) некоторого различия подмножеств переменных. Поэтому получающиеся кластеры являются по своей природе неоднородными.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]