Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
конспект_АИД_полный_2017.doc
Скачиваний:
41
Добавлен:
08.07.2017
Размер:
4.26 Mб
Скачать

7.2.5.Интерпретация

Интерпретируемость обсуждалась выше, когда речь шла о выборе размерности. Однако нужно сделать еще несколько замечаний об ин­терпретации решений. В частности, следует объяснить фразу «суще­ственные характеристики стимулов», употреблявшуюся ранее. Такие характеристики - это обычно упорядочения или группировки сти­мулов.

Существенно важная группа стимулов — это набор стимулов, группирующихся вместе, в одной области многомерного пространства решения, и обладающих каким-либо общим признаком. Например, в ис­следовании профессий торговые профессии могут располагаться вместе, образуя разумную группировку. При исследовании популярных жур­налов могут группироваться вместе журналы для женщин (МС, До­машний журнал для леди, Вог и др.). Существенное упорядочение стимулов — это упорядочение, соот­ветствующее порядку стимулов по их важной характеристике.

Интерпретация решения включает идентификацию важных группи­ровок и упорядочений стимулов. Для группировок нужно идентифици­ровать те черты, которые являются общими для всех объектов каждого кластера. Для упорядочений нужно идентифицировать соответствую­щие им признаки. Один из способов интерпретации решения — простое рассмотрение конфигурации.

7.3. Выводы

Торгерсон [Torgerson, 1952] предположил, что различия равны расстояниям в евклидовом пространстве. Из этого предположения он вывел один из первых алгоритмов многомерного шкалирования. Ис­пользуя данные, удовлетворяющие метрическому предположению Торгерсона, можно найти координатные оси, применив к матрице ска­лярных произведений * метод главных компонент.

Вопрос о числе координатных осей исследуется путем рассмотре­ния воспроизводимости осей в нескольких подвыборках, интерпре­тируемости решения в различных размерностях и анализа графика за­висимости собственных значений от номеров осей. Решение (конфигу­рация) может остаться неповернутым, может быть повернуто вруч­ную или с помощью какого-либо объективного алгоритма, такого, как варимакс [Kaiser, 1958] или эквимакс [Saunders, 1960]. Из этих трех способов поворота предпочтительнее тот, который дает наиболее ин­терпретируемые направления. Интерпретация решения включает идентификацию группировок стимулов или упорядочений стимулов, соответствующих их существенным характеристикам.

8. Литература

  1. Айвазян С.А., Буштабер В.М., Енюков И.С. Прикладная статистика: классификация и снижение размерности.– М.: Финансы и статистика, 1988

  2. Афифи А., Эйзен С. Статистический анализ: подход с использованием ЭВМ.– М.:Мир, 1982

  3. Айвазян С.А., Бежаева О.В. Классификация многомерных наблюдений.-М:. Статистика, 1974

  4. Дж. Ту, Р. Гонсалез Принципы распознавания образов.–М., Мир, 1978

  5. Р. Дуда, П. Харт Распознавание образов и анализ сцен.– М:.,Мир, 1976

  6. Дюран Б., Одел П. Кластерный анализ

  7. Справочник по прикладной статистике, т.1,2.

  8. Тюрин Ю.Н., Макаров А.А.Анализ данных на компьютере

  9. В.Д. Дюк Обработка данных на ПК в примерах

  10. М.Дейвисон. Многомерное шкалирование.- М.:Финансы и статисти­ка,1988

  11. А.Ю.Терехина. Анализ данных методами многомерного шкалирова­ния.-М.:Наука, 1986

  12. И.Гайдышев .Анализ и обработка данных . Специальный справочник.– СПб.: Питер - 2002,

  13. Ю.Н.Тюрин, А.А. Макаров. Анализ данных на компьютере.-М.: Фи­нансы и статистика,1995

  14. В. Дюк, А. Самойленко. «Data Mining», - СПб:-, Питер, 2001

  15. Справочник по прикладной статистики т.2.под редакцией Э.Ллойда, У.Ледермана.-М.:Финансы и статистика,1990

  16. В. А. Дюк. Обработка данных на ПК в примерах. -СПб: Питер, 1999

  17. А. А. Баргесян, М.С. Куприянов, В. В. Степаненко, И. И. Холод. Методы и модели анализа данных OLAP и Data Mining. –СПб.: BHV-Петербург, 2004

  18. Анализ данных и процессов / А. А. Барсегян, М. С. Куприянов, И. И. Холод и др. 3-е изд., перераб. и доп. СПб.: БХВ-Петербург, 2009 г., 512 с.

По пакету STATISTICA:

  1. Боровиков В.П. Популярное введение в программу STATISTICA.– М.: Компьютер Пресс, 1998

20.С.Д. Двоенко. , В.В. моттль Конспект лекций по курсу

Основы обработки данных» (электронный материал)

104

Соседние файлы в предмете Анализ и интерпретация данных