Скачиваний:
87
Добавлен:
02.05.2014
Размер:
1.3 Mб
Скачать

3 Задание на лабораторную работу

  1. Изучить применение метода главных компонент

  • Выполнить приведенный в описании пример (Tabl.2.7_исх_комп.xls)

  • Сделать выводы по структуре данных. Для этого дополнительно выполнить в графическом анализе:

  1. идентифицировать объект по щелчку мыши (кнопка Identify)

  2. идентифицировать объект по заданию в строке Row

  3. анализ с помощью вращения в разных плоскостях

  4. проанализировать распределение объектов в построенном пространстве по заданному интервалу значений анализируемого признака (кнопка Brush)

  • По аналогичной схеме самостоятельно провести компонентный анализ для выданного варианта задания (файл - Вар_задан_Дубров.xls, текст - Приложение 2).

    Дополнить заданную матрицу признаков группой объектов с целью формирования достаточно выраженной отдельной группы объектов в построенном в п.2 пространстве главных компонент. Сформулировать правила отнесения объектов к выделенным группам.

    1. Изучить применение кластерного анализа

    • Выполнить приведенный в описании пример

    • Дать обобщенную характеристику выделенных кластеров в устной форме.

  • По аналогичной схеме самостоятельно провести кластерный анализ для выданного варианта задания. Сделать выводы по структуре данных. Для этого:

    • Построить дендрограмму

    • Проанализировать сводку кластерного анализа с населенностью кластеров

    • Вывести координаты центроидов и дать обобщенную характеристику кластеров по ним

    • Вид диаграммы рассеивания и (2D и 3D) и анализ кластеров с их помощью

    • Сформулировать правила классификации

    6. Сравнить полученные результаты компонентного и кластерного анализов по двум признакам:

    • по составу объектов в выделенных группах

    • по сформированным правилам.

    4 Отчет должен содержать

    1. Название и цель работы

    2. Исходные данные варианта задания

    3. Результаты компонентного анализа

      1. Сводная характеристика для всех компонент с указанием собственных значений

      2. График для собственных значений главных компонент

      3. Запись главных компонент cхарактеристикой весов признаков

      4. Выбор значащих компонент и определение названия для них (по лекциям)

      5. Анализ структуры данных (на примере трехмерной диаграммы рассеивания - 3DScatterplot): выделение групп объектов; формирование характерных значений обобщенных признаков (по названиям главных компонент) для выделенных групп

    4. Результаты кластерного анализа:

    • Дендрограмма (общий вид) с выделенными штрихом наиболее очевидными группировками

    • Сводка кластерного анализа с населенностью кластеров

    • Координаты центроидов и анализ кластеров по ним

    • Вид диаграмм рассеивания (2Dи 3D) и анализ кластеров с их помощью

    1. Выводы (результаты сравнения иправила отнесения объектов к выделенным группам)

    5 Вопросы

    1. Цель и классификация методов анализа данных без учителя.

    1. Основное назначение методов визуализации данных. Задачи, решаемые линейными методами снижения размерности.

    2. Метод главных компонент (МГК). Постановка задачи. Основные этапы решения.

    3. Метод главных компонент (МГК). Выбор значащих главных компонент и названия для них.

    4. Метод главных компонент (МГК). Достоинства и недостатки.

    5. Кластерный анализ как метод автоматического группирования данных. Постановка задачи. Требования к критерию качества кластеризации

    6. Кластерный анализ как метод автоматического группирования данных. Определение мер сходства между объектами. Выбор способа определения расстояния между кластерами.

    7. Кластерный анализ как метод автоматического группирования данных. Обобщенный алгоритм кластеризации. Виды критериев качества автоматического группирования.

  • Соседние файлы в папке Методичка по лабораторной работе №2