- •Лабораторная работа 1. Кластерный анализ объектов, заданных набором признаков
- •Текущий каталог
- •Средства языка программирования matlab
- •Создание массивов ячеек
- •Визуализация массивов ячеек
- •Управляющие структуры Условный оператор
- •Структура переключателя
- •Циклы типа for...End
- •Циклы типа while...End
- •Диалоговый ввод
- •Функции в matlab(м-функции)
- •Некоторые функции и средства визуализации
- •Иерархические методы кластерного анализа
- •Методы объединения или связи
- •Алгоритм k-средних (k-means)
- •Описание алгоритма
- •С помощью функции fcm
Лабораторная работа 1. Кластерный анализ объектов, заданных набором признаков
Порядок выполнения работы.
Создается скрипт
Генерация случайных чисел по указанному закону распределения. Из них создается матрица из N строк (наблюдений) и 2 или 3 столбцов (признаков). Сгенерированные строки должны принадлежать одному из M классов за счет прибавления к сгенерированным числам положительной или отрицательной добавки
Визуализация данных в виде двумерного или трехмерного графика
Разбиение на классы с помощью функции subclust. Число классов, являющееся результатом subclust, используется как входной параметр в последующих методах кластерного анализа
Разбиение на классы с помощью двух из трех методов кластерного анализа.
Визуализация результатов разбиения на классы с помощью силуэта
Графическое представление классов с помощью scatter/scatter3
Для иерархической классификации дополнительно построение дендрограммы
Сравнение количества правильно классифицированных наблюдений по каждому из методов путем заполнения таблицы вида
-
Номер класса
Число наблюдений в классе
Метод 1 – процент верно классифицированных наблюдений
Метод 2 – процент верно классифицированных наблюдений
1
2
…
M
Вариант работы имеет вид:ZPMBR, где
Z=1-6 – вид закона распределения генерируемых признаков
Биномиальное
Геометрическое
Гипергеометрическое
Пуассона
Равномерное
Нормальное
P=2,3 – число признаков
M=2,3,4 – число классов
B – пара номеров методов классификации вида 1-2, 1-3, 2-3
1-метод иерархической классификации
2 - метод к - среднего
3 – метод нечеткой классификации
R=1 - способ определения расстояния:
1-эвклидово расстояние
2- стандартизованное эвклидово расстояние
3-расстояние городских кварталов
Основные характеристики системы MATLAB
Система MATLAB (сокращение от MATrix LABoratory - матричная лаборатория) представляет собой интегрированную программную среду для выполнения численных расчетов, компьютерного моделирования и вычислительных экспериментов, охватывающих в том или ином объеме различные области классической и современной математики, а также широчайший спектр инженерных приложений.
Архитектурно система MATLAB состоит из базовой программы и нескольких десятков так называемых пакетов расширения (ToolBox), которые в своей совокупности обеспечивают исключительно широкий диапазон решаемых задач. Интеграция всех этих средств в единой рабочей среде обеспечивает необходимую гибкость использования сотен встроенных функций, реализующих разнообразные математические процедуры и вычислительные алгоритмы.
Основные элементы графического интерфейса системы MATLAB
Каждый отдельный запуск системы MATLAB называется сеансом или сессией работы с ней.
При вызове Matlab ее интерфейс можно настроить по своему желанию. Наиболее удобно видеть все окна в различных закладках. Это достигается выполнением пункта меню Desktop, DesktopLayout, AllTabbed. При этом можно сделать невидимыми закладки Command History и Profile и окно будет следующего вида (Рис. ):
Панель инструментов
командтрументов
ППанельанель инструментовПанель инструментов
Окно команд
