Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УД_МУ к ЛР 5.doc
Скачиваний:
14
Добавлен:
20.11.2019
Размер:
29.48 Mб
Скачать

Применение метода корреляционного анализа

Для реализации метода корреляционного анализа применяется ПО: Deductor.

Входными данными брались такие признаки, как:

- Фирма;

- Размер;

- Морозостойкость.

Выходом у нас выступала цена.

Настройка параметров корреляционного анализа содержит следующие шаги:

1) Настройка назначения полей

  Для устранения незначащих факторов необходимо наличие хотя бы двух входных полей и хотя бы одного выходного поля.

  Если выделить в списке непрерывное (числовое) поле, для него будет отображен набор основных статистических характеристик в секции "Статистика" - минимальное, максимально и среднее значения, а также стандартное отклонение. Если выделенное поле является дискретным, т.е. принимающим конечное число значений, для него в секции "Уникальные значения" будет указано количество уникальных значений в данном поле, а также список самих уникальных значений.

Рисунок 1 - Настройка назначения полей

2) Запуск процесса обработки.

На данном шаге запускается собственно процесс анализа данных. В зависимости от объема обрабатываемых данных и быстродействия компьютера он может занять определенное время. Ход процесса обработки отображается с помощью прогресс-индикатора "Процент выполнения текущего процесса". В секции "Название процесса" отображается этап процесса обработки данных, выполняемый в данный момент.

 Если процесс обработки остановился, это сигнализирует о возможных проблемах. Остановка может произойти в случае несоответствия типов данных алгоритму обработки, наличия в обрабатываемых полях недопустимых значений и т.д. В этом случае возможно появление окна с сообщением об ошибке.

  Остановить процесс обработки можно с помощью кнопки "Стоп". После этого появляется возможность вернуться на предыдущие шаги Мастера обработки для проверки и изменения параметров. Далее процесс обработки может быть запущен заново или отменен. Если обработка данных была завершена успешно, то в секции "Название процесса" появится сообщение "Успешное завершение".

3) Исключение незначащих факторов.

На предыдущем шаге обработки были рассчитаны значения функции корреляции между каждым входным и каждым выходным столбцами. Эти значения отображаются в таблице в центре окна. На пересечении строки с именем входного поля и столбца с именем выходного поля находится значение рассчитанной между ними корреляции.

Исключение незначащих факторов производится на основании рассчитанной корреляции. Возможны два варианта принятия решения, определяемых выбором соответствующего пункта в нижней части окна:

При ручном выборе незначащих факторов нужно отметить галочками те столбцы, которые будут включены в выходной набор, и снять пометки напротив тех столбцов, которые надо исключить из набора.

В автоматическом режиме становится активной полоса "Порог значимости". Передвигая по ней ползунок, можно задать необходимый уровень значимости. Столбцы, у которых максимальное из рассчитанных значений корреляции меньше порога, будут исключены из выходного набора. Рекомендуемые значения порога значимости выделены синим цветом.

  В выходной набор попадут информационные поля, столбцы, отмеченные на этом шаге, и все выходные столбцы.

Рисунок 2 - Исключение незначащих факторов

4) Выбор способа отображения данных

На данном шаге пользователь должен выбрать, в каком виде будут отображены результаты обработки данных. Для этого достаточно пометить нужные виды отображения флажками и щелкнуть по кнопке "Далее".

Рисунок 3 - Выбор способа отображения данных

После проведения корреляционного анализа при помощи программы Deductor мы получили модель выбора. По способу отображения данных можно сделать вывод, что для определения цены, большей связью обладает фирма-производитель, а меньшей – степень износливости. А размер в свою очередь имеет противоположные связи.

На основе полученных данных можно выбрать фирму-производителя керамической плитки с наиболее приемлемыми ценами. Для этого необходимо воспользоваться диалоговым окном «Что - если», в котором, последовательно изменяя данные, можно получить ответ на вопрос: «Керамическую плитку, чьей же фирмы лучше выбрать?»

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]