Скачиваний:
57
Добавлен:
01.05.2014
Размер:
886.78 Кб
Скачать

Итоговая матрица расстояний

C_1

C_2

C_3

C_4

C_5

C_6

C_7

C_8

C_9

C_10

C_1

0,000000

0,146320

0,124408

0,144266

0,021190

0,175386

0,089470

0,045619

0,238260

0,125166

C_2

0,146320

0,000000

0,090093

0,019240

0,158837

0,289637

0,101440

0,111709

0,115820

0,027935

C_3

0,124408

0,090093

0,000000

0,072662

0,124415

0,297613

0,036267

0,118711

0,123581

0,096560

C_4

0,144266

0,019240

0,072662

0,000000

0,154539

0,296316

0,088367

0,114493

0,104565

0,040515

C_5

0,021190

0,158837

0,124415

0,154539

0,000000

0,183350

0,088236

0,065684

0,243259

0,139899

C_6

0,175386

0,289637

0,297613

0,296316

0,183350

0,000000

0,264165

0,184082

0,399806

0,262052

C_7

0,089470

0,101440

0,036267

0,088367

0,088236

0,264165

0,000000

0,091214

0,158302

0,097561

C_8

0,045619

0,111709

0,118711

0,114493

0,065684

0,184082

0,091214

0,000000

0,216211

0,086863

C_9

0,238260

0,115820

0,123581

0,104565

0,243259

0,399806

0,158302

0,216211

0,000000

0,143213

C_10

0,125166

0,027935

0,096560

0,040515

0,139899

0,262052

0,097561

0,086863

0,143213

0,000000

Диаграмма Шепарда. Можно построить для текущей конфигурации точек график зависимости воспроизведенных расстояния от исходных расстояний. Такая диаграмма рассеяния называется диаграммой Шепарда. По оси ординат OY показываются воспроизведенные расстояния (сходства), а по оси OX откладываются истинные сходства (расстояния) между объектами (отсюда обычно получается отрицательный наклон). На этом график также строится график ступенчатой функции. Ее линия представляет так называемые величины D-с крышечкой, то есть, результат монотонного преобразования f() исходных данных. Если бы все воспроизведенные результирующие расстояния легли на эту ступенчатую линию, то ранги наблюдаемых расстояний (сходств) был бы в точности воспроизведен полученным решением (пространственной моделью). Отклонения от этой линии показывают на ухудшение качества согласия (т.е. качества подгонки модели).

Диаграмма Шепарда для D – hat

Диаграмма Шепарда для D – star

Те же самые действия можно проделать на основе матрицы расстояний между признаками

Длина чашелистика

Ширина чашелистика

Длина лепестка

Ширина лепетска

Класс

Длина чашелистика

0,00000

36,15785

28,95237

57,18304

47,53578

Ширина чашелистика

36,15785

0,00000

25,87489

25,86407

18,47701

Длина лепестка

28,95237

25,87489

0,00000

33,99441

25,00620

Ширина лепестка

57,18304

25,86407

33,99441

0,00000

10,23377

Класс

47,53578

18,47701

25,00620

10,23377

0,00000

Итоговая конфигурация

DIM. 1

DIM. 2

Длина чашелистика

1,58703

0,259263

Ширина чашелистика

-0,17304

0,411140

Длина лепестка

0,24731

-0,703631

Ширина лепестка

-1,10526

0,269150

Класс

-0,55603

-0,235922

График итоговой конфигурации

D – hat расстояния

Длина чашелистика

Ширина чашелистика

Длина лепестка

Ширина лепестка

Класс

Длина чашелистика

0,000000

1,766615

1,649857

2,692310

2,199532

Ширина чашелистика

1,766615

0,000000

1,191389

0,942969

0,751912

Длина лепестка

1,649857

1,191389

0,000000

1,666056

0,929575

Ширина лепестка

2,692310

0,942969

1,666056

0,000000

0,746155

Класс

2,199532

0,751912

0,929575

0,746155

0,000000

D-star расстояния

Длина чашелистика

Ширина чашелистика

Длина лепестка

Ширина лепестка

Класс

Длина чашелистика

0,000000

1,766615

1,649857

2,692310

2,199532

Ширина чашелистика

1,766615

0,000000

1,191389

0,942969

0,751912

Длина лепестка

1,649857

1,191389

0,000000

1,666056

0,929575

Ширина лепестка

2,692310

0,942969

1,666056

0,000000

0,746155

Класс

2,199532

0,751912

0,929575

0,746155

0,000000

Итоговая матрица расстояний

Длина чашелистика

Ширина чашелистика

Длина лепестка

Ширина лепестка

Класс

Длина чашелистика

0,000000

1,766615

1,649857

2,692310

2,199532

Ширина чашелистика

1,766615

0,000000

1,191389

0,942969

0,751912

Длина лепестка

1,649857

1,191389

0,000000

1,666056

0,929575

Ширина лепестка

2,692310

0,942969

1,666056

0,000000

0,746155

Класс

2,199532

0,751912

0,929575

0,746155

0,000000

Диаграмма Шепарда для D-star

Диаграмма Шепарда для D-hat

Выводы: В процессе выполнения лабораторной работы были получены навыки по многомерному шкалированию больших массивов данных в системе STATISTIKA

Отличие многомерного шкалирования от факторного анализа

Даже несмотря на то, что имеется много сходства в характере исследуемых вопросов, методы МНШ и факторного анализа имеют ряд существенных отличий. Так, факторный анализ требует, чтобы исследуемые данные подчинялись многомерному нормальному распределению, а зависимости были линейными. Методы МНШ не накладывают таких ограничений. Методы МНШ могут быть применимы, пока сохраняет смысл порядок следования рангов сходств. В терминах различий получаемых результатов, факторный анализ стремится извлечь больше факторов (координатных осей или латентных переменных) по сравнению с МНШ; в результате чего МНШ часто приводит к проще интерпретируемым решениям. Однако более существенно то, что методы МНШ можно применять к любым типам расстояний или сходств, тогда как методы ФА требуют, чтобы первоначально была вычислена матрица корреляций. Методы МНШ могут быть основаны на прямом оценивании сходств между стимулами субъектов, тогда как ФА требует, чтобы субъекты были оценены через их стимулы по некоторому списку атрибутов.

Суммируя вышесказанное, можно сказать, что методы МНШ потенциально применимы к более широкому классу исследовательских задач.

Соседние файлы в папке Лабораторная работа №6
  • #
    01.05.20148.7 Кб40Euclidean.sta
  • #
    01.05.2014119.3 Кб39IRIS_1.stw
  • #
    01.05.201432.77 Кб38Learning.stw
  • #
    01.05.201410.24 Кб38Workbook5.stw
  • #
    01.05.2014886.78 Кб57АИД_06.doc
  • #
    01.05.2014451.07 Кб40Многомерное шкалирование.stw