Лабораторная работа №6 / АИД_06
.docИтоговая матрица расстояний
|
C_1 |
C_2 |
C_3 |
C_4 |
C_5 |
C_6 |
C_7 |
C_8 |
C_9 |
C_10 |
… |
C_1 |
0,000000 |
0,146320 |
0,124408 |
0,144266 |
0,021190 |
0,175386 |
0,089470 |
0,045619 |
0,238260 |
0,125166 |
… |
C_2 |
0,146320 |
0,000000 |
0,090093 |
0,019240 |
0,158837 |
0,289637 |
0,101440 |
0,111709 |
0,115820 |
0,027935 |
… |
C_3 |
0,124408 |
0,090093 |
0,000000 |
0,072662 |
0,124415 |
0,297613 |
0,036267 |
0,118711 |
0,123581 |
0,096560 |
… |
C_4 |
0,144266 |
0,019240 |
0,072662 |
0,000000 |
0,154539 |
0,296316 |
0,088367 |
0,114493 |
0,104565 |
0,040515 |
… |
C_5 |
0,021190 |
0,158837 |
0,124415 |
0,154539 |
0,000000 |
0,183350 |
0,088236 |
0,065684 |
0,243259 |
0,139899 |
… |
C_6 |
0,175386 |
0,289637 |
0,297613 |
0,296316 |
0,183350 |
0,000000 |
0,264165 |
0,184082 |
0,399806 |
0,262052 |
… |
C_7 |
0,089470 |
0,101440 |
0,036267 |
0,088367 |
0,088236 |
0,264165 |
0,000000 |
0,091214 |
0,158302 |
0,097561 |
… |
C_8 |
0,045619 |
0,111709 |
0,118711 |
0,114493 |
0,065684 |
0,184082 |
0,091214 |
0,000000 |
0,216211 |
0,086863 |
… |
C_9 |
0,238260 |
0,115820 |
0,123581 |
0,104565 |
0,243259 |
0,399806 |
0,158302 |
0,216211 |
0,000000 |
0,143213 |
… |
C_10 |
0,125166 |
0,027935 |
0,096560 |
0,040515 |
0,139899 |
0,262052 |
0,097561 |
0,086863 |
0,143213 |
0,000000 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
… |
… |
… |
… |
Диаграмма Шепарда. Можно построить для текущей конфигурации точек график зависимости воспроизведенных расстояния от исходных расстояний. Такая диаграмма рассеяния называется диаграммой Шепарда. По оси ординат OY показываются воспроизведенные расстояния (сходства), а по оси OX откладываются истинные сходства (расстояния) между объектами (отсюда обычно получается отрицательный наклон). На этом график также строится график ступенчатой функции. Ее линия представляет так называемые величины D-с крышечкой, то есть, результат монотонного преобразования f() исходных данных. Если бы все воспроизведенные результирующие расстояния легли на эту ступенчатую линию, то ранги наблюдаемых расстояний (сходств) был бы в точности воспроизведен полученным решением (пространственной моделью). Отклонения от этой линии показывают на ухудшение качества согласия (т.е. качества подгонки модели).
Диаграмма Шепарда для D – hat
Диаграмма Шепарда для D – star
Те же самые действия можно проделать на основе матрицы расстояний между признаками
|
Длина чашелистика |
Ширина чашелистика |
Длина лепестка |
Ширина лепетска |
Класс |
Длина чашелистика |
0,00000 |
36,15785 |
28,95237 |
57,18304 |
47,53578 |
Ширина чашелистика |
36,15785 |
0,00000 |
25,87489 |
25,86407 |
18,47701 |
Длина лепестка |
28,95237 |
25,87489 |
0,00000 |
33,99441 |
25,00620 |
Ширина лепестка |
57,18304 |
25,86407 |
33,99441 |
0,00000 |
10,23377 |
Класс |
47,53578 |
18,47701 |
25,00620 |
10,23377 |
0,00000 |
Итоговая конфигурация
|
DIM. 1 |
DIM. 2 |
Длина чашелистика |
1,58703 |
0,259263 |
Ширина чашелистика |
-0,17304 |
0,411140 |
Длина лепестка |
0,24731 |
-0,703631 |
Ширина лепестка |
-1,10526 |
0,269150 |
Класс |
-0,55603 |
-0,235922 |
График итоговой конфигурации
D – hat расстояния
|
Длина чашелистика |
Ширина чашелистика |
Длина лепестка |
Ширина лепестка |
Класс |
Длина чашелистика |
0,000000 |
1,766615 |
1,649857 |
2,692310 |
2,199532 |
Ширина чашелистика |
1,766615 |
0,000000 |
1,191389 |
0,942969 |
0,751912 |
Длина лепестка |
1,649857 |
1,191389 |
0,000000 |
1,666056 |
0,929575 |
Ширина лепестка |
2,692310 |
0,942969 |
1,666056 |
0,000000 |
0,746155 |
Класс |
2,199532 |
0,751912 |
0,929575 |
0,746155 |
0,000000 |
D-star расстояния
|
Длина чашелистика |
Ширина чашелистика |
Длина лепестка |
Ширина лепестка |
Класс |
Длина чашелистика |
0,000000 |
1,766615 |
1,649857 |
2,692310 |
2,199532 |
Ширина чашелистика |
1,766615 |
0,000000 |
1,191389 |
0,942969 |
0,751912 |
Длина лепестка |
1,649857 |
1,191389 |
0,000000 |
1,666056 |
0,929575 |
Ширина лепестка |
2,692310 |
0,942969 |
1,666056 |
0,000000 |
0,746155 |
Класс |
2,199532 |
0,751912 |
0,929575 |
0,746155 |
0,000000 |
Итоговая матрица расстояний
|
Длина чашелистика |
Ширина чашелистика |
Длина лепестка |
Ширина лепестка |
Класс |
Длина чашелистика |
0,000000 |
1,766615 |
1,649857 |
2,692310 |
2,199532 |
Ширина чашелистика |
1,766615 |
0,000000 |
1,191389 |
0,942969 |
0,751912 |
Длина лепестка |
1,649857 |
1,191389 |
0,000000 |
1,666056 |
0,929575 |
Ширина лепестка |
2,692310 |
0,942969 |
1,666056 |
0,000000 |
0,746155 |
Класс |
2,199532 |
0,751912 |
0,929575 |
0,746155 |
0,000000 |
Диаграмма Шепарда для D-star
Диаграмма Шепарда для D-hat
Выводы: В процессе выполнения лабораторной работы были получены навыки по многомерному шкалированию больших массивов данных в системе STATISTIKA
Отличие многомерного шкалирования от факторного анализа
Даже несмотря на то, что имеется много сходства в характере исследуемых вопросов, методы МНШ и факторного анализа имеют ряд существенных отличий. Так, факторный анализ требует, чтобы исследуемые данные подчинялись многомерному нормальному распределению, а зависимости были линейными. Методы МНШ не накладывают таких ограничений. Методы МНШ могут быть применимы, пока сохраняет смысл порядок следования рангов сходств. В терминах различий получаемых результатов, факторный анализ стремится извлечь больше факторов (координатных осей или латентных переменных) по сравнению с МНШ; в результате чего МНШ часто приводит к проще интерпретируемым решениям. Однако более существенно то, что методы МНШ можно применять к любым типам расстояний или сходств, тогда как методы ФА требуют, чтобы первоначально была вычислена матрица корреляций. Методы МНШ могут быть основаны на прямом оценивании сходств между стимулами субъектов, тогда как ФА требует, чтобы субъекты были оценены через их стимулы по некоторому списку атрибутов.
Суммируя вышесказанное, можно сказать, что методы МНШ потенциально применимы к более широкому классу исследовательских задач.