- •26.10.2007 Г., протокол № 2
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Вычисление коэффициентов при факторе f2
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •8.3. Правила работы с матрицей
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •8.5. Дельта-метод Аганбегяна
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •8.6.5. Многопродуктовая транспортная задача
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Глава 10 динамические ряды
- •10.1. Показатели динамического ряда
- •10.2. Сглаживание динамических рядов
- •10.3. Выравнивание по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
Проведем кластерный анализ для областей Беларуси по показателям внесения удобрений и урожайности ряда сельскохозяйственных культур.
Допускается выполнение работы по двум вариантам (на выбор пользователя):
а) Набор исходных данных в MS Excel. Открыть MS Excel. Набрать следующие исходные данные в ячейках диапазона A1:F6 Листа 1. Сохранить введенные данные и закрыть файл.
16,6 |
212 |
27,3 |
175 |
38,9 |
12,4 |
13,9 |
193 |
15,7 |
156 |
40,1 |
11,8 |
16,3 |
226 |
25,3 |
186 |
28,6 |
13,9 |
13,5 |
240 |
29,4 |
178 |
43,5 |
15,4 |
11,6 |
205 |
25,9 |
193 |
33,6 |
10,3 |
15,5 |
231 |
27,5 |
185 |
32,5 |
14,4 |
Запустить программу Statistica
(через Пуск – Все программы или
ярлык на рабочем столе), открыть в ней
набранный в Excel файл (File
– Open или через
пиктограмму
на панели инструментов, в появившемся
окне укажите путь к файлу с вышеуказанной
таблицей, не забудьте выбрать в окне
«Тип файлов» Excel
files (.xls)).
Далее в появившемся диалоговом окне
выбираем Import selected
sheet to
a Spreadsheet,
затем в следующем окне выбираем Лист 1
– ОК, в следующем окне ничего не
изменяем и сразу жмем ОК.
б) Подобную таблицу можно сразу создать путем набора в программе Statistica, пример а показывает на возможность импорта данных из MS Excel.
Переименовать в Statistica сроки последовательно в Брестская, Витебская, Гомельская, Гродненская, Могилевская, Минская в для чего нужно дважды кликнуть на них левой клавишей мышки, а столбцы (Var 1, Var 2 и т.д.) в поле Name после двойного щелчка левой клавиши мыши соответственно набираем: органич. удобр., т/га; минерал. удобр., кг/га; зерновые, ц/га; картофель, ц/га; кормовые травы, ц/га; зернобобовые, ц/га.
Проводим кластерный анализ, для чего выполняем следующие действия: Statistics – Multivariate Exploratory Techniques – Cluster analysis – Joining tree clustering (оно выбрано по умолчанию) – OK. В следующем диалоговом окне выбираем закладку Advanced – жмем на кнопку Variables, там отмечаем все переменные (выделяем левой клавишей мыши при нажатой клавише Shift или просто кликаем на кнопке Select All) – OK. В полях Input file ставим Raw data, Kluster – Cases (rows), Amalgamation (linkage) rule – Single Linkage, Distance Measure – Euclidean distances. Если ваши параметры соответствуют представленным на рис. 7, то жмем OK.
Рис. 7.
Далее в появившемся окне нажимаем Summary. Появится дендрограмма с разбитием данных на кластеры. После этого нажимаем на кнопку Joining result:имя файла (слева в самом низу программного окна). Там, на закладке Advanced выбираем по очереди показатели: Distance matrix, Descriptive statistics и Matrix. Так же можно выбрать вертикальное расположение древа (показатель Vertical icicle plot). Полученный график и таблицы используются для интерпретации данных анализа.
