- •Руденко л.И. Методические рекомендации и задания по работе в системе statistica
- •7.04030201 «Информатика»
- •I. Модульная система statistica
- •1. Ввод данных в системе statistica
- •Описательная статистика и таблицы
- •3. Графики системы statistica
- •Примеры выполнения статистического анализа
- •Предварительная обработка и t-тесты
- •2. Множественная регрессия
- •4. Кластерный анализ
- •5. Канонический анализ
- •6. Факторный анализ
- •7. Дискриминантный анализ
- •8. Временные ряды
- •7.040302001 «Информатика»
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ, МОЛОДЕЖИ
И СПОРТА УКРАИНЫ
ТАВРИЧЕСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ
имени В.И.Вернадского
Кафедра информатики
Руденко л.И. Методические рекомендации и задания по работе в системе statistica
для студентов 5 курса специальности
7.04030201 «Информатика»
Симферополь, 2011
Рекомендовано к печати заседанием кафедры информатики
от «19» 04 2011 г., протокол № 12.
Рекомендовано к печати Учебно-методическим советом ТНУ
от «26» 04 2011 г., протокол № 4.
Методические рекомендации предназначены для обеспечения компьютерного практикума по дисциплине выбора «Многомерный анализ данных» с использованием системы статистического анализа STATISTICA.
Раздел 1 включает основные сведения о системе и ознакомление с модулями описательной статистики (Basic Statistics) и графических средств (Graphics). В разделе 2 представлены сценарии проведения анализа.
Содержание
I. Модульная система STATISTICA |
4 |
1. Ввод данных в системе STATISTICA |
6 |
2. Basic Statistics/Tables - Описательная статистика и таблицы |
5 |
3. Графики системы STATISTICA |
11 |
II.Примеры выполнения статистического анализа |
|
1.Предварительная обработка. Т-тесты |
14 |
2. Множественная регрессия |
18 |
3. Дисперсионный анализ (ANOVA/MANOVA) |
22 |
4. Кластерный анализ |
25 |
5. Канонический анализ |
29 |
6. Факторный анализ |
34 |
7. Дискриминантный анализ |
38 |
8. Временные ряды |
47 |
Приложение |
54 |
I. Модульная система statistica
Система STATISTICA, разработанная фирмой StatSoft.Inc., реализует графически-ориентированный подход к анализу данных.
В пакете STATISTICA реализованы многочисленные статистические методы анализа, представленные в виде модулей. Выбрать модуль можно с помощью переключателя модулей – пункта Statistics главного меню STATISTICA. При нажатии переключателя появляется список модулей. Стандартный список включает следующие модули:
Basic Statistics /Tables - Основные статистики и таблицы;
Multiply Regression - Множественная регрессия;
ANOVA - Дисперсионный анализ (ANOVA);
Nonparametrics - Непараметрическая статистика;
Distribution Fitting - Подгонка распределения;
Advanced Linear/Nonlinear Models
- Расширенные линейные и нелинейные модели, в том числе:
General Linear Models - Общие линейные модели;
Generalized Linear models - Обобщенные линейные модели;
General Linear regressions - Общие регрессионные модели;
General Partial Least - Общие модели
Square Models наименьших квадратов;
Variance Components - Компоненты дисперсии;
Survival Analysis - Анализ выживаемости;
Nonlinear Estimations - Нелинейное оценивание;
Fixed Nonlinear regressions - Выбор нелинейных преобразований;
Log-Linear Analysis - Логлинейный анализ частотных таблиц;
of Frequency Tables
Time Series/Forecasting - Временные ряды/Прогнозирование;
Structural Equation Modeling - Структурные уравнения;
Multivariate Exploratory Techniques
- Методы многомерного анализа, в том числе:
Cluster Analysis - Кластерный анализ;
Factor Analysis - Факторный анализ;
Principal Components& - Метод главных компонент и
Classification Analysis классификационный анализ;
Canonical Analysis - Канонический анализ;
Reliability /Item Analysis - Анализ надежности;
Classification Trees - Деревья классификации;
Correspondence Analysis - Анализ соответствий;
Multidimensional Scaling - Многомерное шкалирование;
Discriminant Analysis - Дискриминантный анализ;
General Discriminant - Общие модели
Analysis Model дискриминантного анализа;
Industrial Statistics& Six Sigma - Промышленная статистика;
Power Analysis - Анализ мощности;
Data Mining - Извлечение закономерностей;
Statistics of Block Data - Статистика блоков данных;
STATISTICA Visual Basic - Язык программирования;
Probability Calculator - Вероятностный калькулятор.
Данные для работы в среде STATISTICA могут быть импортированы из электронных таблиц и баз данных либо введены с клавиатуры. Удобно при изучении использовать большие массивы данных, которые хранятся в папке Examples системы STATISTICA. В разделе I рассматривается пример создания файла данных и его предварительной обработки. В разделе II приведены примеры анализа данных из файлов папки Examples/Datasets.