
- •Руководство пользователя по базовой системе Statistics 20
- •Содержание
- •1. Обзор
- •Новые возможности в версии 20
- •Windows
- •Отличие окна назначения от активного окна
- •Строка состояния
- •Диалоговые окна
- •Имена и метки переменных в списках диалоговых окон
- •Изменение размеров диалоговых окон
- •Управляющие элементы диалоговых окон
- •Выбор переменных
- •Получение информации о переменных в диалоговых окнах
- •Основные шаги в анализе данных
- •Репетитор по статистике
- •Получение дополнительной информации
- •2. Получение справки
- •Получение Справки по терминам в выводе
- •3. Файлы данных
- •Открытие файлов данных
- •Как открывать файлы данных
- •Типы файлов данных
- •Параметры открытия файлов
- •Чтение файлов Excel 95 и более поздних версий
- •Чтение файлов Excel старых версий и других электронных таблиц
- •Чтение файлов dBASE
- •Чтение файлов Stata
- •Чтение файлов баз данных
- •Конструктор импорта текстовых файлов SPSS
- •Чтение IBM SPSS Data Collection данных
- •Информация о файле
- •Сохранение файлов данных
- •Как сохранять файлы данных с изменениями
- •Сохранение файлов данных во внешних форматах
- •Сохранение файлов данных в формате Excel
- •Сохранение файлов данных в формате SAS
- •Сохранение файлов данных в формате Stata
- •Сохранение наборов переменных
- •Экспорт в базу данных
- •Экспорт в IBM SPSS Data Collection
- •Защита исходных данных
- •Виртуальный активный файл
- •Кэширование данных
- •4. Режим распределенного анализа
- •Подключение к серверу
- •Добавление и редактирование установок подключения к серверу
- •Поиск доступных серверов
- •Как сохранить файл данных в распределенном режиме анализа
- •Доступ к файлам в режиме локального и распределенного анализа
- •Процедуры анализа, доступные в распределенном режиме анализа данных
- •Сравнение абсолютных и относительных путей
- •5. Редактор данных
- •Закладка Данные
- •Закладка Переменные
- •Как просмотреть или изменить свойства переменных
- •Имена переменных
- •Шкала измерения переменной
- •Тип переменной
- •Метки переменных
- •Метки значений
- •Вставка разрывов строк в метках
- •Пропущенные значения
- •Роли
- •Ширина столбца
- •Выравнивание переменной
- •Применение свойств переменной к нескольким другим переменным
- •Настраиваемые свойства переменной
- •Настройка закладки Переменные
- •Проверка правописания
- •Ввод данных
- •Как вводить числовые данные
- •Как вводить нечисловые данные
- •Как использовать заданные метки значений для ввода данных
- •Ограничения на значения данных в Редакторе данных
- •Редактирование данных
- •Замена или изменение значений данных
- •Удаление, копирование и вставка значений
- •Вставка новых наблюдений
- •Вставка новых переменных
- •Как изменить тип данных
- •Поиск наблюдений, переменных или импутированных значений
- •Поиск и замена значений данных и свойств
- •Состояние отбора наблюдений в Редакторе данных
- •Настройки Редактора данных
- •Печать из Редактора данных
- •Печать содержимого Редактора данных
- •Основные операции с несколькими наборами данных
- •Работа с несколькими наборами данных в командном синтаксисе
- •Копирование и вставка информации из одних наборов данных в другие
- •Переименование наборов данных
- •Скрытие нескольких наборов данных
- •7. Подготовка данных
- •Свойства переменных
- •Задание свойств переменных
- •Как задать свойства переменных
- •Задание меток значений и других свойств переменных
- •Задание шкалы измерения
- •Настраиваемые атрибуты переменной
- •Копирование свойств переменных
- •Присвоение типа измерений переменным с неизвестным типом измерений
- •Наборы множественных ответов
- •Задание наборов множественных ответов
- •Копирование свойств данных
- •Как копировать свойства данных
- •Выбор исходных переменных и переменных назначения
- •Выбор копируемых свойств переменных
- •Копирование свойств наборов (файлов) данных.
- •Результаты
- •Поиск дублирующихся наблюдений
- •Визуальная категоризация
- •Чтобы категоризовать переменные
- •Категоризация переменных
- •Автоматическое формирование категорий интервалов
- •Копирование категорий интервалов
- •Пользовательские пропущенные значения в процедуре Визуальная категоризация
- •8. Преобразование данных
- •Вычисление переменных
- •Вычислить переменную: Отбор наблюдений
- •Вычислить переменную: Тип и метка
- •Функции
- •Пропущенные значения в аргументах функций
- •Генераторы случайных чисел
- •Подсчитать встречаемость значений в наблюдениях
- •Подсчет встречаемости значений в наблюдениях: Подсчитываемые значения
- •Подсчет встречаемости значений: Отбор наблюдений
- •Сдвинуть значения
- •Перекодирование значений
- •Перекодировать в те же переменные
- •Перекодирование в те же переменные: Старые и новые значения
- •Перекодировать в другие переменные
- •Перекодирование в другие переменные: Старые и новые значения
- •Автоматическая перекодировка
- •Ранжировать наблюдения
- •Ранжирование наблюдений: Типы
- •Ранжирование наблюдений: Совпадающие наблюдения
- •Конструктор дат и времени
- •Даты и время в IBM SPSS Statistics
- •Формирование переменной даты/времени из текстовой переменной
- •Создание переменной даты/времени из набора переменных
- •Выполнить сложение и вычитание для переменных дат/времени
- •Выделение части переменной даты/времени
- •Преобразования временных рядов
- •Задать даты
- •Создать временной ряд
- •Заменить пропущенные значения
- •9. Работа с файлами
- •Сортировка наблюдений
- •Сортировать переменные
- •Транспонировать
- •Слияние данных
- •Добавление наблюдений
- •Добавление наблюдений: Переименование переменных
- •Добавление наблюдений: Информация из словаря данных
- •Слияние данных из более чем двух источников
- •Добавление переменных
- •Добавление переменных: Переименование переменных
- •Слияние данных из более чем двух источников
- •Агрегирование данных
- •Агрегирование данных: Агрегирующая функция
- •Агрегирование данных: Имя и метка переменной
- •Расщепить файл
- •Отобрать наблюдения
- •Диалоговое окно Отобрать наблюдения: Если
- •Диалоговое окно Отобрать наблюдения: Случайная подвыборка
- •Диалоговое окно Отобрать наблюдения: Размах
- •Взвесить наблюдения
- •Реструктуризация данных
- •Как реструктурировать данные
- •Конструктор реструктуризации данных: Выберите тип
- •Конструктор реструктуризации данных (переменные в наблюдения): Количество групп переменных
- •Конструктор реструктуризации данных (переменные в наблюдения): Выбрать переменные
- •Конструктор реструктуризации данных (переменные в наблюдения): Создать индексные переменные
- •Конструктор реструктуризации данных (переменные в наблюдения): Создать одну индексную переменную
- •Конструктор реструктуризации данных (переменные в наблюдения): Создание нескольких индексных переменных
- •Конструктор реструктуризации данных (переменные в наблюдения): Параметры
- •Конструктор реструктуризации данных (наблюдения в переменные): Выбрать переменные
- •Конструктор реструктуризации данных (наблюдения в переменные): Сортировка данных
- •Конструктор реструктуризации данных (наблюдения в переменные): Параметры
- •Конструктор реструктуризации данных: Завершение работы
- •10. Работа с выводом результатов
- •Система просмотра
- •Показ и скрытие результатов
- •Изменение исходного выравнивания
- •Изменение выравнивания элементов вывода
- •Схема вывода
- •Добавление элементов во Viewer
- •Поиск и замена информации во Viewer
- •Копирование вывода в другие приложения
- •Экспортировать вывод
- •Параметры HTML
- •Параметры Word/RTF
- •Параметры Excel
- •Параметры экспорта в PowerPoint
- •Параметры PDF
- •Параметры текста
- •Параметры только для графики
- •Параметры графических форматов
- •Печать документов Viewer
- •Печать вывода и диаграмм
- •Предварительный просмотр
- •Атрибуты страницы: Параметры
- •Сохранение результатов
- •Сохранение документа Viewer
- •11. Мобильные таблицы
- •Управление мобильной таблицей
- •Активация мобильной таблицы
- •Трансформация таблицы
- •Изменение порядка отображения элементов внутри размерности
- •Перемещение строк и столбцов в пределах одной размерности
- •Транспонирование строк и столбцов
- •Группирование строк или столбцов
- •Разгруппирование строк или столбцов
- •Поворот меток строк или столбцов
- •Отмена изменений
- •Работа со слоями
- •Создание и показ слоев
- •Перейти к категории слоя
- •Отображение и скрытие объектов
- •Скрытые строк и столбцов в таблице
- •Отображение скрытых строк и столбцов в таблице
- •Скрытие и отображение меток измерений
- •Отображение и скрытие заголовков таблицы
- •Шаблоны таблиц
- •Применить шаблон таблиц
- •Как отредактировать или создать шаблон таблиц
- •Свойства таблицы
- •Как изменить свойства мобильной таблицы
- •Свойства таблицы: общие
- •Свойства таблицы: сноски
- •Свойства таблицы: формат ячеек
- •Свойства таблицы: границы
- •Свойства таблицы: печать
- •Свойства ячеек
- •Шрифт и фон
- •Формат значения
- •Выравнивание и поля
- •Сноски и заголовки
- •Добавление сносок и заголовков
- •Чтобы скрыть или отобразить заголовок
- •Маркер сноски
- •Перенумерация сносок
- •Редактирование сносок в устаревшей таблице
- •Ширина ячеек данных
- •Изменение ширины столбца
- •Отображение скрытых границ в мобильной таблице
- •Печать мобильных таблиц
- •Управление разбивкой таблицы для широких и длинных таблиц
- •Создание диаграммы из мобильной таблицы
- •Устаревшие таблицы
- •12. Модели
- •Взаимодействие с моделью
- •Работа со Средством просмотра моделей
- •Печать моделей
- •Экспорт модели
- •Сохранение полей, использованных в модели в новом наборе данных
- •Сохранение предикторов в новом наборе данных на основе их важности
- •Модели для ансамблей
- •Сводка для модели
- •Важность предикторов
- •Частота предикторов
- •Точность моделей компонентов
- •Подробности о моделях компонентов
- •Автоматическая подготовка данных
- •Средство просмотра расщепленных моделей
- •13. Работа с командным синтаксисом
- •Правила синтаксиса
- •Вставка команд из диалоговых окон
- •Вставка команд из диалоговых окон
- •Копирование синтаксиса из журнала во Viewer
- •Как скопировать синтаксис из журнала в выводе
- •Работа с Редактором синтаксиса
- •Окно Редактора синтаксиса.
- •Терминология
- •Автозавершение
- •Цветовое кодирование
- •Контрольные точки
- •Закладки
- •Закомментирование или раскомментирование текста
- •Форматирование синтаксиса
- •Выполнение командного синтаксиса
- •Файлы синтаксиса Юникод
- •Несколько команд Execute
- •14. Обзор графических возможностей
- •Создание и редактирование диаграммы
- •Построение диаграмм
- •Редактирование диаграмм
- •Параметры построения диаграмм
- •Добавление и изменение заголовков и сносок
- •Задание общих параметров
- •15. Скоринг данных с использованием прогнозных моделей
- •Конструктор скоринга
- •Сопоставление полей модели и полей набора данных
- •Выбор функций скоринга
- •Скоринг активного набора данных
- •Объединение XML-файлов модели и преобразований
- •16. Сервис
- •Информация о переменной
- •Комментарии к файлу данных
- •Наборы переменных
- •Задание наборов переменных
- •Использование наборов переменных для отображения и скрытия переменных
- •Изменение порядка переменных в списках выбранных переменных
- •Работа с пакетами расширений
- •Создание пакетов расширений
- •Установка пакетов расширений
- •Обзор установленных пакетов расширений
- •17. Параметры
- •Общие параметры
- •Параметры Viewer
- •Параметры данных
- •Изменение стандартного представления переменных
- •Параметры валют
- •Как создать пользовательский формат валюты
- •Параметры в закладке Метки в выводе
- •Параметры диаграмм
- •Цвета элементов данных
- •Линии элементов данных
- •Маркеры элементов данных
- •Заливка элементов данных
- •Параметры мобильных таблиц
- •Параметры местоположения файлов
- •Параметры скриптов
- •Параметры Редактора синтаксиса
- •Параметры множественной импутации
- •18. Настройка меню и панелей инструментов
- •Редактор меню
- •Настройка панелей инструментов
- •Отображение панелей инструментов
- •Как настраивать панели инструментов
- •Свойства панели инструментов
- •Изменить панель инструментов
- •Создание нового инструмента
- •19. Создание настраиваемых диалоговых окон и управление ими
- •Структура Конструктора настраиваемого диалогового окна
- •Создание настраиваемого диалогового окна
- •Свойства диалогового окна
- •Указание местоположения меню для настраиваемого диалогового окна
- •Компоновка управляющих элементов на макете
- •Создание шаблона синтаксиса
- •Предварительный просмотр настраиваемого диалогового окна
- •Управление настраиваемыми диалоговыми окнами
- •Типы управляющих элементов
- •Исходный список
- •Целевой список
- •Фильтрация списков переменных
- •Флажок
- •Поле со списком и элементы управления поля со списком
- •Поле ввода текста
- •Поле ввода чисел
- •Статическое текстовое поле
- •Группа элементов
- •Группа переключателей
- •Группа флажков
- •Обозреватель файлов
- •Кнопка вложенного диалога
- •Настраиваемые диалоговые окна для команд расширения
- •Создание локализованных версий настраиваемых диалоговых окон
- •20. Производственные задания
- •Файлы синтаксиса
- •Выходные результаты
- •Параметры HTML
- •Параметры PowerPoint
- •Параметры PDF
- •Параметры текста
- •Производственные задания с командами OUTPUT
- •Значения в рабочем цикле
- •Параметры запуска
- •Подключение к серверу
- •Добавление и редактирование установок подключения к серверу
- •Запросы к пользователям
- •Состояние фонового задания
- •Запуск производственных заданий из командной строки
- •Преобразование файлов производственного режима
- •Типы объектов вывода
- •Идентификаторы команд и подтипы таблиц
- •Метки
- •Параметры OMS
- •Журнал
- •Не выводить во Viewer
- •Направление вывода в файлы данных IBM SPSS Statistics
- •Пример: Одна двумерная таблица
- •Пример: Таблицы со слоями
- •Управление элементами столбцов для управления переменными в файле данных
- •Имена переменных в генерируемых с помощью OMS файлах данных
- •Структура таблицы OXML
- •OMS-идентификаторы
- •Копирование идентификаторов OMS из панели схемы Viewer
- •22. Скрипты
- •Автоскрипты
- •Создание автоскриптов
- •Связывание существующих скриптов с объектами Viewer
- •Выполнение скриптов Python и программ Python
- •Редактор скриптов для языка программирования Python
- •Написание скриптов в Basic
- •Объект scriptContext
- •Стартовый скрипт
- •Указатель

177
Преобразование данных
Задание выходной переменной выделения компонента из переменной даты/времени
Рисунок 8-29
Выделение части переменной даты/времени, шаг 2
EВведите имя в поле Выходная переменная. Оно не может быть именем существующей переменной.
EЕсли Вы выделяете компонент даты или времени из переменной даты/времени, то в списке Формат выходной переменной необходимо выбрать формат. В тех случаях, когда выходной формат не требуется, список Формат выходной переменной будет недоступен.
Дополнительно Вы можете:
Задать описательную метку для новой переменной.
Преобразования временных рядов
Есть несколько способов преобразования данных, которые полезны при анализе временных рядов:
Генерация переменных, содержащих даты, для задания периодичности и разделения периодов обучения, контроля и предсказания.
Создание новых переменных как функций существующих переменных временных рядов.
Замена системных или пользовательских пропущенных значений оценками (имеются несколько методов).
Временной ряд представляет собой измерения переменной (или совокупности переменных) в течение некоторого периода времени. Преобразования временных рядов предполагают такую структуру файла данных, в которой каждая строка (наблюдение)

178
Глава 8
представляет набор характеристик в определенный момент времени, а интервалы времени между наблюдениями равны
Задать даты
Процедура Задать даты генерирует переменные, которые могут быть использованы для выделения периодических компонент временного ряда, а также в качестве меток вывода в анализе временных рядов.
Рисунок 8-30
Диалоговое окно Задать даты
Наблюдения - это. Здесь задаются единицы времени, которые будут использоваться для создания дат.
При выборе пункта Без даты все ранее введенные переменные, содержащие даты, удаляются. Уничтожаются переменные со следующими именами: year_, quarter_, month_, week_, day_, hour_, minute_, second_ и date_.
Выбор пункта Настраиваемая означает, что существуют специальные переменные, содержащие даты, созданные с помощью командного синтаксиса (например, четырехдневная рабочая неделя). Этот пункт просто отражает текущее состояние активного набора данных. Выбор его из списка не даст никакого результата.
Первое наблюдение. Здесь задается значение начальной даты, которое будет присвоено первому наблюдению. Последующим наблюдениям будут присвоены последовательные значения, основанные на заданном интервале времени.
Периодичность более высокого уровня. Указывает на циклы, например, число месяцев в году или число дней в неделе. Выведенное значение указывает максимальное число, которое можно ввести. Для часов, минут и секунд максимум — это отображаемое значение минус один.
Для каждой компоненты, которая используется для задания дат, создается новая числовая переменная. Имена новых переменных оканчиваются знаком подчеркивания. На основе всех компонент создается описательная текстовая переменная date_. Например, если Вы

179
Преобразование данных
выберете Недели, дни, часы, то создается четыре новых переменных: week_, day_, hour_ и date_.
Если переменные дат уже существуют, то при задании новых дат, новые переменные дат заменят существующие переменные дат, имеющие такие же имена.
Как задать даты для Данных временного ряда
E Выберите в меню:
Данные > Задать даты...
E Выберите временной интервал из списка Наблюдения - это.
EВведите значения даты в поля Первое наблюдение. Введенные значения задают дату, присваиваемую первому наблюдению.
Переменные, созданные процедурой Задать даты, и переменные, имеющие тип даты
Переменные, созданные процедурой Задать даты, не следует путать с переменными, имеющими формат типа Дата, который определяется при задании свойств переменных. Переменные, созданные процедурой Задать даты, служат для определения периодичностей временного ряда. Переменные, имеющие формат Дата, представляют даты и/или времена, отображаемые в различных форматах. Значения переменных, созданных процедурой Задать даты, - это целые положительные числа, каждое из которых представляет количество дней, недель, часов или других единиц времени, прошедших с заданного пользователем начального момента времени. Значения же большей части переменных в формате Дата представляют собой количества секунд, прошедших с 14 октября 1582 года.
Создать временной ряд
Диалоговое окно Создать временной ряд используется для создания новых переменных, которые являются функциями существующих переменных, образующих временной ряд. Эти новые переменные полезны во многих процедурах анализа временных рядов.
По умолчанию имя новой переменной создается следующим образом: берутся шесть символов имени исходной переменной, добавляется подчеркивание (‘_’), затем добавляется порядковый номер. Например, для переменной price новая переменная будет price_1. Новые переменные сохраняют все метки значений исходных переменных.
Функции, предназначенные для создания временных рядов, включают разности, скользящие средние, скользящие медианы, функции задержки (лаги) и опережения.

180
Глава 8
Рисунок 8-31
Диалоговое окно Создать временной ряд
Как создать новую переменную, представляющую временной ряд
E Выберите в меню:
Преобразовать > Создать временной ряд...
EВыберите функцию, которую Вы хотите использовать для преобразования существующих переменных в новые.
EВыберите переменные, из которых Вы хотите создать новые временные ряды. Допускается использование только числовых переменных.
Дополнительно Вы можете:
Ввести имена новых переменных, если Вам не подходят имена, присваиваемые автоматически.
Изменить функцию для выбранной переменной.
Функции преобразования временных рядов
Разность. Несезонная разность между последовательными значениями ряда. Порядок здесь - это число предшествующих значений, используемых для вычисления разности. Поскольку для каждого следующего порядка одно наблюдение теряется, в начале ряда появляются системные пропущенные значения. Например, если порядок равен 2, то для новой переменной первые 2 наблюдения будут системными пропущенными значениями.
Сезонная разность. Разность между значениями ряда, отстоящими друг от друга на постоянный интервал. Величина этого интервала основана на текущей заданной периодичности. Чтобы вычислить сезонные разности, Вы должны сначала определить

181
Преобразование данных
переменные, содержащие даты и включающие периодические компоненты (например, месяцы). Порядок здесь — это число сезонных периодов, используемых для вычисления разностей. Число наблюдений с системным пропущенным значением в начале ряда равно периоду, умноженному на порядок дифференцирования. Например, если текущий период равен 12, а порядок равен 2, то для новой переменной первые 24 наблюдения будут системными пропущенными значениями.
Центрированное скользящее среднее. Среднее на промежутке значений ряда,
окружающем и включающем текущее значение. Протяженность - это число значений ряда, используемых для вычисления среднего. Если это число четное, то скользящее среднее вычисляется путем усреднения каждой пары нецентрированных средних. Количество наблюдений с системным пропущенным значением в начале и в конце получаемого ряда для протяженности n равно n/2 для четного n и (n–1)/2 - для нечетного. Например, если протяженность равна 5, число наблюдений с системным пропущенным значением в начале и в конце ряда равно 2.
Опережающее скользящее среднее. Интервал усреднения предшествует текущему значению. Протяженность — это число значений ряда, используемых для вычисления среднего. Число наблюдений с системным пропущенным значением в начале получаемого ряда равно протяженности.
Скользящая медиана. Медиана на интервале значений ряда, окружающих и включающих текущее значение. Протяженность — это число значений ряда, используемых для вычисления медианы. Если данное число четное, то медиана вычисляется путем усреднения каждой пары не центрированных медиан. Количество наблюдений с системным пропущенным значением в начале и в конце получаемого ряда для протяженности n равно n/2 для четного n и (n–1)/2 - для нечетного. Например, если протяженность равна 5, число наблюдений с системным пропущенным значением в начале и в конце ряда равно 2.
Кумулятивная сумма.Кумулятивная сумма значений ряда вплоть до текущего значения включительно.
Лаг.Значение предшествующего наблюдения, отстоящего на заданное число отсчетов от текущего момента. Порядок — число наблюдений между текущим наблюдением и наблюдением, из которого получается значение. Число наблюдений с системным пропущенным значением в начале получаемого ряда равно значению порядка.
Опережение. Значение последующего наблюдения, в соответствии с заданным порядком опережения. Порядок — число наблюдений между текущим наблюдением и наблюдением, из которого получается значение. Число наблюдений с системным пропущенным значением в конце получаемого ряда равно значению порядка.
Сглаживание. Новые значения ряда, основанные на комбинированном сглаживании данных. Процесс сглаживания начинается со скользящей медианы ширины 4, которая центрирована скользящей медианой ширины 2. Эти значения затем повторно сглаживаются с применением скользящей медианы ширины 5, скользящей медианы ширины 3, и ханнинга (скользящих взвешенных средних). Остатки вычисляются путем вычитания сглаженного рядаизисходного. Весьэтотпроцессзатемповторяетсянавычисленныхостатках. Наконец, сглаженные остатки вычисляются путем вычитания сглаженных значений, полученных в первый раз в начале процесса. Иногда этот процесс называют сглаживанием T4253H.