Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MC-91(Зуйкова) / IBM_SPSS_Statistics_Core_System_Users_Guide.pdf
Скачиваний:
156
Добавлен:
08.02.2015
Размер:
6.76 Mб
Скачать

66

Глава 3

Виртуальный активный файл

Виртуальный активный файл позволяет работать с большими файлами данных без необходимости иметь такое же (или большее) место на диске для временных файлов. При запуске большинства процедур анализа и построения диаграмм, исходный источник данных каждый раз считывается заново. Процедуры, при выполнении которых изменяются данные, требуют некоторого количества свободного пространства на диске, чтобы отслеживать изменения. Для некоторых процедур всегда требуется пространство на диске для записи по крайней мере одной полной копии файла данных.

Рисунок 3-32

Требования к пространству на диске для временных файлов

Действия, не требующие временного пространства на диске:

Чтение файлов данных IBM® SPSS® Statistics

Слияние двух или более файлов данных SPSS Statistics

Считывание таблиц баз данных с помощью Конструктора чтения баз данных

Слияние файлов данных SPSS Statistics с таблицами баз данных

Запуск процедур, считывающих данные, например, Частоты, Таблицы сопряженности, Исследовать

Действия,приводящие к созданию одного или более столбцов данных во временном пространстве на диске:

Вычисление новых переменных

Перекодировка существующих переменных

Запуск процедур, создающих или изменяющих переменные (например, при сохранении предсказанных значений в Линейной регрессии)

67

Файлы данных

Действия,создающие полную копию файла данных во временном пространстве диска, включают:

Чтение файлов Excel

Запуск процедур требующих сортировки данных (например, Сортировать наблюдения, Расщепить файл, Итоги по строкам/столбцам)

Чтение данных при помощи команд GET TRANSLATE или DATA LIST

Кэширование данных (команда CACHE).

Запуск из SPSS Statistics других приложений, считывающих данные, например, AnswerTree, DecisionTime.

Примечание: Команда GET DATA предоставляет функциональные возможности сопоставимые с DATA LIST, без необходимости создания полной копии файла данных на диске. Команда SPLIT FILE, выполняемая из Редактора синтаксиса, не сортирует данные, а потому не создает копию файла данных. Однако для корректной работы эта команда требует отсортированных данных. Поэтому диалоговое окно, соответствующее этой команде, по умолчанию, сортирует файл перед запуском команды, что создает копию рабочего файла на диске. (Командный синтаксис недоступен в студенческой версии.)

Действия,при которых по умолчанию создается копия файла данных целиком:

Чтение баз данных при помощи Конструктора чтения баз данных.

Чтение текстовых файлов при помощи Конструктора импорта текстовых файлов.

У Конструктора импорта текстовых файлов есть параметр, позволяющий автоматически кэшировать данные. По умолчанию этот параметр включен. Его можно выключить путем удаления флажка из поля Кэшировать данные локально. Для Конструктора чтения баз данных можно вставить сгенерированный синтаксис и удалить команду CACHE.

Кэширование данных

Хотя виртуальный активный файл может значительно уменьшить требуемое для анализа количество свободного места на диске, отсутствие временной копии “активного” файла означает, что исходный источник данных должен заново считываться для каждой процедуры. В случае больших файлов данных, загружаемых из внешних источников, создание временной копии данных может существенно повысить производительность. Например, в случае чтения данных из базы данных, запрос SQL должен считывать информацию из базы данных каждый раз при выполнении любой команды, требующей чтения данных. Так как фактически все процедуры статического анализа и построения графиков требуют считывания данных, то запрос SQL, заново исполняется для любой запускаемой процедуры, что может существенно увеличить время обработки данных, особенно при запуске большого количества процедур.

Если на диске компьютера, на котором выполняется анализ, достаточно свободного пространства, можно избежать повторения запросов SQL и существенно уменьшить время обработки, создав кэш активного файла данных, то есть временную копию всех данных. Кэш представляет собой временную копию всех данных.

68

Глава 3

Примечание: По умолчанию, Конструктор чтения баз данных автоматически создает кэш данных, однако если Вы используете команду GET FILE в командном синтаксисе для чтения базы данных, кэш не создается автоматически. (Командный синтаксис недоступен в студенческой версии.)

Как создать кэш данных

E Выберите в меню:

Файл > Кэшировать данные...

EЩелкните по кнопке OK или Кэшировать сейчас.

OK создает кэш данных при следующем считывании данных (например, при следующем запуске статистической процедуры), что удобно в большинстве случаев. Вариант

Кэшировать сейчас создает кэш данных сразу после нажатия кнопки Кэшировать сейчас, в чем, как правило, нет необходимости. Кэшировать сейчас полезен, прежде всего, по двум причинам:

Источник данных “заперт” (locked) и не может быть никем изменен до тех пор, пока Вы не закончите Вашу сессию, откроете другие данные или кэшируете данные.

Для данных большого объема, просмотр содержимого закладки Данные в Редакторе Данных будет намного быстрее, если кэшировать данные.

Как кэшировать данные автоматически

Можно использовать команду SET для автоматического создания кэша данных после внесения определенного количества изменений в активном файле данных. По умолчанию, активный файл данных автоматически кэшируется после внесения 20 изменений.

E Выберите в меню:

Файл > Создать > Синтаксис

EВ окне синтаксиса введите SET CACHE n, (где n представляет количество изменений в активном файле данных перед тем, как файл данных будет кэширован).

E Выберите в меню окна синтаксиса:

Запуск > Все

Примечание: Параметры кэширования не сохраняются. Каждый раз, когда вы начинаете новый сеанс работы, параметр возвращается к значению 20.