
Лабораторная работа № 2 работа с электронными таблицами ввода исходных данных spreadsheet в системе statistica
Цель работы: Познакомиться с содержанием и порядком заполнения и оформления таблиц исходных данных SPREADSHEET.
Задачи работы:
изучить - назначение столбцов и строк электронной таблицы SPREADSHEET,
- порядок ввода данных в таблицу SPREADSHEET,
- освоить действия по преобразованию и оформлению таблиц.
1. Общие замечания
Данные в системе STATISTICA организованы в виде электронных таблиц. Работа с таблицами STATISTICA аналогична работе с электронными таблицами (типа MS Excel). Предлагаемая в STATISTICA табличная структура данных позволяет естественно отобразить большинство реальных данных, что очень удобно для пользователя. Таблица с исходными данными SPREADSHEET является одним из типов документов. Каждый документ (таблица) вводится в своем собственном окне в рабочей области системы.
Электронная таблица состоит из строк и столбцов. Столбцы таблицы SPREADSHEET называются Variables - Переменные, а строки Cases - Случаями (Наблюдениями). Таким образом в строках содержатся значения, которые принимают переменные, указанные в столбцах. Значения переменных могут быть числовыми и/или текстовыми.
С помощью строки главного меню, выпадающих меню из панели инструментов и контекстных меню над таблицами SPREADSHEET можно выполнять различные операции, в том числе:
- операции, которые изменяют структуру электронной таблицы (добавление, удаление, копирование, перемещение переменных и случаев);
- операции по заданию спецификаций (имен, форматов и др.) для переменных и случаев;
- операции над выделенным блоком значений;
- оперции по копированию, перемещению и автозаполнению блока и т.п.
Переменная (Variables) представляет собой наблюдаемую величину и имеет своё имя, формат, и другие атрибуты, которые называют спецификацией и задаются пользователем. В качестве случаев (Cases) могут быть даты наблюдений, имена и другие параметры.
Спецификация (описание) переменных включает в себя:
- формат отображения данных (количество десятичных разрядов в представлении чисел, формат представления дат, времени, соответствие между численными и текстовыми значениями и др.);
- код, приписываемый пропущенным данным;
- длинные имена переменных и комментарии к ним;
- метки для текстовых значений переменных, содержащих текстовые значения более восьми символов;
- формулы, используемые для определения, перекодировки или преобразования значений переменных.
Предусмотрена возможность задания информации обо всей таблице данных в целом, включая заголовок таблицы, комментарий к таблице, цвет, шрифт и размер отдельных структурных элементов, список фойлов, связанных с данной таблицей и т.п.
2. Пример ввода исходных данных в таблицы Spreadsheet
Создание файла с исходными данными рассмотрим на следующем примере. Пусть в результате социологического исследования проведен опрос группы населения, в результате которого контролировали следующие параметры: «Пол» (Муж – мужской, Жен – женский), «Возраст», «Образование» (Нет, Среднее, Высшее) и «Средний доход». Результаты опроса представлены в таблице 1.
Таблица 1 Исходные данные социологического опроса.
Имена опрошенных |
Пол |
Возраст |
Образование |
Доход (в условных единицах) |
Иванов И. |
муж |
30 |
среднее |
535 |
Петрова П. |
жен |
41 |
высшее |
340 |
Сидоров С. |
муж |
52 |
нет |
250 |
Береговой Б. |
муж |
25 |
высшее |
400 |
Вольская В. |
жен |
32 |
среднее |
200 |
Гвоздева Г. |
жен |
20 |
среднее |
220 |
Для данного социологического исследования наблюдения связаны с именем конкретного опрашиваемого человека. Результат опроса – его возраст, пол, образование, доход – это интересующие исследователя переменные. Тогда для анализа полученных результатов требуется создать электронную таблицу ввода данных, которая состоит из четырех переменных (столбцы таблицы 1) и шести случаев (строки таблицы 1). Данные в таблицу заносим в виде числовых или текстовых значений.
Порядок работы следующий.
1. Открывем новую таблицу Spreadsheet через кнопку File→New строки меню, выпадает окно Create New Document (Рис. 1). Это окно предлагает на открыть несколько типов документов : Macro (SVB) Program, Workbook, Browser Window, Spreadsheet, Report. Вызов окна возможен также через CTRL+N.
Выбираем Spreadsheet. Стандартный размер таблицы 10 х 10. Однако её размер можно задать сразу вводя число переменных (Number of variables) и число случаев (Number of cases). По умолчанию переменные нумеруются как Var1, Var2, и т.д. Случаи нумеруются от 1 до 10 без имен. Длина имени случаев (Case name length) принимается по умолчанию равной нулю. Данная таблица позволяет самому задать имена переменных (Var name prefix) и начальный номер переменной (Var name start number). Пустые места в таблице исходных данных в STATISTICA имеют свой внутренний код Missing Data Code (код пропущенных данных). По умолчанию он равен 9999. Этот код при необходимости можно заменить. Без необходимости этого делать не надо.
В разделе Placement можно указать место, где Вы хотите создать новый файл: In a new Workbook (в новом отчете) или As a stand alone window (стандартное окно). Выбираем As a stand alone window. Раздел Display format указывает форму записи в ячейках таблицы. Необходимо выбрать General.
Рисунок 1 – Порядок создания новой таблицы Spreadsheet.
Последующие шаги такие:
2. Изменение структуры таблицы.
В электронной таблице удалим ненужные переменные (столбцы) VAR5…VAR10 и случаи (строки) с 7 по 10.
Удаление переменных. На панели инструментов щелкнуть мышью по кнопке Vars. В выпавшем меню выбрать необходимое действие над столбцами таблицы, которые содержат переменные (Рис. 2). Для удаления выберите Delete. В открывшемся диалоговом окне Delete Variables (Рис. 3) укажите номера удаляемых переменных. Можно также воспользоваться контекстным меню. Для этого выделите столбец- переменную и щелкните правой клавишей.
Рисунок -2 Вид выпадающего меню по работе с переменными.
Рисунок – 3 Диалоговое окно удаления переменных из таблицы исходных данных.
Для удаления строк таблицы (в нашем случае это строки с 7 по10) необходимо воспользоваться кнопкой Cases на панели инструментов. Остальные действия аналогичны рассмотренным выше.
Аналогично, через выпадающее меню, можно выполнить операции добавить - Add, копировать - Copy, переместить - Move.
Можно также использовать строку главного меню: Data → Veriables → Требуемое действие (Add, Copy и так далее).
3. Заголовок таблицы. Комментарии к данным.
Заголовок таблицы вводится в первой строке, пустой строке, которая находится над переменными. Для этого дважды щелкните мышью по строке заголовка таблицы. В строке появится курсор. Наберите нужный вам заголовок таблицы.
Аналогично дважды щелкнув мышью по переменной или случаю можно ввести их имена. Комментарии к данным можно ввести в пустой квадрат над случаями (номерами строк).
4. Ввод данных. Двойная запись данных.
Установить указатель мыши на ячейку, в которую необходимо ввести данные. Щелкнуть левой клавишей, ячейка станет активной (в диалоговом окне она выделяется яркой границей). Введите данные. Затем перейдите к следующей ячейке либо с помощью курсора мыши либо нажав кнопку клавиатуры Enter. Вводимые данные могут быть как числовыми, так и текстовыми. Такой же процедурой можно воспользоваться в случаях исправления данных.
Для удобства работы с текстовыми переменными в системе STATISTICA реализован механизм двойной записи, в соответствии с которым каждому текстовому значению переменной ставится в соответствие некоторое число, либо автоматически (как правило, 101, 102 и т.д.), либо пользователем. При работе с данными всегда можно переключиться с текстовой на числовую формы записи и наоборот. Это делает удобным выполнение любого статистического анализа данных.
В рассматриваемом примере введем для переменной «Пол» следующую двойную запись: 1 = муж, 2 = жен. Для переменной «Образование»: 1 = среднее, 2 = высшее, 3 = нет.
Для этого в строке главного меню выберем Data (данные) → Text Labels Aditor (диспетчер текстовых значений). Откроется соответствующее диалоговое окно (Рис. 4).
|
Рисунок- 4 Диалоговое окно «Диспетчер текстовых значений» |
В данном диалоговом окне в столбце Text Label введите текстовое значение переменной, в столбце Numeric – соответствующее числовое значение. В столбце Description можно ввести дополнительный комментарий, который не будет отражаться в таблице данных. Нажмите кнопку OK диалогового окна. Максимальная длина текстового значения не должна превышать восьми символов.
Переключение между формами записи данных осуществляется с помощью кнопки Show/Hide Text Labels на панели инструментов (Рис. 5).
|
Рисунок – 5 Кнопка панели инструментов Show/Hide Text Labels |
Если переменные принимают текстовые значения, то каждый раз вводить текст в таблицу займет слишком много времени. Чтобы эффективнее организовать ввод текстовых данных лучше вводить численные значения, а затем перейти в текстовый режим. Для этого дважды щелкните по ее заголовку переменной левой кнопкой мыши, и на экране отобразится диалоговое окно редактирования переменной. Затем нажмите вкладку Text Label. Откроется диалоговое окно Text Labels Aditor (диспетчер текстовых значений) (Рис. 4). Введите числовые значения переменной, например, 1 для муж, 2 для жен. Далее нажмите кнопку ОК. После этого в таблицу вводите значения 2 или 1. Просмотр числовых кодов текстовых данных производят с помощью Кнопка панели инструментов Show/Hide Text Labels (Рис. 5).