Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная_работа_2_стат.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.17 Mб
Скачать

Лабораторная работа № 2 работа с электронными таблицами ввода исходных данных spreadsheet в системе statistica

Цель работы: Познакомиться с содержанием и порядком заполнения и оформления таблиц исходных данных SPREADSHEET.

Задачи работы:

изучить - назначение столбцов и строк электронной таблицы SPREADSHEET,

- порядок ввода данных в таблицу SPREADSHEET,

- освоить действия по преобразованию и оформлению таблиц.

1. Общие замечания

Данные в системе STATISTICA организованы в виде электронных таблиц. Работа с таблицами STATISTICA аналогична работе с электронными таблицами (типа MS Excel). Предлагаемая в STATISTICA табличная структура данных позволяет естественно отобразить большинство реальных данных, что очень удобно для пользователя. Таблица с исходными данными SPREADSHEET является одним из типов документов. Каждый документ (таблица) вводится в своем собственном окне в рабочей области системы.

Электронная таблица состоит из строк и столбцов. Столбцы таблицы SPREADSHEET называются Variables - Переменные, а строки Cases - Случаями (Наблюдениями). Таким образом в строках содержатся значения, которые принимают переменные, указанные в столбцах. Значения переменных могут быть числовыми и/или текстовыми.

С помощью строки главного меню, выпадающих меню из панели инструментов и контекстных меню над таблицами SPREADSHEET можно выполнять различные операции, в том числе:

- операции, которые изменяют структуру электронной таблицы (добавление, удаление, копирование, перемещение переменных и случаев);

- операции по заданию спецификаций (имен, форматов и др.) для переменных и случаев;

- операции над выделенным блоком значений;

- оперции по копированию, перемещению и автозаполнению блока и т.п.

Переменная (Variables) представляет собой наблюдаемую величину и имеет своё имя, формат, и другие атрибуты, которые называют спецификацией и задаются пользователем. В качестве случаев (Cases) могут быть даты наблюдений, имена и другие параметры.

Спецификация (описание) переменных включает в себя:

- формат отображения данных (количество десятичных разрядов в представлении чисел, формат представления дат, времени, соответствие между численными и текстовыми значениями и др.);

- код, приписываемый пропущенным данным;

- длинные имена переменных и комментарии к ним;

- метки для текстовых значений переменных, содержащих текстовые значения более восьми символов;

- формулы, используемые для определения, перекодировки или преобразования значений переменных.

Предусмотрена возможность задания информации обо всей таблице данных в целом, включая заголовок таблицы, комментарий к таблице, цвет, шрифт и размер отдельных структурных элементов, список фойлов, связанных с данной таблицей и т.п.

2. Пример ввода исходных данных в таблицы Spreadsheet

Создание файла с исходными данными рассмотрим на следующем примере. Пусть в результате социологического исследования проведен опрос группы населения, в результате которого контролировали следующие параметры: «Пол» (Муж – мужской, Жен – женский), «Возраст», «Образование» (Нет, Среднее, Высшее) и «Средний доход». Результаты опроса представлены в таблице 1.

Таблица 1 Исходные данные социологического опроса.

Имена опрошенных

Пол

Возраст

Образование

Доход (в условных единицах)

Иванов И.

муж

30

среднее

535

Петрова П.

жен

41

высшее

340

Сидоров С.

муж

52

нет

250

Береговой Б.

муж

25

высшее

400

Вольская В.

жен

32

среднее

200

Гвоздева Г.

жен

20

среднее

220

Для данного социологического исследования наблюдения связаны с именем конкретного опрашиваемого человека. Результат опроса – его возраст, пол, образование, доход – это интересующие исследователя переменные. Тогда для анализа полученных результатов требуется создать электронную таблицу ввода данных, которая состоит из четырех переменных (столбцы таблицы 1) и шести случаев (строки таблицы 1). Данные в таблицу заносим в виде числовых или текстовых значений.

Порядок работы следующий.

1. Открывем новую таблицу Spreadsheet через кнопку FileNew строки меню, выпадает окно Create New Document (Рис. 1). Это окно предлагает на открыть несколько типов документов : Macro (SVB) Program, Workbook, Browser Window, Spreadsheet, Report. Вызов окна возможен также через CTRL+N.

Выбираем Spreadsheet. Стандартный размер таблицы 10 х 10. Однако её размер можно задать сразу вводя число переменных (Number of variables) и число случаев (Number of cases). По умолчанию переменные нумеруются как Var1, Var2, и т.д. Случаи нумеруются от 1 до 10 без имен. Длина имени случаев (Case name length) принимается по умолчанию равной нулю. Данная таблица позволяет самому задать имена переменных (Var name prefix) и начальный номер переменной (Var name start number). Пустые места в таблице исходных данных в STATISTICA имеют свой внутренний код Missing Data Code (код пропущенных данных). По умолчанию он равен 9999. Этот код при необходимости можно заменить. Без необходимости этого делать не надо.

В разделе Placement можно указать место, где Вы хотите создать новый файл: In a new Workbook (в новом отчете) или As a stand alone window (стандартное окно). Выбираем As a stand alone window. Раздел Display format указывает форму записи в ячейках таблицы. Необходимо выбрать General.

Рисунок 1 – Порядок создания новой таблицы Spreadsheet.

Последующие шаги такие:

2. Изменение структуры таблицы.

В электронной таблице удалим ненужные переменные (столбцы) VAR5…VAR10 и случаи (строки) с 7 по 10.

Удаление переменных. На панели инструментов щелкнуть мышью по кнопке Vars. В выпавшем меню выбрать необходимое действие над столбцами таблицы, которые содержат переменные (Рис. 2). Для удаления выберите Delete. В открывшемся диалоговом окне Delete Variables (Рис. 3) укажите номера удаляемых переменных. Можно также воспользоваться контекстным меню. Для этого выделите столбец- переменную и щелкните правой клавишей.

Рисунок -2 Вид выпадающего меню по работе с переменными.

Рисунок – 3 Диалоговое окно удаления переменных из таблицы исходных данных.

Для удаления строк таблицы (в нашем случае это строки с 7 по10) необходимо воспользоваться кнопкой Cases на панели инструментов. Остальные действия аналогичны рассмотренным выше.

Аналогично, через выпадающее меню, можно выполнить операции добавить - Add, копировать - Copy, переместить - Move.

Можно также использовать строку главного меню: DataVeriables → Требуемое действие (Add, Copy и так далее).

3. Заголовок таблицы. Комментарии к данным.

Заголовок таблицы вводится в первой строке, пустой строке, которая находится над переменными. Для этого дважды щелкните мышью по строке заголовка таблицы. В строке появится курсор. Наберите нужный вам заголовок таблицы.

Аналогично дважды щелкнув мышью по переменной или случаю можно ввести их имена. Комментарии к данным можно ввести в пустой квадрат над случаями (номерами строк).

4. Ввод данных. Двойная запись данных.

Установить указатель мыши на ячейку, в которую необходимо ввести данные. Щелкнуть левой клавишей, ячейка станет активной (в диалоговом окне она выделяется яркой границей). Введите данные. Затем перейдите к следующей ячейке либо с помощью курсора мыши либо нажав кнопку клавиатуры Enter. Вводимые данные могут быть как числовыми, так и текстовыми. Такой же процедурой можно воспользоваться в случаях исправления данных.

Для удобства работы с текстовыми переменными в системе STATISTICA реализован механизм двойной записи, в соответствии с которым каждому текстовому значению переменной ставится в соответствие некоторое число, либо автоматически (как правило, 101, 102 и т.д.), либо пользователем. При работе с данными всегда можно переключиться с текстовой на числовую формы записи и наоборот. Это делает удобным выполнение любого статистического анализа данных.

В рассматриваемом примере введем для переменной «Пол» следующую двойную запись: 1 = муж, 2 = жен. Для переменной «Образование»: 1 = среднее, 2 = высшее, 3 = нет.

Для этого в строке главного меню выберем Data (данные) → Text Labels Aditor (диспетчер текстовых значений). Откроется соответствующее диалоговое окно (Рис. 4).

Рисунок- 4

Диалоговое окно «Диспетчер текстовых значений»

В данном диалоговом окне в столбце Text Label введите текстовое значение переменной, в столбце Numeric – соответствующее числовое значение. В столбце Description можно ввести дополнительный комментарий, который не будет отражаться в таблице данных. Нажмите кнопку OK диалогового окна. Максимальная длина текстового значения не должна превышать восьми символов.

Переключение между формами записи данных осуществляется с помощью кнопки Show/Hide Text Labels на панели инструментов (Рис. 5).

Рисунок – 5 Кнопка панели инструментов Show/Hide Text Labels

Если переменные принимают текстовые значения, то каждый раз вводить текст в таблицу займет слишком много времени. Чтобы эффективнее организовать ввод текстовых данных лучше вводить численные значения, а затем перейти в текстовый режим. Для этого дважды щелкните по ее заголовку переменной левой кнопкой мыши, и на экране отобразится диалоговое окно редактирования переменной. Затем нажмите вкладку Text Label. Откроется диалоговое окно Text Labels Aditor (диспетчер текстовых значений) (Рис. 4). Введите числовые значения переменной, например, 1 для муж, 2 для жен. Далее нажмите кнопку ОК. После этого в таблицу вводите значения 2 или 1. Просмотр числовых кодов текстовых данных производят с помощью Кнопка панели инструментов Show/Hide Text Labels (Рис. 5).