- •Лабораторная работа №1 Описательная статистика. Построение графиков распределения в программах Excel и Statistica 6. Краткие сведения из теории
- •Порядок анализа данных в ms Excel.
- •Порядок анализа данных в пп Statistica 6.
- •Подготовительные процедуры
- •Первичный анализ статистических данных
- •Задание
- •Контрольные вопросы
Порядок анализа данных в ms Excel.
Предположим, полученными в ходе данными является рост мужчин определенной возрастной группы. Данные представлены в виде таблицы:
|
Рост |
|
174 |
|
164 |
|
179 |
|
190 |
|
189 |
|
194 |
|
155 |
|
175 |
|
188 |
|
166 |
|
170 |
|
160 |
|
159 |
|
167 |
|
169 |
|
156 |
|
171 |
|
173 |
|
178 |
|
173 |
|
174 |
|
173 |
|
190 |
|
176 |
|
175 |
|
172 |
|
197 |
|
186 |
|
201 |
|
170 |
|
280 |
|
110 |
Первая строчка в исходных данных (нецифровая информация) – Метка в первой строке.
Первой подготовительной процедурой является сортировка исходных данных. Для этого выделите анализируемый массив, а затем в меню выберите Сортировкапо возрастаниюилиСортировкапо убываниюи щелкните левой кнопкой мыши.
В появившемся окне выберите действие: сортировать в пределах указанного выделения и нажмите кнопку Сортировка

Для статистического анализа данных в программе Excel используется Пакет анализа.
Для активации модуля Анализ данных необходимо в меню Надстройка выбрать Пакет анализа.

Шаг 1.В системеExcelв меню откройте модульАнализ данных

Шаг 2.В модулеАнализ данных выберите Описательная статистика, после чего щелкните мышкойOK
Шаг 3.В появившемся окне выполните операции и установки, как показано на рисунке.

Полученные результаты представлены ввиде таблицы.

Примечание: эта опция позволяет обрабатывать любое количество выборок одновременно.
Шаг 4. Следующей процедурой является проверка в выборках выбросов. Из результатов обработки, представленных на рисунке, обращают на себя внимание высокие значения эксцесса и асимметрии Поэтому можно предположить, что крайние значения (минимальные или максимальные) являются выбросами. Это значения 110 и 280 см. Проверяем эти значения по формуле приведенной выше. Если значения являются артефактами, то они исключаются из выборки. Повторяются шаги 1-3.
Шаг 5. Построение графика распределения.
Для построения гистограммы необходимо определить величину класса (кармана) по формуле:
,
,
где N – число наблюдений.
Число классов n округляется до ближайшего целого вверх.
Если не рассчитывать размеры интервалов, то они будут определены автоматически.
Шаг 6. Модуль Анализ данных и выберите опцию Гистограмма, после чего щелкните мышкой OK
Шаг 7. Выполните установки как показано на рисунке.

Результат обработки появится в указанном поле.

Шаг 8. Построение линии тренда. Щелкните по столбцам диаграммы правой кнопкой мыши и в появившемся меню выберите Добавить линию тренда.

Выберите Полиномиальная степень 2.

Порядок анализа данных в пп Statistica 6.
Подготовительные процедуры
Процедуры, связанные с сортировкой массивов данных и поисками выбросов выполняются в табличном редакторе Microsoft Excel.
Запустите программный продукт Statistica 6.
Сформируйте таблицу исходных данных: в окне File выбрать New. После этого щелкните мышкой OK.

Открытие таблицы
В появившемся окне задайте число строк (Number of cases) и столбцов (Number of variables). Щелкнете мышкой OK.

Формирование таблицы
Теперь в таблицу необходимо внести исходные данные, осуществив набор непосредственно или вставку копии из файла, например, табличного редактора MS Excel (рисунок 5.3).

Исходные данные
