Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мет стат лаб 2011.doc
Скачиваний:
8
Добавлен:
14.11.2019
Размер:
242.18 Кб
Скачать

Лабораторная работа №2 «Группировка статистических данных»

(Работа должна быть выполнена в 2-х вариантах: в ППП MS Excel и Statistica).

Подготовка к выполнению лабораторной работы.

1.По учебнику изучить темы:

Статистическая сводка,

Группировка,

Ряд распределения.

2.Уметь группировать статистические данные.

3.Использовать данные, подготовленные в ходе выполнения лабораторной работы №1. Подготовить выборку по 5 признакам, объемом не менее 50 единиц (например, информация о деятельности по 50 предприятий и 5 показателям: объем производства, численность занятых, стоимость основных средств, кредиторская задолженность и балансовая прибыль). Такую информацию можно найти в статистических сборниках, internet, экономической периодике.

Задание:

1.Построить вариационный ряд.

2.Вычислить среднее значение, моду, медиану, дисперсию

(смещенную и несмещенную оценку), коэффициент вариации.

3.Сделать равноинтервальную группировку.

4.Построить таблицу частот и накопленных частот для сгруппированной выборки.

5.Построить гистограмму и кумуляту.

6.Сделать выводы о распределении (характеристика симметричности и однородности).

Выполнение задания в ППП MS Excel.

Ход работы:

  1. В ППП MS Excel основные статистические характеристики можно получить с помощью функции Описательная статистика. Для этого последовательно выполняем следующие операции: Данные – Анализ данных – Описательная статистика – ОК. Предварительно надо проверить доступ к пакету анализа: Данные – Надстройки – Пакет анализа (отметить флажком).

В диалоговом окне заполняем строки:

Входной интервал (один или несколько столбцов из введенных исходных данных);

Группирование (выбираем по столбцам);

Метки - указание на то, что первая строка содержит название столбца;

Выходной интервал – указание места, куда будут выведены результаты расчета (достаточно указать левую верхнюю ячейку);

Новый рабочий лист – имя нового листа;

Помечаем строки: Итоговая статистика, Уровень надежности (0,95)-ОК

2.Для выполнения равноинтервальной группировки сначала определяем величину интервала по формуле:

h = (х максимальное – х минимальное)/n,

количество интервалов берем равное 4.

Затем рассчитываем границы интервалов (х мин. + h), и с применением функции Фильтр определяем частоты (количество единиц совокупности, попадающее в каждый интервал): Выделяем столбец исходных данных - Данные – Фильтр – Автофильтр. Щелкнем по стрелке, появившейся в верхней ячейке и выберем Условие. В первой строке задаем нижнюю границу интервала (например, больше или равно 20), во второй строке задаем верхнюю границу интервала (например, меньше или равно 40). Сумму выбранных (обозначенных синим цветом) единиц совокупности записываем в отдельную таблицу. Повторяем процедуру выбора для каждого интервала. В результате должен получиться ряд распределения (пример смотри в таблице 1).

Таблица 1. Ряд распределения

Объем производства (тыс.шт.)

Количество предприятий

100-120

12

120-140

18

140-160

14

160-180

6

Итого:

50

3. Построение гистограммы и кумуляты выполняется с указанием названия графика и каждой оси. Для кумуляты в таблице рассчитываем накопленные частоты и среди разновидностей диаграмм выбираем График.

4. Выводы делаем по рассчитанным характеристикам Описательной статистики. Выводы должны давать общую картину распределения: однородность совокупности («похожесть» единиц совокупности друг на друга), концентрация значений вокруг средней величины, «типичное» значение, симметричность распределения (преобладание больших или малых значений).

Выполнение задания в пакете Statistica.

Ход работы:

Пакет имеет модульную структуру. Модули открываются переключателем модулей (Statistica Module Switcher), выйти в который можно, щелкнув по первому изображению в третьей строке рабочего окна. Управление данными осуществляется модулем Data Management. В этой работе нас интересует модуль Basic StatisticsDescriptive statistics.

Последовательность выполнения действий следующая:

  • Открыть файл или создать файл с данными;

  • Выбрать переменные для анализа;

  • Выбрать метод анализа данных из меню в стартовой панели модуля;

  • Выбрать вычислительную процедуру и задать ее параметры;

  • Начать вычислительную процедуру.

  1. Создаем новый файл для ввода данных: FileNew Data – вводим имя файла - Ок. В поле Var1 вводим исходные данные. Если строк не достаточно (по умолчанию 10), то добавляем: CasesAddNumber of Cases to Add указываем число добавляемых строк. Можно задать имя переменной, формат чисел следующим образом: выбранная переменная – в окне Variable Specs или VarsAll Specs. Можно открыть уже заготовленные данные: FileOpen Data; или импортировать данные из других файлов: FileImport Data.

Для построения вариационного ряда: Data ManagementAnalysisSort (сортировка данных) – Acsen (по возрастанию) или Desc (по убыванию).

Затем Statistica Module Switcher - Basic Statistics – Switch to – Analysis – Descriptive Statistics – More Statistics. Помечаем те статистики, которые хотим вычислить:Valid N– число элементов выборки;

Mean – среднее значение;

Sum – сумма;

Median – медиана;

Standard Deviation – среднее квадратическое отклонение (стандартное отклонение);

Variance – несмещенная оценка дисперсии;

Standard error of mean – стандартная ошибка среднего;

Minimum @ maximum – минимальное и максимальное значения;

Lower @ upper quartiles – верхний и нижний квартиль;

Range – размах вариации;

Quartiles range – разность между верхним и нижним квартилем;

Skewness – выборочный коэффициент асимметрии;

Kurtosis – выборочный коэффициент эксцесса;

Standard error of skewness – стандартная ошибка коэффициента асимметрии;

Standard error of kurtosis – стандартная ошибка коэффициента эксцесса.

Надо отметить необходимые характеристики, ввести имя анализируемой переменной в левом верхнем углу и ОК. Полученные результаты будут представлены в виде таблицы.

2. Для проведения группировки в стартовой панели модуля Basic Statistics выберем процедуру Frequency tables. В диалоговом окне можно задать размер интервала Step size, при этом пометить слова at minimum (так задается начальное значение) или задать количество интервалов: No of exact intervals.

В полученной таблице будут указаны границы интервалов признака, частоты, накопленные частоты и доля единиц группы в общем объеме совокупности.

В окне Frequency tables найдем кнопку Histograms и построим гистограмму. На графике кривая Exp Normal - это график плотности нормального распределения с математическим ожиданием и средним квадратическим отклонением.

Для построения кумуляты: Analysis-Frequency tables –ввести имя переменной- нажать кнопку Frequency tables-щелкнуть правой кнопкой мыши по имени столбца Сumul. Сount. - в меню выбрать Custom Graphsline plotOK.