- •Расчетно-графическая работа
- •Оглавление
- •Введение
- •1.1 Постановка задачи:
- •1.2 Решение:
- •1.3. Вывод
- •Часть вторая. Корреляционный анализ в системе «statistica»
- •Исходные данные
- •2.2. Решение:
- •Окно выбора переменных для построения корреляционной матрицы
- •График распределения переменной x6 от переменной x11
- •Панель Brushing 2d (Кисть)
- •График распределения переменной x6 от переменной x11 с выделенными точками, лежащими далеко от прямой
- •График распределения переменной x6 от переменной x11 после удаления выбранных точек
- •Распределения переменной x6 от переменной x11 с подписями к выбранным точкам
- •Выбор переменных для построения графиков корреляций
- •Графики корреляционных зависимостей для переменных x4, x5, x7
- •Табличное представление корреляционной матрицы для переменных x4, x5, x7
- •Корреляционная матрица парных коэффициентов корреляции для переменных x4-x7 , x10-x13
- •Корреляционная матрица частных коэффициентов корреляции
- •2.3. Вывод
- •Кластерный анализ Вариант 32
- •3.1. Постановка задачи:
- •3.2. Решение:
- •3.2.1. Период 1995-2005
- •Дендрограмма, построенная методом одиночной связи
- •Метод k-средних
- •Средние кластерные
- •3.2.2. Период 2006-2009 Иерархический метод
- •Дендрограмма, построенная методом полной связи Дендрограмма, построенная методом Варда
- •Метод k-средних
- •Заключение
- •Библиографический список
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное Государственное бюджетное образовательное учреждение высшего профессионального образования
«Поволжский государственный технологический университет»
(ФГБОУ ВПО «ПГТУ»)
Кафедра Информационных систем в экономике
Расчетно-графическая работа
по дисциплине
«Анализ данных»
Выполнила: студентка I курса ЭФ
группы ПИб-11 Зыкова Е.О.
Проверила: доктор экономических наук,
профессор Бакуменко Л.П.
Йошкар-Ола
2014
Оглавление
ВВЕДЕНИЕ |
3 |
|
4 |
|
4 |
|
5 |
|
12 |
|
13 |
2.1. Постановка задачи |
15 |
2.2. Решение |
16 |
2.3. Вывод |
27 |
|
28 |
|
28 |
|
29 |
3.2.1. Период 1995-2005 |
29 |
3.2.2. Период 2006-2009 |
37 |
|
42 |
ЗАКЛЮЧЕНИЕ |
44 |
БИБЛИОГРАФИЧЕСКИЙ СПИСОК |
45 |
Введение
Анализ данных — отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных; изучение количественной стороны массовых общественных явлений в числовой форме.
Статистические методы анализа следует рассматривать как важную часть процесса принятия решений, позволяющую выработать обоснованные статистические решения, сочетающие интуицию специалиста с тщательным анализом имеющихся данных. Статистический анализ данных позволяет извлекать информацию из данных и оценивать качество этой информации.
В первой части данная расчетное графическое работа включает в себя анализ одномерных данных: вариационные ряды, оценивание параметров и проверка гипотезы о нормальном законе распределения. Вариационный ряд распределения строится по количественному признаку. В данной работе решение задачи происходит при помощи построения интервального вариационного ряда.
Во второй части расчетно-графической работы содержится корреляционный анализ данных, выполненный в программе STATISTICA.Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.Если проводится независимое измерение различных параметров у одного типа объектов, то из этих данных можно получить качественно новую информацию - о взаимосвязи данных параметров.
В третьей части работы проводится классификация регионов Приволжского Федерального округа по потребности в работниках, заявленной организациями в государственные учреждения службы занятости населения при помощи кластерного анализа. Происходит выделение групп показателей, схожих за данный по условию задачи период.
АНАЛИЗ ОДНОМЕРНЫХ ДАННЫХ. ВАРИАЦИОННЫЕ РЯДЫ.
1.1 Постановка задачи:
По времени (час.), затрачиваемому на аудиторскую проверку 100 предприятий отрасли
1) построить интервальный ряд распределения
2) вычислить выборочные характеристики по вариационному ряду:
а) среднюю арифметическую
б) медиану и моду
в) центральные моменты , k=1,2,3,4.
г) дисперсию S2 и среднее квадратическое отклонение S
д) коэффициент асимметрии и эксцесса
е) коэффициент вариации
3) построить графики гистограммы, полигона и кумуляты
Имеем таблицу набора данных:
Таблица 1- Исходный набор данных
12,88 |
12,76 |
13,41 |
13,22 |
13,18 |
13,6 |
13 |
13,22 |
13,01 |
12,54 |
12,95 |
12,83 |
12,65 |
13,01 |
13,7 |
12,94 |
13,28 |
13,27 |
12,98 |
13,25 |
12,86 |
12,74 |
12,98 |
13,16 |
13,82 |
13,07 |
13,21 |
12,78 |
13,76 |
12,65 |
13,55 |
13,6 |
13,22 |
13,9 |
13,13 |
13,36 |
13,08 |
12,57 |
13,27 |
12,57 |
13,18 |
13,08 |
12,85 |
13,75 |
13,29 |
13,39 |
13,21 |
12,77 |
13,03 |
12,66 |
13,2 |
12,98 |
13,05 |
12,83 |
12,78 |
13,16 |
13,32 |
12,59 |
13,32 |
12,84 |
13,41 |
13,22 |
13,1 |
12,84 |
12,92 |
13,2 |
13,47 |
13,29 |
12,94 |
13,34 |
13,26 |
13,27 |
12,93 |
13,51 |
13,35 |
13,15 |
13,76 |
13,41 |
13,09 |
12,72 |
13,32 |
12,89 |
12,91 |
12,92 |
13,05 |
13,21 |
13,92 |
12,88 |
13 |
12,55 |
13,11 |
13,17 |
13,61 |
13,1 |
12,87 |
13,18 |
13,79 |
12,82 |
13,15 |
13,3 |