Скачиваний:
29
Добавлен:
01.05.2014
Размер:
77.31 Кб
Скачать

Графический анализ статистических данных в Microsoft Excel

1. Общие сведения

В статистике и экономике визуализация данных используется наиболее широко для отображения информации. Основным свойством визуализации является ее наглядность, а человек получает примерно 80% знаний об окружающем мире с помощью органов зрения.

Поле диаграммы – это пространство, в котором размещаются геометрические или другие графические знаки, образующие диаграмму. Границы поля диаграммы характеризуются ее размером и соотношением сторон. Размер поля зависит от назначения диаграммы, например, для демонстрации на выставке или для научного отчета. Пропорции сторон должны не только удовлетворять эстетическим требованиям, но и способствовать наилучшему зрительному восприятию изображаемых статистических данных. На практике обычно применяют диаграммы с соотношением сторон от 1:1,30 до 1:1,50. Самым удобным является соотношением сторон «золотое сечение» 1:. Именно такое отношение сторон имеет стандартный лист писчей бумаги формата А4.

В Excel можно построить девять типов двумерных и шесть типов трехмерных диаграмм, каждая из которых имеет несколько разновидностей. Можно также комбинировать основные типы диаграмм. Например, на одной диаграмме можно наложить график изменения стоимости товара на график изменения объемов его продаж. Возможно создание «диаграмм-картинок», в которых вместо обычных линий и столбцов используются самые разнообразные графические образы. Все это в сочетании с пользовательскими форматами дает практически неограниченные возможности для построения диаграмм.

Диаграмма называется внедренной, если располагается на одном листе с исходными данными.

Ряды данных – это наборы значений, которые требуется изобразить на диаграмме. Каждый используемый в диаграмме ряд данных не может иметь более 4000 значений. На одной диаграмме может быть изображено до 255 рядов данных, но при этом общее количество точек данных не может превышать 32000.

Категории служат для упорядочения значений в рядах данных. Например, при рассмотрении дохода за прошедшие десять лет категориями являются годы, при построении графика распределения прибыли по отделам компании категориями являются названия или коды отделов.

Если возникает затруднение, что считать рядом, а что - категорией, то применяется следующее правило: ряды данных – это те значения, которые нужно вывести на диаграмме, а категории – это «заголовки», над которыми эти значения откладываются. Категории представляют собой значения аргумента, а ряды данных – соответствующие значения функции.

2. Внедренные диаграммы

Для построения внедренной диаграммы достаточно выделить нужные данные и нажать кнопку Мастер диаграмм на стандартной панели инструментов или открыв подменю Диаграмма из меню Вставка. Все, что нужно сделать дальше, - указать место внедрения диаграммы, ее размер и задать желаемые параметры диаграммы в последовательно открываемых диалоговых окнах. Для изменения размеров диаграммы выделите ее, а затем перетащите один из расположенных по ее периметру маркеров в нужном направлении. Для удаления внедренной диаграммы необходимо сначала выделить ее, а затем выполнить команду Все из подменю Очистить меню Правка или нажать клавишу Del. Если нужно построить диаграмму для двух или более несмежных интервалов, то сначала создается структура данных, скрываются мешающие строки и столбцы, а затем строится диаграмма.

При выделении данных для диаграммы желательно наряду с рядами данных выделить также названия категорий и названия самих рядов. Однако, если диаграмма строится по единственному столбцу или строке, заголовок не следует включать в выделенный интервал, т.к. в этом случае Мастер диаграмм может не отличить заголовок от самих данных.

Анализ выделенных данных в Excel основан на том, что количество рядов должно быть меньше, чем количество категорий. Если диаграмма строится для интервала ячеек, имеющего больше столбцов, чем строк (или равное), то рядами данных считаются строки. Если интервал ячеек имеет больше строк, чем столбцов, то рядами данных считаются столбцы.

Чтобы заголовки менялись в соответствии с изменением исходных данных, необходимо связать их с соответствующими ячейками после создания диаграммы.

Самый быстрый способ построения диаграммы – это выделить данные и нажать клавишу F11. На отдельном листе будет построена диаграмма в соответствии с принятым по умолчанию типом и форматом.

3. Редактирование внедренных диаграмм

Диаграмма Microsoft Excel состоит из следующих классов элементов, каждый из которых можно выделить и отредактировать: область диаграммы, область построения, основание (только для объемных диаграмм), стенки (только для объемных диаграмм), легенда, оси, текст, стрелки, линии сетки, первый ряд данных, второй и последующие ряды данных, линии проекции, линии минимакс уровней, плюс-маркеры, минус-маркеры, линии рядов.

Форматируемый элемент выделяется, как правило, щелчком мыши. Чтобы одновременно выделить элемент диаграммы и открыть диалоговое окно форматирования, нужно дважды щелкнуть по этому элементу.

Стрелки используются для привлечения внимания к важной информации. Чтобы нарисовать стрелку, выполняются следующие действия. Щелкнуть кнопку Рисование на Стандартной панели инструментов, а затем кнопку Стрелка на панели инструментов Рисование. Установить курсор мыши в том месте экрана, где должна начинаться стрелка, и нажать левую кнопку мыши. Перетащить курсор мыши в то место экрана, где стрелка должна заканчиваться, и отпустить кнопку.

Задание. Для исходных данных (произвольных или из предыдущей лабораторной работы) необходимо построить кольцевую диаграмму, внешнее кольцо которой представляет объем продаж некоторой фирмы по месяцам, первое внутреннее – по кварталам, второе внутреннее – по полугодиям, центр или следующее кольцо – за год. Подпишите названия периодов и долю каждого периода. Стрелками покажите наибольшее и наименьшее значения объемов продаж для помесячной разбивки.

Эксперимент по методу Монте-Карло

По-видимому, никто точно не знает, почему эксперимент по методу Монте-Карло называется именно так. Возможно, это название имеет какое-то отношение к известному казино как символу действия законов случайности.

В реальной ситуации истинные значения и неизвестны, а, следовательно, неизвестно, хорошие или плохие оценки дает регрессионный анализ. Эксперимент по методу Монте-Карло – это искусственный контролируемый эксперимент, дающий возможность такой проверки. Простейший эксперимент по методу Монте-Карло состоит из трех частей.

Во-первых: 1) выбираются истинные значения и ; 2) задается вектор значений и число наблюдений , рассчитывается точное значение ; 3) используется генерация случайных чисел по определенному закону для получения случайного фактора в каждом из наблюдений.

Во-вторых, в каждом наблюдении генерируется значение на основе и .

В-третьих, применяется регрессионный анализ для оценивания параметров и с использованием полученных вышеуказанным образом значений для соответствующих значений . Это позволит видеть, являются ли найденные и хорошими оценками и , это позволит почувствовать пригодность метода построения регрессии. Разница между истинными значениями и оценкой будет обусловлена влиянием случайного члена .

Задание. Проведите первые две части эксперимента по методу Монте-Карло для функции , где равна номеру варианта, а нормально распределенная случайная величина с нулевым средним и единичной дисперсией. , для . Рассчитайте с помощью встроенной функции КОРРЕЛ() коэффициент корреляции между точным значением функции и значением функции с ошибкой. Полученное значение должно быть не менее 0,97.

Соседние файлы в папке Лабораторные в Excel по статистике