Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika_5.docx
Скачиваний:
10
Добавлен:
16.09.2019
Размер:
41.89 Кб
Скачать

3. Понятие, принципы построения и основные элементы статистического графика

Главное достоинство графиков – это наглядность. В настоящее время науку невозможно представить без использования в ней графических методов. Графические методы очень прочно вошли в арсенал средств научного общения и в методику научного исследования.Важное место графические методы занимают в таких науках, как статистика и экономика, так как эти науки используют большое количество цифр, сведенных в громоздкие таблицы.Графические методы помогают описать и проанализировать полученные в результате статистического исследования объектов данные. С помощью статистических графиков можно легко выявить закономерности, которые трудно уловить в статистических таблицах.

Статистический график – чертеж, на котором при помощи условных геометрических фигур (линий, точек или других символических знаков) изображаются статистические данные. Статистический график – это наглядная характеристика изучаемой статистической совокупности.

Графический метод – это продолжение и дополнение табличного метода. Если при чтении таблицы что-то остается незамеченным, обнаруживается на графике. Статистические графики показывают общую картину изучаемого явления, дают его обобщенное представление. При графическом изображении статистических данных становится более выразительной сравнительная характеристика изучаемых показателей, отчетливее проявляется тенденция развития изучаемого явления, лучше видны основные взаимосвязи.

Применение графиков в статистике насчитывает более чем двухсотлетнюю историю. Основоположником графического метода в статистике коммерческой деятельности считают английского экономиста У. Плейфейра (1731 – 1798гг.). В его работе «Коммерческий и политический атлас» (1786 г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и другие диаграммы).

Любой график состоит из графического образа и вспомогательных элементов. Графический образ – это совокупность символических знаков (точек, линий, фигур), с помощью которых изображаются статистические данные. Эти знаки образуют основу графического изображения. В графиках также возможно использование негеометрических фигур в виде силуэтов или рисунков предмета.

При построении графика важен правильный подбор графического образа, который должен доходчиво отображать изучаемые показатели. Вспомогательными элементами графика являются:

1)поле графика -- место или пространство, на котором располагаются образующие график геометрические фигуры. Это листы бумаги, географические карты, план местности и т. п. Поле графика характеризуется его форматом. Размер поля графика зависит от его назначения. Стороны поля статистического графика обычно находятся в определенной пропорции. Размер поля графика и пропорции его сторон определяются исполнителем.

2)пространственные ориентиры, определяющие размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями и делят поле графика на части, соответствующие значениям изучаемых показателей.

В статистических графиках чаще всего применяется система прямоугольных (декартовых) координат.

Но есть и графики, построенные по принципу полярных координат (круговые графики).

В статистических картах средствами пространственной ориентации выступают географические ориентиры.

Статистические карты представляют собой вид графических изображений на схематичной географической карте статистических данных, характеризующих уровень или степень распространения того или иного явления на определенной территории.

3)масштабные ориентиры, придающие графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.

Масштаб графика – это мера перевода численной величины в графическую и наоборот. Чем длиннее отрезок линии, принятой за числовую единицу, тем крупнее масштаб.

Масштабной шкалой является линия, отдельные точки которой читаются как определенные числа.

В масштабной шкале различают линию – носитель информации – опора шкалы.

Шкала графика может быть прямолинейной и криволинейной. Различаются также шкалы равномерные и неравномерные.придающие геометрическим знакам количественную определенность. Масштабные ориентиры определяются системой масштабных шкал или специальными масштабными знаками;

4)экспликация графика,– это пояснение содержания, включает в себя заголовок графика, объяснения масштабных шкал, объяснения отдельных элементов графического образа

Заголовок графика – это четкое пояснение основного содержания изображаемых данных. Состоит из объяснения:

а)предмета, изображаемого графиком (его названия), и

б)смыслового значения каждого знака, применяемого на данном графике. Без экспликации график нельзя прочитать и понять. Название графика должно кратко и точно раскрывать его содержание. Пояснительные тексты могут располагаться в пределах графического образа или рядом с ним (ярлыки), а также выноситься за его пределы (ключ).

Статистические графики можно классифицировать по разным признакам: назначению (содержанию), способу построения и характеру графического образа.

По содержанию или назначению можно выделить графики сравнения в пространстве, графики различных относительных величин (структуры, динамики и т. п.), графики вариационных рядов, графики размещения по территории, графики взаимосвязанных показателей. Возможны и комбинации этих графиков, например, графическое изображение вариации в динамике или динамики взаимосвязанных показателей и т. п.

По способу построения графики можно разделить на диаграммы, картодиаграммы и картограммы.

По характеру графического образа различают графики точечные, линейные, плоскостные (столбиковые, почасовые, квадратные, круговые, секторные, фигурные) и объемные.

Особым видом графиков являются диаграммы распределения величин, представленных вариационным рядом. Это гистограмма, полигон, огива, кумулята. В статистическом графике существуют следующие основные элементы: поле графика, графический образ, пространственные и масштабные ориентиры, экспликация графика.

Экспликация графика – это пояснение содержания, включает в себя заголовок графика, объяснения масштабных шкал, объяснения отдельных элементов графического образа

Заголовок графика – это четкое пояснение основного содержания изображаемых данных.

4. двухмерные и трехмерные последовательные графики

2М графики представляют наиболее общие методы визуализации данных. Построение двумерных графиков на плоскости "XY" в STATISTICA дает множество способов интерпретации значений как координат точек в двумерном пространстве. Они представляют собой, с одной стороны, стандартный метод графического представления исходных данных (например, различные диаграммы рассеяния, гистограммы и др.), а с другой стороны, стандартный способ графического анализа (например, категоризованные нормальные вероятностные графики, вероятностные графики с исключенным трендом и др.). К 2M Графикам относятся: 2М Гистограммы Нормальные вероятностные графики 2М Диаграммы рассеяния Графики квантиль – квантиль Графики средних с ошибками Графики вероятность – вероятность 2М Диаграммы размаха 2М Столбчатые диаграммы 2М Диаграммы диапазонов 2М Линейные графики 2М Линейные графики (профили наблюдений) Пиктографики рассеяния Диаграммы рассеяния с образами Последовательные/наложенные графики 2М Диаграммы рассеяния с гистограммами 2М Диаграммы рассеяния с диаграммами размаха Круговые диаграммы Графики пропущенных данных/диапазонов

Трёхмерные последовательные графики.3М последовательные графики предлагают различные методы визуализации в трехмерном пространстве простых последовательностей значений, диапазонов значений или статистической информации о группах или подмножествах (частоты, распределения). 3M последовательные графики включают: 3М Диаграммы исходных данных 3М Диаграммы диапазонов 3М Гистограммы двух переменных 3М Диаграммы размаха

Ниже перечислены разновидности трёхмерных графиков:

3М Диаграммы рассеяния

3М Диаграммы рассеяния с образами

3М Графики поверхностей

3М Карты линий уровня

Тернарные графики

5. двухмерные и трехмерные категоризированные графики

Категоризованные графикиОдин из наиболее важных аналитических методов использует разделение множества данных на категории, чтобы сравнивать структуру данных в получившихся подмножествах. Этот способ известен под несколькими названиями (например, классификация, группировка, категоризация, разбиение, расслоение) и используется как для разведочного анализа данных, так и для проверки гипотез. Пример: зависимость возраста и риска инфаркта может различаться для женщин и мужчин. Зависимость между приёмом лекарств и снижением уровня холестерина может присутствовать только у женщин с низким кровяным давлением и только в возрасте тридцати-сорока лет. Индексы мощности процесса или гистограммы мощности могут различаться для временных промежутков, когда управление осуществляется разными операторами. Наклоны регрессии могут различаться для разных экспериментальных групп.

Многие вычислительные средства, основывающиеся на группировке, предназначены для количественного описания различий, выявляемых с помощью группировки (например, в дисперсионном анализе). Однако графические средства дают особые преимущества, которых нельзя достичь, используя лишь вычислительный метод: они могут выявлять закономерности, которые трудно поддаются количественному описанию (например, сложные взаимодействия, исключения, аномалии), и предоставляют уникальные обширные возможности аналитического исследования или "добычи данных".Виды категоризованных графиков:

2М Категоризированные гистограммы

Графики вероятность – вероятность

2М Категоризированные диаграммы рассеяния

Категоризированные линейные графики

Категоризированные графики средних с ошибками

Категоризированные круговые диаграммы

Категоризированные диаграммы размаха

Категоризированные графики пропущенных данных/диапазонов

Категоризированные нормальные вероятностные графики

3М Категоризированные графики

Категоризированные графики квантиль – квантиль

Категоризированные тернарные графики

6. Тернарные категоризированные графики

Тернарные графики. Тернарный график используется для исследования связей между несколькими переменными, когда три из них представляют собой, например, компоненты смеси (это означает, что сумма их остается постоянной для всех наблюдений). Обычно такие графики применяются при экспериментальном исследовании зависимости отклика от относительного содержания трех компонент (например, трех химических соединений), при этом соотношение компонент изменяется с целью определения его оптимального значения (например, при составлении смесей). Тернарные графики - 2М диаграмма рассеяния. На тернарном графике этого типа для представления трех (или более) переменных [компонент X, Y и Z] на плоскости используется треугольная система координат. Точки графика соответствуют пропорциям переменных-компонент (X, Y и Z). Тернарные графики - 3М диаграмма рассеяния. На тернарном графике этого типа для представления четырех (или более) переменных [компонент X, Y, Z и откликов V1, V2 и т.д.] в трехмерном пространстве (на тернарных 3М диаграммах рассеяния и графиках поверхностей) используется треугольная система координат. Отклики (V1, V2 и т.д.), соответствующие пропорциям переменных-компонент (X, Y и Z), равны на тернарном графике высотам точек. Тернарные графики - Диаграмма отклонений. На тернарном графике этого типа можно исследовать связи между четырьмя и более переменными (X, Y, Z и V1, V2 и т.д.), представленные в виде "отклонений" от заданного уровня на оси V, где три измерения (X, Y и Z) представляют собой компоненты смеси (это означает, что сумма их остается постоянной для всех наблюдений).Тернарные графики - Зонная карта. Тернарный график этого типа представляет собой проекцию поверхности в виде зонной карты (подогнанной к множеству данных с четырьмя координатами).

7. четырехмерные и н-мерные графики.

8. Пиктографики:профили, звезды, лучи и т.д.

На статистических пиктографиках наблюдения или отдельные испытания представлены в виде символов со многими элементами. Основная идея использования пиктографиков состоит в представлении отдельных наблюдений в виде некоторых графических объектов, где значения переменных соответствуют определенным свойствам или размерам этих объектов (как правило, одно наблюдение = один объект). Это соответствие таково, что внешний вид объекта изменяется в зависимости от набора значений. Таким образом, появляется возможность однозначно «идентифицировать» объекты по набору значений. Изучение таких пиктограмм помогает обнаружить специфические наборы простых соотношений и взаимосвязей между переменными.

Анализ пиктографиков.В идеальном случае анализ пиктографиков осуществляется в пять этапов.

1) Определяется порядок анализируемых переменных. Очень часто наилучшим решением является случайная последовательность. Можно также попробовать ввести переменные в порядке их расположения в уравнении множественной регрессии в зависимости от величины их факторных нагрузок на интерпретируемый коэффициент или использовать аналогичные многомерные методы. Это иногда позволяет упростить и сделать «однородным» общий вид пиктограмм, чтобы облегчить задачу распознавания не слишком

отличающихся друг от друга картинок. В то же время использование таких методов может усложнить задачу поиска некоторых взаимозависимостей. На этом этапе невозможно дать никаких универсальных рекомендаций, кроме совета попробовать самый быстрый метод (случайный выбор порядка) до того, как применять более сложные методы.

2) Проводится поиск любых возможных закономерностей, таких как сходство между группами пиктограмм, выбросы или специфические соотношения между элементами пиктограмм (например, «если на пиктограмме звезды первые два луча длинны, то один или два луча с другой стороны пиктограммы обычно коротки»). На этом этапе рекомендуется использовать пиктографики кругового типа.

3) Обнаруженные закономерности описываются в терминах используемых переменных.

4) Для проверки найденной структуры соотношений переменные сопоставляются с другими элементами пиктограмм. Например, можно попытаться переместить связанные элементы пиктограммы ближе друг к другу, чтобы упростить дальнейшее сравнение. В некоторых случаях в конце этого этапа рекомендуется исключить из рассмотрения переменные, не вносящие заметного вклада в исследуемую структуру.

5) Для проверки и количественной оценки обнаруженной зависимости или хотя бы некоторых ее параметров используется, например, регрессионный анализ, нелинейное оценивание, дискриминантный или кластерный анализ.

Классификация пиктографиков Большинство пиктографиков можно отнести к одному из двух типов: круговому или последовательному.

Круговые пиктографики (звезды, лучи, многоугольники) имеют форму «велосипедного колеса», где значения переменных изображаются в виде расстояний между центром («втулкой») пиктограммы и ее углами.

Такие пиктограммы полезны при поиске взаимозависимостей между переменными, поскольку они хорошо отличаются и идентифицируются по внешнему виду, который в свою очередь определяется конфигурацией значений изучаемых переменных. Чтобы перевести эти «приблизительные соответствия» на язык конкретной модели (в терминах соотношений между переменными) или чтобы проверить конкретные предположения, полезно переключиться на один из последовательных пиктографиков, использование которых может оказаться более эффективным в том случае, когда уже известно, что нужно искать.

Последовательные пиктограммы

На последовательных пиктографиках (столбцы, профили, линейные графики) отдельные пиктограммы представляют собой небольшие последовательные графики (разных типов). Значения следующих друг за другом переменных отображаются на этих графиках расстоянием между основанием пиктограммы и последовательно идущими точками последовательности (например, высоты столбцов на показанном выше рисунке). Такие графики могут быть не столь эффективными на начальном этапе анализа, поскольку пиктограммы могут не слишком отличаться друг от друга. Тем не менее, как было указано выше, они могут пригодиться для проверки определенной гипотезы или для описания модели в терминах соотношений между конкретными переменными.

Круговые диаграммы Пиктографики в виде круговых диаграмм занимают промежуточное место между пиктографиками двух упомянутых выше типов; все пиктограммы имеют одинаковую форму (круг) и разделены на последовательно идущие друг за другом части в соответствии со значениями переменных, следующих друг за другом. Несмотря на их форму, с точки зрения функционального использования, такие пиктографики скорее можно отнести к разряду последовательных.

Многоугольники .График с пиктограммами в виде многоугольников —-это пиктографик кругового типа. Здесь для каждого наблюдения рисуется пиктограмма в виде многоугольника. Относительные значения выбранных переменных для каждого наблюдения представлены расстояниями, отсчитываемыми от центра диаграммы до последовательно идущих вершин многоугольника (по часовой стрелке, начиная с направления вертикально вверх).

Звезды. График с пиктограммами в виде Звезд — это пиктографик кругового типа. На таких графиках для каждого наблюдения рисуется отдельная пиктограмма в виде звезды, при этом относительные значения выбранных переменных для каждого наблюдения представляются длинами соответствующих лучей (порядок следования которых зафиксирован: по часовой стрелке начиная от луча, направленного вертикально вверх). Концы лучей соединяются линиями.

Лучи .График с пиктограммами в виде Лучей — это пиктографик кругового типа. На нем для каждого наблюдения рисуется отдельная пиктограмма, напоминающая солнце, при этом все лучи имеют одинаковую длину и каждый из них представляет одну из выбранных переменных (порядок следования которых зафиксирован: по часовой стрелке, начиная от луча, направленного вертикально вверх). Точки на лучах, определяемые относительными значениями соответствующих переменных, соединяются ломаной линией.

Столбцы .График с пиктограммами в виде столбцов — это пиктографик последовательного типа. Для каждого наблюдения рисуется отдельный график; относительные значения выбранных переменных соответствуют высотам последовательных столбцов.

Профили .Графики с пиктограммами в виде профилей — это пиктографики последовательного типа (см. предыдущий раздел). Для каждого наблюдения рисуется отдельный график. Относительные значения выбранных переменных соответствуют высотам последовательных пиков сечения, ограниченного снизу базовой линией.

Пиктографики применяются, как правило, в двух случаях: 1) когда нужно выявить характерные зависимости или группы наблюдений и 2) когда необходимо исследовать предположительно сложные взаимосвязи между несколькими переменными. В первом случае пиктографики используются для классификации наблюдений аналогично кластерному анализу.

Предположим, было проведено анкетирование артистов с целью изучения их личных качеств. Пиктографики помогут определить, существуют ли естественные группы артистов, отличающиеся определенными закономерностями полученных баллов за ответы на различные вопросы. Например, может оказаться, что некоторые артисты — чрезвычайно творческие личности, при этом они недисциплинированны и независимы, в то время как представители второй группы хорошо образованны, дисциплинированны и уделяют большое внимание успеху у публики.

Второй тип применений — исследование связей между несколькими переменными — больше напоминает факторный анализ, то есть его можно использовать при исследовании вопроса о зависимости переменных. Предположим, изучалось мнение группы людей о различных марках автомобилей. Несколько человек заполнили детальные анкеты, оценивая различные свойства различных автомобилей. В файле данных записаны средние оценки по каждому из свойств (рассматриваемых как переменные) для каждого из автомобилей (рассматриваемых как наблюдения).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]