
Блейхер О.В.
СТАТИСТИКА
Учебное пособие
Томск 2007
УДК ББК
Блейхер О.В. Статистика: Учебное пособие. - Томск: Изд-во., 2007. - ХХ с.
Учебное пособие по статистике, включает в себя рабочую программу изучения курса «Статистика», методические указания по написанию контрольной работы, конспект лекций и практикум для самостоятельной проверки усвоения знаний, тестовые задания, а также список рекомендованной литературы подготовлен. Он предназначен студентам специальности «Менеджмент организации» всех форм обучения для подготовки к экзаменам и зачетам.
Комплекс составлен исходя из требований государственного стандарта подготовки специальности «Менеджмент организации», утверждённого Госкомитетом РФ по высшему образованию.
Научный редактор - д.ф.н., профессор Камышев Эдуард Николаевич
ISBN
© О.В. Блейхер
ОГЛАВЛЕНИЕ
I/, 39
М = у , • fM. /V/,, 1 1 1 47
I/, 48
X/, 51
X/, 51
X/, 51
s = — > 30 71
рабочего времени
ЭКЗАМЕНАЦИОННЫЕ (ЗАЧЕТНЫЕ) ТЕСТЫ 64 ПРИЛОЖЕНИЯ 85 Приложение 1 85 Приложение 2 86 Приложение 3 87 ЛИТЕРАТУРА 89
1. РАБОЧАЯ ПРОГРАММА
Рабочая программа составлена на основание требований стандартов к курсу статистика по направлениям и специальностям подготовки в РФ.
Цели и задачи курса статистика: статистика является одной из основных величин в системе экономического образования. Без статистических данных невозможно управление ни государственными структурами, ни частными коммерческими предприятиями. Методическое пособие по курсу статистика предлагает методы и методики количественного анализа социально- экономических явлений.
Содержание лекций:
Предмет, методы и задачи статистики.
Источники статистической информации.
Группировка и сводка статистических материалов.
Средние величины. Общие принципы их применения.
Понятие абсолютной и относительной величины в статистике.
Понятие абсолютной и относительной величины в статистике.
Индексы.
Меря связи.
Ряды динамики.
Статистика численности работников и использования рабочего времени. Содержание практических занятий.
Суммирование, основные правила. Операции над матрицами.
Предмет и метод статистической науки.
Методы нахождения ошибок при сборе статистической информации.
Построение таблиц. Графические методы исследования.
Метод Дендридов. Метод структурной средней.
Вариационные ряды.
Виды средних величин и методы их расчета.
Оценка экономической эффективности.
Абсолютные величины. Относительные величины.
Общие и индивидуальные индексы, общие понятия.
Индексный анализ итогового показателя, индексы средних величин.
Ряды динамики. Средние показатели в рядах динамики.
Баланс трудовых ресурсов, показатели использования рабочего времени.
Методические указания к написанию контрольной работы
Студенты, обучающиеся, по очной форме пишут контрольные работы на практических занятиях по темам, указанным в рабочей программе. Контрольная работа включает в себя теоретическую и расчетную части. Теоретическая часть составляется на основе пройденного (к моменту написания контрольной работы) лекционного материала, а расчетная - по изученным на практических занятиях методам статистического анализа.
Темы рефератов:
Предмет статистической науки.
Статистическая информация.
Виды и способы статистического наблюдения.
Основные вопросы организации статистической отчетности.
Статистическая сводка.
Методологические вопросы статистических группировок.
Принцип выбора группировочного признака.
Ряды распределения.
Таблицы. Разработка сказуемого статистических таблиц.
Правила составления таблиц.
Графические методы анализа.
Классификация статистических данных.
Абсолютные величины в статистике.
Относительные величины в статистике.
Смысл и значение средней величины.
Основные методы оценки средних величин.
Понятие о выборочном исследовании. Ошибки выборки.
Статистические ряды динамики. Сопоставимость в рядах динамики.
Средние показатели в рядах динамики.
Статистические индексы.
Агрегатная форма общего рынка.
Средние индексы. Территориальные индексы. Причем, номер темы Вы получаете у преподавателя.
Реферат должен иметь содержание, введение, основную часть и заключение (итоговые выводы). Он должен быть написан на основе самостоятельного изучения подобранной студентом литературы, оформлен в соответствии со стандартами представленными в методическом пособии к самостоятельной работе студента. Объем работы не должен превышать 10 страниц машинописного текста через 1,0 интервал или рукописных 12 -18 страниц. Замечание: прежде чем преступить к написанию реферата, желательно просмотреть список рекомендуемой литературы.
2. КОНСПЕКТ ЛЕКЦИЙ
2.1. Предисловие
Курс «Статистика» имеет цель дать студентам представление о содержании статистики как научной дисциплины, познакомить с ее основными понятиями. Одним из важнейших условий правильного восприятия и практического использования статистической информации, квалифицированных выводов и обоснованных прогнозов является знание статистической методологии, изучение количественной стороны социально -экономических явлений, природы массовых статистических совокупностей, значения и познавательных свойств показателей статистики, условий их применения в экономическом исследовании. В соответствие с этим учебный курс охватывает самые общие начальные элементы статистической науки, и прежде всего важнейшие направления анализа социально-экономических процессов.
В предлагаемом кратком курсе лекций содержится системное изложение методов, применяемых на основных стадиях экономико-статистического исследования: сбора (в соответствии с целевой функцией исследования) первичной информации, ее обработки в ходе статистической сводки, вычисления обобщающих показателей для анализа и прогнозирования с применением экономико-математических методов.
Особенностью данного курса является то, что вопросы статистической методологии рассматриваются применительно к решению управленческих задач в коммерческой деятельности на рынке товаров и услуг. Замечание: для лучшего овладения навыками статистической науки рекомендуется обращать особое внимание на выделенные термины.
2.2. Предмет, метод и задачи статистики
Слово "статистика" имеет латинское происхождение (от status - состояние). В средние века оно означало политическое состояние государства. В науку этот термин введен в 18 веке немецким ученым Готфридом Ахенвалем. Собственно как наука статистика возникла только в 17 веке, однако статистический учет существовал уже в глубокой древности. Так, известно, что еще 5тыс. лет до н. э. проводились переписи населения в Китае, осуществлялось сравнение военного потенциала разных стран, велся учет имущества граждан в Древнем Риме, затем - населения, домашнего имущества, земель в средние века.
У истоков статистической науки стояли две школы - немецкая описательная и английская школа политических арифметиков.
Представители описательной школы стремились: систематизировать существующие способы описаний государств, ввести описание только в словесной форме, без цифр и вне динамики, т. е. без отражения особенностей развития государства в те или иные периоды, а только лишь на момент наблюдения; создать теорию описаний. Видными представителями школы были Г. Конринг (1606 - 1661), Г. Ахенваль (1719 - 1772), А. Бюшинг (1724 - 1793).
Политические арифметики ставили целью изучать общественные явления с помощью числовых характеристик (меры, веса и числа). Тем самым они увеличили арсенал статистических методов, способствовали возникновению статистики как теории статистического учета.
История показала, что последнее слово в статистической науке осталось именно за школой политических арифметиков.
Сегодня термин статистика употребляется в нескольких значениях:
под статистикой понимают отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о самых различных явлениях общественной жизни;
Например: разного рода рейтинговые исследования.
Б) статистикой называют цифровой материал, служащий для характеристики какой - либо области общественных явлений или территориального распределения показателя; Например: миграция населения.
статистикой называется отрасль знания, особая научная дисциплина и соответственно учебный предмет в высших и средних специальных учебных заведениях;
Статистика как наука имеет свой предмет исследования. Она изучает с количественной стороны массовые социально - экономические явления. Так, при изучении товарооборота, товарных запасов, издержек обращения и других показателей коммерческой деятельности статистика устанавливает количественные характеристики их развития, определяет соотношение между отдельными показателями, дает цифровую оценку проявляющимся при этом закономерностям.
2.3. Источники статистической информации
Статистика изучает влияние природных и технических факторов на изменение количественных характеристик социально-экономических явлений и влияние жизнедеятельности общества на среду обитания.
Свой предмет статистика исследует при помощи определенных категорий, т. е. понятий, которые отражают наиболее общие и существенные свойства, признаки, связи и отношения предметов и явлений объективного мира.
Статистика пытается найти лаконичное и более точное решение следующих задач:
Правильное определение содержания статистического показателя.
Разработка методологии подсчета и расчета статистического показателя.
В статистике используют несколько основных понятий.
Статистическая совокупность - это совокупность социально- экономических объектов или явлений общественной жизни, объединенных некой качественной основой, общей связью, но отличающихся друг от друга отдельными признаками.
Единица совокупности - это первичный элемент статистической совокупности, являющийся носителем признаков подлежащих регистрации и основной ведущегося при обследовании счета, т. е. та первичная ячейка, от которой должны быть получены необходимые статистические сведения.
Единица наблюдения - это первичный элемент объекта статистического наблюдения, являющийся носителем признаков, подлежащих регистрации, и основой ведущегося при обследовании счета.
Например: При определении объема розничного товарооборота единицей совокупности будут счет фактуры, а торговые предприятия - единицами наблюдения.
Атрибутивные
Признак - это качественная особенность единицы совокупности, характерное свойство изучаемого явления (схема 1).
Признаки
Количественные Альтернативные
Схема 1. Разделение статистических признаков на группы.
Количественная группа признаков - признаки этой группы принимают непосредственное количественное выражение, при этом количественные признаки могут выражаться только целыми числами (число человек проживающих на определенной площади, количество комнат в квартире и т д.).
Альтернативные группа признаков - признаки этой группы выражают характер колеблемости сгруппированных рядов (например: поставка товара в магазин может быть качественной и некачественной), имеют множество количественных значений (размер торговой площади: высота, ширина, длина).
Атрибутивные признаки - эта группа признаков, которые не имеют количественного выражения (профессия, образование и т. д.). 5. Статистический показатель - это понятие, отображающее количественные характеристики соотношения признаков общественных явлений. Например: индекс, показывающий соотношение товаров одной категории проданных в1998г. к товарам, той же категории, проданным в 1999 г.
Система статистических показателей - это совокупность статистических показателей, отражающая взаимосвязи, которые существуют между явлениями.
Объект наблюдения - социально-экономические явления и процессы, которые подлежат исследованию, или точные границы, в пределах которых будут регистрироваться статистические сведения.
Например: при переписи населения нужно точно установить, какое именно население подлежит регистрации (границы статистического исследования) - наличное, т. е. фактически живущее в данной местности в момент переписи, или постоянное, т. е. живущее в данной местности постоянно.
Субъект наблюдения - орган, который осуществляет наблюдение.
По мере отбора единиц в выборочную совокупность или по его завершении производится регистрация предусмотренных программой признаков. Итогом же является расчет обобщающих выборочных характеристик.
Целесообразно при обследовании объектов устанавливать ценз. Ценз - это ограничение, которому должны удовлетворять все объекты наблюдения.
Любое статистическое исследование необходимо начинать с подробного сбора информации об объекте наблюдения и постановки задачи, тем самым, прогнозируя результаты, которые будут получены после анализа собранной информации.
Например: при переписи населения города Томска в1999 году Вы не можете получить результат, численно приближающийся
к 6 000 000 000 000 человек, поскольку по опубликованным данным на 1999 год такое количество человек проживало на планете Земля в целом.
Программа наблюдения - это перечень вопросов, по которым собираются сведения, либо перечень признаков и показателей, подлежащих регистрации.
Принцип составления программы наблюдения:
Программа должна содержать только необходимые вопросы для данного статистического наблюдения. Чем обширнее проводимое исследование, тем короче должна быть программа.
В программу следует включать вопросы, на которые могут быть получены точные ответы.
Нельзя включать в программу вопросы способные вызвать подозрения в том, что полученная информация будет использована во вред опрашиваемым.
Программу нужно строить так, что бы ответами на одни вопросы можно было контролировать ответы на другие вопросы.
10 Время наблюдения - это время, к которому относятся данные собранной информации, оно должно быть четко определено.
Критической называют дату, по состоянию на которую составляют сведения.
Например: начало сбора информации. 11. Критическим моментом наблюдения выбирают полночь, момент окончания одних суток и начала других. Так, критическим моментом Всесоюзной переписи 1989 г. было 12 часов ночи с 12 на 13 января. Все сведения о каждом жителе страны фиксировались такими, какими они были по состоянию на данный момент. Умершие после 12 часов вносились в переписные листы, а родившиеся после 12 ночи учету не подлежали и в переписные листы не заносились.
Для выявления ошибочной информации в статистике используются разные виды вычислений.
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. На схеме 2 приведено разделение ошибок выборки на подгруппы.
Ошибки
выборки
Ошибки
Систематические Случайные Систематические Случайные
Схема 2. Подразделение ошибок выборки.
Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т. д.
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам, сотням и т. д.), и случайные, проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Ошибки репрезентативности также могут быть систематическими и случайными. Систематические ошибки репрезентативности возникают из -за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки — принцип случайности. Случайные ошибки репрезентативности означают, что, несмотря на принцип случайности отбора единиц, все же имеются расхождения между характеристиками выборочной генеральной совокупности.
Вопросы для самооценки.
Для того чтобы ответить на вопросы нужно внимательно прочесть и осмыслить темы №1,2, в которых были изложены основные понятия статистики. Проверьте, соответствуют ли ответы, которые Вы выбрали, ответам, указанным в конце пособия, если возникают ошибки, то необходимо перечитать пройденный материал или обратиться за помощью к преподавателю.
В высших учебных заведениях под статистикой понимают:
а) отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о самых различных явлениях общественной жизни;
б) цифровой материал, служащий для характеристики какой - либо области общественных явлений или территориального распределения показателя;
в) отрасль знания, особая научная дисциплина.
Предмет статистики определяется как:
а) изучение с количественной стороны массовых социально - экономических явлений.
б) сбор и публикация информации.
Выберите наиболее емкое определение задачи статистики:
а) разработка методологии подсчета и расчета статистического показателя, правильное определение содержания статистического показателя.
б) составление учетных формуляров и публикация данных массовых опросов.
в) оценивание производственных показателей.
Какому типу признаков относится такой показатель, как возраст человека (определяется, как количество прожитых лет):
а) альтернативный признак.
б) атрибутивный признак.
в) количественный признак.
При проведении статистического исследования, например, переписи населения РФ субъектом является:
а) органы государственной статистики РФ.
б) Министерство здравоохранения РФ.
в) Интервьюеры (люди переписывающие население).
На гуманитарном факультете ТПУ проводится статистическое исследование. Цель исследования - определить какое количество студентов имеют рейтинг не менее 50% от максимального, по итогам последней контрольной точки. Выберите из вопросов перечисленных ниже, соответствующие требованиям которые предъявляются при составлении программы наблюдения.
а) какое количество баллов Вы получили по математике, по итогам первой контрольной точки.
б) на каком курсе Вы обучаетесь.
в) сколько Вам лет.
г) какой напиток вы предпочитаете.
д) как ваша фамилия.
е) каков Ваш средний балл по всем предметам, по итогам последней контрольной точки.
Случайные ошибки репрезентативности это: а) ошибки, которые проявляются в различных направлениях, уравновешивают друг друга и лишь изредка дают заметный суммарный итог.
б) это ошибки, которые несмотря на принцип случайности отбора единиц, провоцируют расхождения между характеристиками выборочной и генеральной совокупности.
Ответы на вопросы смотрите в приложении 1. 2.4. Группировка и сводка статистических материалов
Собранный в процессе статистического наблюдения материал нуждается в обработке, сведении разрозненных данных воедино. Выделение тех или иных групп должно быть обоснованным, не формальным. Кроме итоговых и групповых показателей сводка дает основу для последующего анализа и выявления различного рода закономерностей.
По технике или способу выполнения сводка может быть ручной либо механизированной. Ручная сводка применяется в основном для небольших массивов данных. Начинается она с шифровки статистических формуляров (карточек). Затем формуляры определенным образом группируются и под- считываются их число и другие показатели. При механизированной сводке и больших объемах совокупности исходные данные могут сразу заноситься на машиночитаемые носители информации и полностью обрабатываться на ЭВМ. Изучаемые статистикой массовые явления и процессы протекают в качественно однородных совокупностях. Однако качественная однородность единиц, составляющих совокупность, не является навсегда и на все случаи заданным. Единицы, качественно однородные в одном отношении, оказываются разнородными в другом. Это позволяет делить статистическую совокупность на частные подсовокупности — использовать методы группировки.
Статистическая сводка - систематизация единичных фактов, позволяющая перейти к общим показателям, относящимся ко всей изучаемой совокупности объектов и ее частям, и осуществлять анализ и прогнозирование изучаемых явлений и процессов.
Статистическая отчетность - это официальный документ, в котором содержаться сведения о работе подотчетного объекта, занесенные в специальную форму (таблицу, карточку-вопросник и т. д.).
Первичный учет представляет собой регистрацию различных фактов, производимых по мере их свершения и, как правило, на первичном учетном документе. Примером может служить свидетельство о рождении ребенка.
Отчетность как форма статистического наблюдения основана на первичном учете, то есть на регистрации фактов при обследовании объекта наблюдения.
Группировка — это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности
группировка — это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.
Например: в томском политехническом университете обучается 12 000 студентов, но каждый из них обучается на определенном факультете. Именно объединение студентов по факультетам является одним из примеров группировки по определенному признаку. В этом примере признаком является принадлежность студента к какому-либо факультету, 13 факультетов - 13 групп
Особым видом группировок являются классификации, получившие широкое распространение в статистике. Устойчивое разграничение объектов выражается классификацией. Классификация - это как бы стандарт, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Классификация основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов и т. д.). Таким образом, классификация — это узаконенная, общепринятая, нормативная группировка.
Одной из важнейших задач статистики является применение уже имеющихся и нахождение универсальных методов группировки. Метод группировки основывается на двух категориях — группировочном признаке и интервале.
Группировочный признак — это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.
Классификация и группировка должны производиться на основание вполне распознаваемых признаков. При этом признаки могут носить как атрибутивный, так и количественный характер. Следует иметь в виду, что в ряде случаев классификация, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.
Интервал определяет количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака о группе. Интервалы бывают:
равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;
неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;
открытые, когда имеется только либо верхняя (например, ; 1 ]), либо нижняя граница (например, [1; +<х>));
закрытые, когда имеются и нижняя, и верхняя границы (например [1;5]).
Число групп тесно связано с объемом совокупности. Здесь нет строго научных приемов, позволяющих решать этот вопрос при любых взаимосвязях названных величин. Всякий раз эта задача решается с учетом конкретных обстоятельств. Однако при равенстве интервалов для ориентировки применяют формулу, предложенную американским ученым Стерджессом, с помощью
которой можно наметить число групп n при известном численности совокупности N:
n = 1 + 3,322 lg N, 1
где n -количество интервалов, N - численность совокупности.
При 200 единицах совокупности число групп определяется следующим образом:
1 + 3,322 lg200 = 9.
Зная размах колеблемости значений изучаемого признака во всей совокупности и намечаемое число групп, величина равного интервала i определяется по формуле
j — ЭС max ЭС min ^
n
где n - число групп, , - максимальное и минимальное значение признака соответственно.
Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования существующих зависимостей. Каждой из этих целей соответствует особый вид группировки. Типы группировок приведены в таблице 1.
Таблица 1.
Вид группировки |
Определение |
Условия применения и замечания |
Типологическая |
Решает задачу выявления частных характеристик социально- экономических типов |
Задача выделения типов сложна, потому что: 1) когда объекты принадлежат к общей совокупности появляются особенности, маскирующие различия между типами, 2) отдельные типы недостаточно четко отделены друг от друга, 3) объекты описываются, в действительности, очень большим количеством признаков. |
Структурная |
Описывает составные части совокупности или |
|
|
строение типов, дает возможность проанализировать структурные сдвиги. |
|
Аналитическая |
Позволяет оценивать связи между взаимодействующими признаками. |
|
Комбинированная |
Группы образуются по двум и более признакам, взятым в определенном сочетании. |
|
Простая |
Выполняется по одному признаку. |
Среди простых группировок особо выделяют ряды распределения — это группировка, в которой для характеристики групп применяется один показатель—численность группы. Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения. Ряды распределения, построенные по количественному признаку, называются вариационными рядами. |
Иерархическая |
Выполняется по двум и более признакам, при этом |
Когда строгой зависимости значений второго признака от первого не существует, то |
|
значения вто- |
группировка называет- |
|
рого признака |
ся неиерархической. |
|
определяются |
|
|
областью зна- |
|
|
чений перво- |
|
|
го. |
|
Вторичная |
Является результатом пе- регруппиров- ки ранее уже сгруппированного материала. |
|
Первичная |
Составляется на основе первичных данных. |
|
Многомер- |
Производится |
Частным случаем мно- |
ная |
по двум и бо- |
гомерной группировки |
|
лее призна- |
является комбинацион- |
|
кам. |
ная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации. |
Статиче- |
Дает характе- |
|
ская |
ристику совокупности на определенный момент времени, за определенный период. |
|
Динамиче- |
Показывает |
Количество переходов, |
ская |
переходы |
рисующие внутреннюю |
|
единиц из од- |
динамику совокупно- |
|
них групп в |
сти, удобно распола |
|
другие. |
гать в "шахматную" таблицу, которую называют матрицей перехода. |
При проведении группировки решают следующие задачи:
выделение группировочного признака;
определение числа групп и величины интервалов;
описание правил комбинирования признаков, если их несколько;
установление показателей, которыми должны характеризоваться группы, т. е. сказуемого группировки.
Рассмотрим методологические вопросы построения различных видов группировок.
По способу формирования типологических групп различают:
способ последовательных разбиений, заключающийся в формировании таких групп, в которых все объекты имеют одинаковые значения классификационных признаков;
способ многомерной классификации. В этом случае объекты, образующие группы, могут иметь различные значения классификационных признаков.
Первый способ является исторически более ранним. Он включает в себя два метода. Во-первых, это типичный для него метод комбинационной группировки, при которой формирование групп производится путем последовательного разбиения сначала всей совокупности по одному признаку, затем полученных [х частей — по другому] и т. д., причем строго соблюдается принцип иерархии групп. Во-вторых, это многошаговый метод последовательных разбиений совокупности. Способ многомерной классификации, когда группы формируются на основе близости объектов одновременно по большому числу признаков, получил широкое применение с разработкой методов распознавания образов и появлением ЭВМ.
При использовании методов комбинационной группировки классификация осуществляется путем последовательного логического деления совокупности по отдельным признакам, Очередность этапов здесь такова,
наметка типов;
выбор группировочного признака (признаков);
определение числа групп и величины интервалов;
сведение выделенных групп в типы;
характеристика типов с помощью системы показателей.
Наметка типов производится с помощью качественного теоретического анализа. Предварительно намечают столько типов, сколько их может быть в данной совокупности теоретически (хотя фактически возможно меньшее их число).
При выборе группировочного признака необходимо учитывать два условия. Во-первых, типологическая группировка должна выполняться только по существенным признакам. Теоретически следует охватить все существенные признаки, однако при таком подходе получается излишнее дробление совокупности. Группы оказываются малы по объему и не пригодны для статистического анализа. Поэтому рекомендуется проводить группировку по двум-трём главным признакам, взятым в комбинации. Во-вторых, при необходимости для характеристики разных типов выбираются различные признаки, т. е. осуществляется специализация признака. Например, для выделения типов населения по размеру среднегодового дохода будет выступать признак: min размер годового дохода. Далее же количественные признаки: min размер среднемесячной заработной платы, дивиденды получаемые по акциям, доход полученный из других источников.
На различных этапах формирования типологической группировки число групп неодинаково. По ее завершение оно соответствует фактическому числу выделенных типов.
В случае количественного группировочного признака необходимо определять величину интервалов. Интервалы задают критические точки перехода одного качества в другое. При построении типологической группировки интервалы должны быть неравными и специализированными. Специализация интервалов означает, что разным значениям одного признака соответствуют разные значения другого.
В ходе научных исследований обнаружилось, что принципы чистой логики, лежащие в основе метода комбинационной группировки, часто бывает нелегко применять к эмпирическому (практическому) материалу. Это в основе обусловило необходимость разработки новых принципов группировки, отличных от традиционных.
Сущность этих новых принципов, лежащих многомерной классификации, состоит в следующем. Классификация объектов производится не последовательно по отдельным признакам, а одновременно по большому числу признаков. Этот фиксированный набор признаков образует так называемое пространство признаков, а каждому признаку придается смысл координаты. Если задано т существенных признаков совокупности, то любой объект рассматривается как точка в m-мерном пространстве признаков и задача классификации сводится к выделению сгущений объектов в этом пространстве. Для этого используются разные алгоритмы, но всегда группы (типы, классы) формируются на основании близости объектов по комплексу признаков.
Например. Как известно, любая социальная группа имеет свою классификацию материальных ценностей. Допустим, что в некотором обществе преобладает тенденция характеристики материального благосостояния человека по двум признакам: а) величина годового дохода; б) цена страхового полиса. Ответим на вопрос, по графику (рис. 1), какое количество человек принадлежит к среднему классу, к богатым людям, сверхбогатым, к бедным. Пусть количество человек в данном обществе равно = 6. В соответствии с вышеуказанным определением получим график, где m = 2. Координаты точек характеризуют материальное благосостояние каждого из членов общества. По скоплению точек, т. е. по размеру расстояния между ними и определению его min и max интервала можно ответить на вопрос задачи (рис. 1).
Решение: 5,6 человек относятся к малообеспеченному классу, поскольку расположены наиболее близко к оси X и Y и друг к другу; соответственно 4,1 -ый человек принадлежит к классу богатых, поскольку величины 1 и 2 у него выше, 3 - ий принадлежит к классу сверхбогачей, поскольку имеет максимальный доход. По этому методу можно проводить и более глубокий анализ, если размерность пространства будет увеличена.
Следовательно, главное преимущество методов многомерной группировки заключается в том, что они позволяют с той или иной степенью приближения
выделить реально существующие в признаковом пространстве скопления точек - объектов.
Реализация методов последовательного разбиения возможна и без применения вычислительной техники, в то время как методы многомерной группировки в связи с трудоемкостью расчетов требуют использования ЭВМ, почему их часто называют методами автоматической классификации. Цели этих двух способов совпадают, основное же различие состоит в том, что при автоматической классификации исследователь лишь указывает направление поиска (заданием набора признаков, имеющих отношение к цели классификации), но отказывается на данном этапе от самостоятельного формирования классов.
3
.+
5 + 6
Hi
40
4
50
20l 100
I; I М I; I I I I I I I I I .
0 1 2 3 4 5 6 7 8 9 10 11 12 13 (б) в т. руб.
Рис. 1. Скопление точек в пространстве признаков при m = 2.
Выбор одного из указанных способов классификации во многом определяется характером признаков, составляющих описание объекта. Если преобладают качественные признаки, их не очень много и априори известно, что они неравнозначны с точки зрения цели классификации, то целесообразнее использовать способ последовательного разбиения. При наличии большого числа примерно равнозначных признаков, особенно если это признаки количественные, а вопрос иерархии признаков и групп не столь важен, следует ориентироваться на многомерную классификацию.
Статистические таблицы являются средством наглядного выражения результатов исследования. Значение таблиц определяется тем, что они позволяют изолированные статистические данные рассматривать совместно, достаточно полно и точно охватывая сложную природу явлений. Любая статистическая таблица представляет собой наглядное изложение статистических данных о явлениях и процессах, изучаемых статистикой.
Если из статистической таблицы изъять все слова и цифры, то получится графленая сетка. Вертикальные столбцы ее называются графами, а горизонтальные строками. Следовательно, внешне таблица представляет собой перечень граф и строк. Если записать заголовки граф и строк — это будет макет таблицы.
Составление макетов таблиц — важное направление обработки статистических материалов. Для того чтобы получилось полная таблица, достаточно внести данные статистической сводки в пересечение каждой строки и графы.
Статистическая таблица, подобно предложению в грамматике, имеет подлежащее и сказуемое. Подлежащее таблицы — это перечень единиц совокупности или группы, т. е. объект изучении. Сказуемым таблицы являются цифровые данные, характеризующие подлежащее. Обычно подлежащее располагается слева в виде названий строк, сказуемое — сверху в виде названий граф
Сказуемое Подлежащее |
Заголовки граф |
|
|
|
1 2 3 4 5 |
Перечень единиц совокупн |
|
Рис. 2. Макет статистической таблицы.
По построению подлежащего таблицы могут быть:
простыми,
групповыми,
ком бинационными.
Простой называется такая статистическая таблица, в подлежащем которой нет группировок. Простые таблицы бывают:
перечневые (подлежащее — перечень единиц, составляющих объект изучения);
территориальные (дается перечень территорий, стран, областей, городов и пр.);
хронологические (в подлежащем приводятся периоды времени или даты). Групповыми называются таблицы, в подлежащем которых изучаемый объект разделен на группы по какому-либо признаку.
Комбинационной таблицей называется такая, где в подлежащем дана группировка единиц совокупности по двум и более признакам, взятым в комбинации.
Таблицы различаются и по разработке сказуемого, которая может быть простой и сложной. Простая разработка сказуемого предусматривает параллельное расположение показателей, а сложная—комбинированное. Например, при простой разработке сказуемого могут быть сначала приведены графы, содержащие данные о распределении населения по полу или по уровню образования. При сложной разработке сказуемого — в каждой графе уровню образования приводятся данные о численности мужчин, женщин и итоговые в виде отдельных граф.
Практикой выработаны определенные требования к оставлению и оформлению таблиц.
Таблица по возможности должна быть краткой.
Каждая таблица должна иметь подробное название, из которого становится известно: а) какой круг вопросов излагает и иллюстрируется таблица; б) каковы географические границы статистической совокупности; в) каков период времени, за который приведены данные; г) каковы единицы измерения.
В таблице желательно давать нумерацию граф. Это облегчает пользование таблицей, дает возможность лучше ориентироваться, показывает способ расчета цифр в графах. Первые графы, содержащие подлежащее, обозначаются заглавными буквами алфавита; графы, содержащие сказуемое, нумеруются арабскими цифрами. Заглавия строк подлежащего и граф сказуемого должны быть сформулированы кратко, точно и ясно. Все слова в заголовках подлежащего и сказуемого таблицы записываются по возможности полностью. Заголовки граф следует сформулировать так, чтобы были ясны смысл данной величины и порядок ее расчета
Приводимые в подлежащем и сказуемом признаки должны быть расположены в логическом порядке, с учетом необходимости рассматривать их совместно. Обычный принцип размещения от частного к общему, т. е. сначала показывают слагаемые, а в конце подводят итоги (если это необходимо). Когда приводятся не все слагаемые, а лишь наиболее важные из них, применяется противоположный принцип, сначала показывают общие итоги, а затем выделяют наиболее важные части. Следует различать "Итого" и "Всего". "Итого" является итогом для определенной части совокупности, а "Всего" — итог для совокупности в целом.
Таблица может сопровождаться примечаниями, в которых указываются источники данных, более подробно раскрывает— содержание показателей, даются и другие пояснения, а также оговорки в случае, если таблица содержит данные, полученные в результате вычислений.
Современную науку невозможно представить себе без применения графических методов, настолько прочно вошли они в арсенал средств научного общения и в методику научного исследования.
Особое место графические методы занимают в статистике и экономике, поскольку эти науки имеют дело с большими комплексами цифр, сведенными в громоздкие таблицы. В этом случае графические методы помогают, прежде всего, описанию, а затем и анализу этих данных. С помощью графиков легко выявить и наглядно представить закономерности, которые часто трудно бывает уловить в сложных статистических таблицах. При этом используются различные графики, многообразие видов которых обусловлено различиями в их статистическом содержании, способах построения и широтой круга изображаемых ими общественных явлений и процессов.
Графиками в статистике называются условные изображения числовых величин и их соотношений в виде различных геометрических образов — точек, линий, плоских фигур и так далее. Использование графиков для изложения статистических показателей позволяет придать последним наглядность и выразительность, облегчить их восприятие, а во многих случаях помогает уяснить сущность изучаемого явления, его закономерности и особенности, увидеть тенденции его развития, взаимосвязь характеризующих его показателей.
Каждый график состоит из графического образа и вспомогательных элементов. Графический образ — это совокупность точек, линий и фигур, с помощью которых изображаются статистические данные. Эти знаки образуют собственно языковую ткань графика и его основу.
Вспомогательными элементами графика являются:
поле графика — то пространство, в котором размещаются образующие график геометрические знаки. Поле графика характеризуется его форматом, т. е. размером и пропорциями (соотношением сторон);
пространственные ориентиры, определяющие расположение геометрических знаков в поле графика. Пространственные ориентиры задаются системой координатных сеток или контурных линий, которые делят это поле на части. В большинстве случаев в статистических графиках применяется система прямоугольных (декартовых) координат, но нередко встречаются и круговые графики, построенные по принципу полярных координат;
масштабные ориентиры, придающие геометрическим знакам количественную определенность. Масштабные ориентиры определяются системой масштабных шкал или масштабными специальными знаками. Масштабные шкалы применяются в координатных статистических графиках. Эти шкалы представляют собой геометрическое место, помеченное точками, а носителями их являются оси координат, на которых эти отметки располагаются. Масштабные знаки используются преимущественно для статистических карт;
экспликация графика, состоит из объяснения:
а) предмета, изображаемого на графике (его названия), и б) смыслового значения каждого знака, применяемого на данном графике. Без экспликации
график нельзя прочитать и понять. Название графика должно кратко и точно раскрывать его содержание. Пояснительные тексты могут располагаться в пределах графического образа рядом с ним (ярлыки), а также выносится за его пределы.
Статистические графики можно классифицировать по разным признакам: назначению (содержанию), способу построения и характеру графического образа.
Рис.
3б Столбиковая диаграмма.
По способу построения графики можно разделить на диаграммы (3а, 3б) и картограммы.
Рис. 3а Круговая диаграмма.
По характеру графического образа различают графики точечные, линейные, плоскостные столбиковые, почасовые, квадратные (круговые, секторные, фигурные и объемные).
Рассмотрим правила построения столбиковой диаграммы (рис. 4б), которая используется чаще всего для сравнения одноименных показателей, характеризующих различные объекты или территории. Значения сравниваемых показателей изображаются при этом в виде прямоугольных столбиков, имеющих одинаковую ширину и расположенных на общей горизонтальной или вертикальной базовой линии. Высота (или длина) каждого столбика в определенном масштабе соответствует величине изображаемого показателя. Столбики могут располагаться вплотную, либо на одинаковом расстоянии друг от друга.
Иногда сравниваемые объекты характеризуются резко разнящимися значениями показателей. Иногда используют особые виды плоскостных диаграмм —квадратные или круговые. Их построение основано на том, что величины изображаемых показателей должны быть пропорциональны площадям квадратов или кругов, а корни квадратные из сравниваемых величин — линейным размерам этих фигур (сторонам квадратов или радиусам кругов).
Основной формой структурных диаграмм являются секторные диаграммы. Работающим геометрическим параметром в секторной диаграмме удельных
весов служит величина угла между радиусами: 1 % принимается на диаграмме равным 3, 6°. а сумма всех углов, составляющая 360, приравнивается к 100 % (рис. 4а).
Возможности применения секторных диаграмм ограничены двумя обстоятельствами. Первое заключается в том, что они сохраняют свою выразительность при делении совокупностей на небольшое число частей - не более 4-5, а за этими пределами их применение становится малоэффективным. Второе - секторная диаграмма выглядит убедительно лишь при существенных различиях сравниваемых структур, в противном случае она оказываете недостаточно выразительной.
Другой формой - структурных статистических диаграмм являются полосовые диаграммы удельных весов.
Фигурные диаграммы сравнения предназначены в основном для целей популяризации. Показатели в них вычерчиваются в виде определенного количества стандартных фигур, представляющих собой упрощенные изображения объектов, характерных для соответствующих явлений. Недостатком их следует считать некоторую неточность, связанную с необходимостью округления изображаемых показателей.
Для изображения экономических явлений, протекающих во времени, применяют динамические диаграммы, В отличие от диаграмм, отображающих сравнительные величины отдельных объектов или их структуры, в динамических диаграммах объектом отображения служат процессы.
Геометрически адекватной формой их отражения являются линейные координатные диаграммы. Геометрическими знаками-символами на таких диаграммах служат точки и последовательно соединяющие их прямые линии, складывающиеся в ломаные кривые, конфигурация которых дает представление об изображаемом процессе. Ось абсцисс является в такой диаграмме осью времени с равномерно размещёнными отметками, а ось ординат — осью значений, которые принимает с течением времени изучаемый показатель. По отметкам обеих шкал определяют местоположение точек в координатном поле диаграммы, а последовательно их соединяя, находят кривую динамики изображаемого на диаграмме показателя. Конфигурация каждой кривой на динамической диаграмме отражает процесс изменения во времени описываемого на диаграмме показателя, а именно: движение кривой с ходом времени вправо и вверх означает рост показателя, а движение ее вправо и вниз - его падение.
Вопросы для самооценки.
Статистическая сводка это:
а) систематизация единичных фактов, позволяющая перейти к обобщающим показателям, для прогнозирования развития явления во времени
б) занесение в формуляр (таблицу или вопросник) полученных ответов.
Первичный учет представляет собой следующее:
а) регистрацию фактов.
б) сопоставление фактов. в) подсчет общих показателей
Метод группировок в статистике основывается:
а) на определение группировочного признака и интервала.
б) на определение стандарта признака, по которому проводится группировка.
в) на установление ценза при проведении статистического исследования.
Интервал (1,5) является:
а) открытым.
б) закрытым.
Определите количество равных интервалов (по формуле Стерджессом), если объем совокупности равен 10.
I/, 39
М = у , • fM. /V/,, 1 1 1 47
I/, 48
X/, 51
X/, 51
X/, 51
s = — > 30 71
Статистические таблицы являются:
а) средством наглядного выражения результатов исследования.
б) аналитическим отчетом за определенный период.
Круговая диаграмма используется, если:
а) групп данных много (больше 10).
б) групп данных не много (меньше 5).
в) имеются полуоткрытые группы (не определены точные границы группы, некоторые элементы могут входить как в одну, так и в другую группу).
Выберите из предложенных вариантов тот, который соответствует подлежащему простой территориальной таблицы:
а) подлежащим таблицы являются города томской области,
б) подлежащим таблицы являются прибыль предприятия за 19981999 год.
При рассмотрении графика Вы понимаете под экспликацией графика:
а) название графика и пояснения к графическому образу,
б) пространственные ориентиры,
в) поле графика.
Ответы на вопросы смотрите в приложении 1.