Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лисицын 2013_1 / Глава 2.doc
Скачиваний:
259
Добавлен:
20.05.2015
Размер:
243.2 Кб
Скачать

2.3. Типизация данных и проверка на ошибки

Цель большинства исследований - собрать данные об объекте исследования, которые характеризуются признаками, способными изменяться. Все данные, полученные при изучении признаков, можно разделить на 2 основных типа: качественные и количественные. От этой типологии признаков во многом зависит выбор методов исследования. Основные типы данных представлены на рис. 2.1.

Перед группировкой данные проверяют на ошибки. На 2-м этапе исследования могут возникнуть ошибки при переписывании или вводе данных в компьютер или таблицы. Существует несколько методов, позволяющих свести ошибки на этом этапе до минимума.

Прежде всего для проверки всего собранного материала с точки зрения правильности и полноты ответов на все вопросы анкет, регистрационных бланков и т. д. (там, где можно) вносят дополнения и уточнения. Карты, по которым оказалось невозможным полно и точно ответить на все вопросы, исключают из разработки.

Чтобы избежать опечаток при вводе данных, можно ввести их в компьютер или таблицу дважды и затем сравнить данные.

Числовые данные можно проверить по размаху, задав верхние и нижние ограничения для каждой переменной. Если величина переменной находится вне интервала, ее не нужно использовать при дальнейшем анализе.

Рис. 2.1. Различные типы переменных (схема)

Необходимо учитывать, что при исследовании могут быть также получены подлинные данные, которые экстремально отличаются от других величин переменной, - они называются выбросами. Просто исключить выбросы из исследования нельзя, необходимо использовать специальные методы, при которых влияние выбросов на результаты исследования будет скорректировано.

После ввода данных в компьютер необходимо представить их таким образом, чтобы можно было "ощутить" их. Для этого составляют диаграммы, таблицы или статистические сводки. Этот простейший способ обобщения данных необходимо провести до этапа их анализа.

2.4. Группировка данных и составление таблиц

Группировка данных - это разделение единиц изучаемой совокупности на качественно однородные группы по значению одного или нескольких признаков. Группировку на основе типов (качественных значений) признаков называют типологической; ее разновидность -классификацией. Например, жителей РФ можно классифицировать по качественному признаку - полу на 2 группы: женщины и мужчины; это будет основание группировки, этот выбранный признак будет называться группировочным (табл. 2.1, А). Затем для каждой группы необходимо проставить ее численность в абсолютных величинах - это будет варьирующее значение признака. Число группировок в основании определяется числом значений, которое может принимать выбранный признак. В данном примере этих значений - 2.

Таблица 2.1. Различные виды группировок и типы таблиц

Группировать можно и по какому-либо количественному признаку, например по возрастным группам населения в стране (это будет основание группировки). Затем исследовать частоту заболеваемости и смертности (т.е. число случаев) в год в каждой из возрастных групп. Число случаев заболеваний в каждой группе - это варьирующий признак (табл. 2.1, Б). Такая группировка называется структурной, она предназначена для характеристики состава однородной совокупности. Если общую частоту заболеваний принять за 100%, можно проставить не абсолютные значения варьирующего признака, а относительные (о вычислении относительных показателей см. далее); это необходимо для проведения сравнений.

Аналитическая группировка - это группировка по факторному признаку, например, регионы страны группируются по значению валового регионально продукта (ВРП), и каждая группа характеризуется средними величинами одного или нескольких признаков: средним значением смертности, средним значением расходов на здравоохранение в доле валового внутреннего продукта (ВВП) или средним значением заработной платы. Такая группировка необходима для изучения взаимосвязи между явлениями (см. раздел 10.1.4).

Число групп в группировке, в основании которой лежит количественный признак, зависит от степени вариации этого группировочного признака: чем она больше, тем больше групп можно образовать. Для определения числа групп существуют специальные формулы. Более подробно об определении числа групп и интервалах между ними см. раздел 2.5, где описана методика построения статистических рядов распределения.

Принципы группировки нужно разработать на 1-м этапе исследования, а заполнить на 2-м этапе. Сгруппированные данные представляют в виде таблиц или графически.

Статистические таблицы

Статистическая таблица - наиболее удобный вид статистической группировки материала. Таблица должна иметь четкое и краткое название, отражающее ее содержание. Название пишут над таблицей (в отличие от рисунка, подпись под которым должна быть внизу).

В таблице, как в грамматическом предложении, различают статистическое подлежащее и сказуемое. Подлежащее - это основной признак изучаемого явления (объект исследования); оно располагается, как правило, по горизонтальным строкам таблицы (основание группировки). Статистическое сказуемое (одно или несколько) - это то, что характеризует статистическое подлежащее; оно располагается в вертикальных графах (варьирующий признак). Оформление таблицы должно заканчиваться итогами по графам (последняя строка по горизонтали - "Итого") и по строкам (последняя графа по вертикали - "Всего"). Они нужны для расчета соответствующих показателей в последующем.

Таблицы бывают простыми, групповыми и комбинационными. В простых таблицах подлежащее (объект исследования) простое - перечень признаков, например пол граждан РФ (см. табл. 2.1, А), в групповой таблице подлежащее подразделяется на группы по какому-либо признаку, например возрастные группы населения (см. табл. 2.1, Б). В комбинационных таблицах подлежащее подразделяется по группам на 2 признака или более, например, возрастные группы населения, разделенные по полу.

Если изучается только один варьирующий признак у таблицы, соответственно только одно сказуемое - это простая разработка сказуемого. Если изучаются несколько признаков и у таблицы 2-3 сказуемых и более, - это сложная разработка сказуемого, что расширяет возможности анализа (см. рис. 2.1, Б).

В таблицах не должно оставаться пустых граф: в случае отсутствия данных ставят ноль; если величину не измеряли - прочерк. Затем для "первичного" анализа строят вариационные ряды, и данные представляют графически, затем описывают и обобщают данные с помощью расчета статистических показателей.

Соседние файлы в папке Лисицын 2013_1