Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
рабочая книга социолога.rtf
Скачиваний:
20
Добавлен:
15.06.2014
Размер:
41.77 Mб
Скачать

Полигон распределения.

Для построения полигона величина при­знака откладывается на оси абсцисс, а частоты или относительные частоты — на оси ординат. Из точек, соответствующих значениям признака, восстанавливаются перпендикуляры, равные по высоте частотам. Вершины перпендикуляров соединяются прямыми ли­ниями.

Для интервального ряда ординаты, пропорциональные частоте (или относительной частоте) интервала, восстанавливаются перпен­дикулярно оси абсцисс в точке, соответствующей середине данного интервала.

Следующие данные распределения рабочих в возрасте до 24 лет по тарифным разрядам (высококвалифицированные рабочие сельхоз-машиностроения)1дают возможность построить полигон распределе­ния (рис. 2):

 

Условно принято крайние ординаты признака соединять с серединами примыкающих интервалов (на рис. 2 эти замыкающие линии нанесены пунктиром). Однако для распределения, где концентрация событий увеличивается на концах полигона, такое изображение мо­жет привести к ложным представлениям о существе явления.

Кумулята.

Для графического изображения вариационных рядов используются также кумулятивные кривые. При построении кумуляты, как и гистограммы, на оси абсцисс откладываются границы интервалов (либо значения дискретного признака), а на оси орди­нат — накопленные частоты (либо относительные частоты), соответ­ствующие верхним границам интервалов. Таким образом, отличие кумуляты от гистограммы в том, что на графике кумуляты столби­ки, пропорциональные частотам, последовательно накладываются один на другой, так что высота последнего столбика является сум­мой высот столбиков гистограммы.

Кумулята округляет индивидуальные значения признака в пре­делах интервала и представляет собой возрастающую ломаную линию.

Кумулята позволяет быстро определить процент лиц, находящихся ниже или выше заданной величины признака. Например, по данным табл. 3, процент семейств, в которых муж старше cyпруги не более чем на 5 лет, равен 65 (рис. 3, точка А).

 

Вид (форма) кривых распределений.

Кривые, полученные в результате графического представления эмпирических данных, могут иметь разнообразную форму. Среди них можно выделить относи­тельно небольшое количество простых типов, Некоторые возможные формы распределений приведены на рис. 4, Анализ формы кривых иногда помогает в выявлении внутренней, скрытой структуры ис­следуемой совокупности. Например, можно предположить, что фор­ма кривой обусловлена наложением двух кривых: а и б, иначе говоря, предположить, что существует третья скрытая переменная (или группа переменных), детерминирующая расчленение совокупности на две группы.

Существует множество конкретных примеров того, как графический анализ стимулирует дальнейшее развитие исследовательской мысли.

Теоретическое распределение.

Сбор эмпирической информации может быть осуществлен двумя путями: исследованием всей сово­купности социальных объектов, которые являются предметом изучения в пределах, очерченных программой социологического иссле­дования, и изучением лишь части этих объектов. В первом случае исследование называется сплошным, а множество социальных объектов — генеральной совокупностью, во втором исследование называется выборочным, а выделенная часть объектов — выборкой1.

Одна из основных задач статистики состоит в том, чтобы по данным выборки оценить параметры генеральной совокупности.

Гистограмма и полигон распределения, построенные на основу эмпирических данных выборки, позволяют выявить лишь

приближенную картину реального распределения в генеральной совокуп­ности.

При увеличении выборочной совокупности и все большем дроб­лении величины интервалов эмпирическое распределение в виде гистограммы или полигона все более приближается к некоторой кривой, называемой кривой распределения.

Если группировочный признак является непрерывной величиной, тo в предельном случае при, постепенном уменьшении величины интервала полигону и гистограмме будет соответствовать некоторая гладкая кривая (рис. 5).

Эта кривая распределения, являющаяся предельным случаем полигона данного эмпирического распределения, называется по установившейся терминологии кривой плотности распределения. Обозначим соответствующую функцию f(z).

В терминах теории вероятностей плотность распределения мож­но трактовать следующим образом: вероятность (р) того, что слу­чайная величина () примет значение из достаточно малого интер­вала (XiXi+1), равна произведению длины интервала на высоту пря­моугольника (f(xi)), т. е.

Для интервала произвольной длины суммированием этих значений получим, что

Отсюда приходим к определению фундаментального понятия теории вероятностей — функции распределения (F) случайной величины (), которая по определению есть

 

Знание функции распределения дает исчерпывающее представление о поведении совокупности в отношении изучаемого признака, поэто­му определение типа распределения признаков представляет одну из задач исследования массовых явлений.