Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2_semestr / статистика / Statistika_lekcii.doc
Скачиваний:
34
Добавлен:
15.04.2015
Размер:
1.09 Mб
Скачать

4. Многомерные группировки

Многомерная группировка - это группировка, которая построена не по иерархическому признаку, метод для ее построения называется кластерным анализом. Единицы совокупности в кластерном анализе представляются точками в m мерном пространстве признаков:

Евклидово расстояние между объектами рассчитывается по формуле: i - номер признака; j и l - номера классов. Признаки в этом случае делятся на среднеквадратичные отклонения σ, а также можно учитывать вес признака w, тогда формула для расчета евклидового расстояния примет вид: . Алгоритм кластерного анализа работает следующим образом: рассчитывается матрица евклидова расстояния и выбирается минимальное расстояние. Объекты с минимальными расстояниями объединяются в один класс, которому присваивается номер - наименьший номер соответствующего объекта. Координаты нового объекта рассчитываются как центр тяжести объединяемых объектов. Процесс продолжается до тех пор, пока не останется один класс. После этого строится дендрограмма, по оси ординат откладывается расстояние между объектами, по оси абсцисс номера кластеров.

5. Ряды распределения

Ряд распределения - это упорядоченное распределение единиц совокупности на группы по какому либо варьирующему признаку. Если происходит распределение по атрибутивному признаку, то ряды называются атрибутивными. Если по количественному признаку, то вариационными.

Элементы вариационного ряда:

  1. Варианта - это значение группировочного признака.

  2. Частота – показывает, как часто встречаются в ряду те или иные варианты.

  3. Частность - это относительная частота, измеряемая в долях или процентах.

Вариационные ряды делятся на

  • интервальные или непрерывными, в этом случае значения вариант задаются в виде интервалов;

  • дискретные ряды - вариантами являются целые числа или другие дискретные значения.

Графическое изображение интервального ряда называется гистограммой (рисуется в виде столбиков, где высота пропорциональна частоте). Графическое изображение дискретного ряда называется полигон (по оси абсцисс откладывается варианта). Графическое изображение накопленных частот называется кумулятой. Существует формула Стёржеса, согласно которой число интервалов , где- число единиц совокупности.

Тема №4: Средние величины и изучение вариации

        1. Однородность и вариация в массовых явлениях

        2. Средние величины

        3. Структурные характеристики вариационного ряда

        4. Показатели вариации

1. Однородность и вариация в массовых явлениях

Массовые явления обладают как общими для всей совокупности, так и индивидуальными свойствами. Различия между индивидуальными явлениями называется вариацией. Взаимодействие элементов совокупности ведет к ограничению вариации, хотя бы части их свойств. Эта тенденция обуславливает применением средних величин в теории и на практики. Замена множества индивидуальных значений признака средней величиной, характеризующей всю совокупность является обобщающая функция средней. При этом варианту можно представить следующим образом: Δxi, где xi- варианта, с - общность, которая характеризуется средними величинами, Δxi - индивидуальность, которая характеризуется показателями вариации.

Широкое применение средних объясняется тем, что они имеют ряд положительных свойств, делающих их незаменимыми в анализе явлений и процессов общественной жизни.

Соседние файлы в папке статистика