Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTVETY_PO_SPSS.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.19 Mб
Скачать

13. Меры разброса.

Основными показателями, характеризующими вариацию, являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации. R=Xmax-Xmin=22,83-22,40=0,43 руб. Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия – это мера вариации значений признака в среднем и вокруг средней арифметической. Фактически это сумма квадратов остатков, деленная на число наблюдений.

Для того чтобы вычислить значение дисперсии, надо вычесть из каждого наблюдаемого значения среднее, возвести в квадрат все полученные отклонения, сложить квадраты отклонений и разделить полученную сумму на n:

где хкаждое наблюдаемое значение признака;

х (с черточкой сверху) – среднее арифметическое значение признака (переменной х);

n – количество наблюдений.

Чтобы сделать соответствующую точечную оценку дисперсии несмещенной, величина объема выборки в знаменателе уменьшается на 1.

где хi – каждое наблюдаемое значение признака;

х (с черточкой сверху) – среднее арифметическое значение признака (переменной х);

n – количество наблюдений.

В зависимости от того, насколько велика (мала) дисперсия, или среднеквадратическое отклонение, мы можем судить, насколько единодушны были в своих оценках респонденты (при меньшем значении дисперсии), или насколько сильно они расходятся в своих мнениях (при большем значении дисперсии).

Недостатком дисперсии является то, что это величина безразмерная. Мы можем понять размер доходов и единицы измерения остатков, но в данном случае дисперсия равна 4 000 000. Вряд ли можно сказать большая это величина или маленькая. Кроме того, данное значение не позволяет определить качество модели среднего, поскольку в формуле расчета дисперсии остатки берутся в квадрате.

Для того чтобы преодолеть эти трудности, существуют два производных от дисперсии показателя –

стандартное (среднеквадратичное) отклонение и

стандартная ошибка среднего.

Стандартное отклонение – это корень квадратный из дисперсии:

где хi – каждое наблюдаемое значение признака;

х (с черточкой сверху)– среднее арифметическое значение признака (переменной х);

n – количество наблюдений.

ДЛЯ ВЫЧИСЛЕНИЯ СТАНДАРТНОЙ ОШИБКИ СРЕДНЕГО НАМ НУЖНО РАЗДЕЛИТЬ СР.КВАДР.ОТКЛОНЕНИЕ НА КОРЕНЬ ИЗ РАЗМЕРА ГЕН.СОВОКУПНОСТИ

Очевидной интерпретацией стандартного отклонения является его способность оценивать «типичность» среднего: тем меньше, чем лучше среднее представляет совокупность.

Зная значение среднеквадратического отклонения, можно сравнивать меры рассеяния разных признаков или одного признака для различных совокупностей. Прямое сравнение дисперсий и среднеквадратических отклонений без сопоставления со средними арифметическими является бессмысленным.

Коэффициент вариации определяется просто как процент наблюдений, лежащих вне модального интервала, т. е. процент (доля) наблюдений, не совпадающих с модальным значением. Например, если от модального отличаются 60% значений, то V=60% (или V=0,6).

Коэффициент вариации используют для сравнения рассеивания двух и более признаков, имеющих различные единицы измерения. Коэффициент вариации представляет собой относительную меру рассеивания, выраженную в процентах. Он вычисляется по формуле:

,

где   - искомый показатель,  - среднее квадратичное отклонение,  - средняя величина.

 

Наряду со стандартным отклонением для оценки разброса используется и стандартная ошибка среднего. Основной причиной ее активного использования является то, что в интервале (среднее значение) ± две стандартных ошибки среднего должно находиться 95 % от числа всех значений анализируемой переменой.

Так, например, по результатам исследования мы выяснили, что средний доход респондентов равен 3 275 руб., значение стандартной ошибки среднего составило 132 руб.

Следовательно, можно говорить, что не менее 95 % всех значений дохода, указанных респондентами, должно лежать в интервале 3 275±2*132, т.е. от 3 011 до 3 539 руб.

Наиболее распространенным показателем, характеризующим разброс значений порядковой переменной, является квартильное отклонение.

Для того чтобы понять его смысл, надо уточнить понятие квартиля. Если медиана делит всю совокупность опрошенных на две части – те, кто отметил градации меньше или равно этой точки, и те, кто отметил градации больше этой точки.

Квартильное разбиение делит всех респондентов на 4 части. Так, 1 квартиль – это значение переменной, меньше которой ответили 25 % респондентов, 2-й квартиль – это медиана, 3-й квартиль – точка, меньше которой ответили 75 %.

Квартильное отклонение – это разница между 1-м и 3-м квартилями. В данном случае отклонение составляет 3. При том, что переменная насчитывает 7 градаций, квартильное отклонение, равное 3, может рассматриваться как достаточно большое. Следовательно, модель средней тенденции не очень хорошо отражает поведение нашей переменной, т.к. много респондентов имеют значения, отличающиеся от медианы.

Кроме того, можно производить разбиение совокупности значений на любое количество равных частей. 5 частей – квинтельное разбиение, 10 частей – децильное разбиение.

Применительно к ним можно использовать и такие меры разброса, как квинтельное отношение или децильное отношение.

Децильное отношение – это отношение границы 10-го дециля к границе 1-го дециля. Данный показатель демонстрирует то, насколько больше получают 10 % высокооплачиваемых респондентов в сравнении с 10 % наименее оплачиваемых. Данное отношение в нашем примере составляет 4, что показывает степень неоднородности доходов.

Вычисление статистик при помощи SPSS. Для вычисления основных статистик при помощи SPSS надо воспользоваться следующими командами: Анализ →Описательные статистики → Частоты Статистики.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]