Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Posobie po socio Гипотезы.doc
Скачиваний:
4
Добавлен:
16.09.2019
Размер:
1.14 Mб
Скачать

Тема 5. Интервальная и пропорциональная шкала: способы измерения и анализа.

Измерения интервального и пропорционального уровня редко анализируются с помощью прямого указания частот или процентных отношений. В отличие от номинальных или ранговых измерений, значения переменных, измеряемых с помощью интервальных шкал, изменяются непрерывно, они представляют собой численные величины, а не сами по себе категории, поэтому может реально существовать такое большое число различных наблюдаемых значений, что частоты и процентные отношения не в состоянии эффективно просуммировать данные. В самом деле, при измерении такой переменной как возраст, мы можем получить набор значений, ни одно из которых не будет повторять другого (если в нашем выборочном массиве не окажется какого-то количества респондентов, чьи даты рождения совпадают день в день). При измерении доходов также трудно рассчитывать, что суммы доходов различных респондентов или их семей будут совпадать до рублей и копеек. По этой причине значения таких переменных и размещают в тех или иных интервалах, размеры которых определяются исследовательским замыслом.

Критериями центральной тенденции для интервального и пропорционального уровней измерений выступают мода, медиана и среднее арифметическое. Среднее арифметическое представляет собой сумму значений переменной, поделенную на число значений. Общая формула для ее вычисления алгебраически выглядит следующим образом:

Х= ∑Хi / N = (Х1 +Х2 + …Хi)/ N: (3.1)

где Хi – числовое значение i-й позиции,

N – Общее число наблюдений (объем выборки).

Это так называемая простая средняя арифметическая. Она вычисляется в том случае, когда группировка осуществляется по признаку, не имеющему собственных вариаций.

Рассмотрим вычисление средней арифметической величины на примере расчета средней посещаемости занятий в двух студенческих группах по данным проверок. Данные о посещаемости изложены в таблице 3.5. Сложив числа в правых колонках и разделив их на 4 (число проверок), мы получим, что средняя посещаемость занятий в группах составила:

Таблица 3.5

Посещаемость занятий студентами двух групп

Номер занятия

Число присутствующих

Группа «А» (N=20)

Группа «Б» (N=30)

1

18

15

2

20

23

3

20

10

4

18

28

в группе «А» Х =19, в группе «Б» Х =19. Понятно, что полученное число – 19 студентов – не может иметь реального физического смысла, оно пригодно лишь для сравнения между собой уровня посещаемости студентов двух и более групп. Однако, как видим, среднее может оказаться обманчивым показателем центральной тенденции, если в объеме выборочной совокупности среди значений интересующей нас переменной появится какая-то экстремальная величина. Другими словами, недостаток средней арифметической как характеристики опрашиваемых по некоторому признаку заключается в том, что она может скрывать за собой различную степень «разброса» значений, и тем самым затруднять качественное сравнение различных групп по данным характеристикам. Данные таблицы 3.4 свидетельствуют, что, несмотря на одинаковые значения средней, в группе «Б» этот показатель подчинен воздействию неких специфических факторов. В подобных случаях, чтобы измерить степень равномерности или неравномерности распределения интересующей исследователя характеристики опрашиваемых, используется формула вычисления степени разброса значений признака, называемого дисперсией и обозначаемого (сигма квадрат):

σ 2 = Ni ×( XiX)2 ;

N (3.2)

где N – общее число респондентов;

Ni – число респондентов, выделенных по i-й позиции;

Хi – числовое значение i-й позиции

Х – средняя арифметическая.

Значение дисперсии легче вычислять, предварительно представив отдельные элементы и их расчеты в таблице 3.6.

Таблица 3.6

Параметры для вычисления дисперсии

Посещаемость в группе «А»

Отклонение от средней

Квадратичное отклонение

Посещаемость в группе «Б»

Отклонение от средней

Квадратичное отклонение

18

18 – 19 = -1

1

15

15 - 19 = -4

16

20

20 - 19 =+1

1

23

23 – 19 =+4

16

20

20 – 19 =+1

1

10

10 – 19 = -9

81

18

18 – 19 = -1

1

28

28 – 19 =+9

81

Вычисляем дисперсию для обеих групп:

σ2 = (18х1 +20х1 +20х1 +18х) / (18+20+20+18) = 1 для группы «А»

σ2 = (15х16 +23х16 +10х81 +28х81) /(15+23+10+28) =48,5 для группы «Б»

Большему значению дисперсии соответствует больший разброс признака (в нашем случае – неравномерность посещения занятий). Таким образом, для вычисления дисперсии и среднеквадратического отклонения надо последовательно пройти семь шагов:

1) вычислить среднее;

2) вычислить разности между средним и каждым значением;

3) возвести в квадрат разности, вычисленные на этапе 2;

4) умножить квадраты разностей на частоты наблюдений каждого из значений;

5) просуммировать квадраты разностей, вычисленные на 4 этапе;

6) разделить сумму квадратов на N;

7) извлечь квадратный корень из числа, вычисленного на этапе 6.

Это будет среднеквадратичное отклонение. В том случае, если значения переменных измеряются не однозначно определенными числами (как в предыдущем примере), а изменяются вдоль непрерывного ряда значений, вместо средней арифметической рассчитывается средневзвешенная. Так, предположим, что нам требуется вычислить средний балл успеваемости респондентов, и распределение по баллам оказалось таким, как в таблице 3.7.

Таблица 3.7

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]