
- •Самара Самарский государственный технический университет
- •Оглавление
- •Предисловие
- •Введение
- •Раздел 1. Стартовые шаги прикладного исследовательского проекта
- •Тема 1. Этапы прикладного исследования.
- •Тема 2. Формулировка и обоснование исследуемой проблемы
- •Тема 3. Цели и задачи исследования
- •Тема 4. Логический анализ и операционализация основных понятий и переменных.
- •Тема 5. Роль гипотез в прикладном исследовании.
- •Тема 6. Роль методического раздела программы
- •Раздел 2. Мероприятия, повышающие надежность исследования
- •Тема 1. Обоснование и характеристика методов выборки
- •Расчет объема выборочной совокупности
- •Тема 2. Логическая схема обработки и анализа информации
- •Тема 3. Предварительная обработка массива информации
- •Раздел 3. Основы анализа одномерных распределений в социологии
- •Тема 1. Общие принципы анализа
- •14. Вы работаете? Если да, то где?
- •19.Проявляете ли вы инициативу в процессе обучения в вузе, если существует возможность повышения оценки?
- •Словарь переменных для исследования
- •Тема 2. Типы шкал и правила их построения
- •Тема 3. Номинальная шкала: способы измерения и анализа
- •Тема 4. Способы измерения и анализа распределений ранговой шкалы
- •Взаимосвязь различных причин пропуска занятий и
- •Тема 5. Интервальная и пропорциональная шкала: способы измерения и анализа.
- •Оценка студентами своей успеваемости по
- •Раздел 4. Выявление связей между переменными
- •Тема 1. Табличное представление данных
- •Причины, мешающие повышению успеваемости
- •Причины, мешающие повышению успеваемости
- •Тема 2. Анализ двумерных распределений
- •Тема 3. Коэффициенты корреляции
- •Тема 4. Индексирование
- •Заключение
- •Библиографический список
- •Приложение
- •Интерпретация основных понятий.
- •Гипотезы исследования.
- •Формирование выборочной совокупности.
Тема 5. Интервальная и пропорциональная шкала: способы измерения и анализа.
Измерения интервального и пропорционального уровня редко анализируются с помощью прямого указания частот или процентных отношений. В отличие от номинальных или ранговых измерений, значения переменных, измеряемых с помощью интервальных шкал, изменяются непрерывно, они представляют собой численные величины, а не сами по себе категории, поэтому может реально существовать такое большое число различных наблюдаемых значений, что частоты и процентные отношения не в состоянии эффективно просуммировать данные. В самом деле, при измерении такой переменной как возраст, мы можем получить набор значений, ни одно из которых не будет повторять другого (если в нашем выборочном массиве не окажется какого-то количества респондентов, чьи даты рождения совпадают день в день). При измерении доходов также трудно рассчитывать, что суммы доходов различных респондентов или их семей будут совпадать до рублей и копеек. По этой причине значения таких переменных и размещают в тех или иных интервалах, размеры которых определяются исследовательским замыслом.
Критериями центральной тенденции для интервального и пропорционального уровней измерений выступают мода, медиана и среднее арифметическое. Среднее арифметическое представляет собой сумму значений переменной, поделенную на число значений. Общая формула для ее вычисления алгебраически выглядит следующим образом:
Х= ∑Хi / N = (Х1 +Х2 + …Хi)/ N: (3.1)
где Хi – числовое значение i-й позиции,
N – Общее число наблюдений (объем выборки).
Это так называемая простая средняя арифметическая. Она вычисляется в том случае, когда группировка осуществляется по признаку, не имеющему собственных вариаций.
Рассмотрим вычисление средней арифметической величины на примере расчета средней посещаемости занятий в двух студенческих группах по данным проверок. Данные о посещаемости изложены в таблице 3.5. Сложив числа в правых колонках и разделив их на 4 (число проверок), мы получим, что средняя посещаемость занятий в группах составила:
Таблица 3.5
Посещаемость занятий студентами двух групп
Номер занятия |
Число присутствующих |
|
Группа «А» (N=20) |
Группа «Б» (N=30) |
|
1 |
18 |
15 |
2 |
20 |
23 |
3 |
20 |
10 |
4 |
18 |
28 |
в группе «А» Х =19, в группе «Б» Х =19. Понятно, что полученное число – 19 студентов – не может иметь реального физического смысла, оно пригодно лишь для сравнения между собой уровня посещаемости студентов двух и более групп. Однако, как видим, среднее может оказаться обманчивым показателем центральной тенденции, если в объеме выборочной совокупности среди значений интересующей нас переменной появится какая-то экстремальная величина. Другими словами, недостаток средней арифметической как характеристики опрашиваемых по некоторому признаку заключается в том, что она может скрывать за собой различную степень «разброса» значений, и тем самым затруднять качественное сравнение различных групп по данным характеристикам. Данные таблицы 3.4 свидетельствуют, что, несмотря на одинаковые значения средней, в группе «Б» этот показатель подчинен воздействию неких специфических факторов. В подобных случаях, чтобы измерить степень равномерности или неравномерности распределения интересующей исследователя характеристики опрашиваемых, используется формула вычисления степени разброса значений признака, называемого дисперсией и обозначаемого (сигма квадрат):
σ 2 = ∑ Ni ×( Xi – X)2 ;
N (3.2)
где N – общее число респондентов;
Ni – число респондентов, выделенных по i-й позиции;
Хi – числовое значение i-й позиции
Х – средняя арифметическая.
Значение дисперсии легче вычислять, предварительно представив отдельные элементы и их расчеты в таблице 3.6.
Таблица 3.6
Параметры для вычисления дисперсии
Посещаемость в группе «А» |
Отклонение от средней |
Квадратичное отклонение |
Посещаемость в группе «Б» |
Отклонение от средней |
Квадратичное отклонение |
18 |
18 – 19 = -1 |
1 |
15 |
15 - 19 = -4 |
16 |
20 |
20 - 19 =+1 |
1 |
23 |
23 – 19 =+4 |
16 |
20 |
20 – 19 =+1 |
1 |
10 |
10 – 19 = -9 |
81 |
18 |
18 – 19 = -1 |
1 |
28 |
28 – 19 =+9 |
81 |
Вычисляем дисперсию для обеих групп:
σ2 = (18х1 +20х1 +20х1 +18х) / (18+20+20+18) = 1 для группы «А»
σ2 = (15х16 +23х16 +10х81 +28х81) /(15+23+10+28) =48,5 для группы «Б»
Большему значению дисперсии соответствует больший разброс признака (в нашем случае – неравномерность посещения занятий). Таким образом, для вычисления дисперсии и среднеквадратического отклонения надо последовательно пройти семь шагов:
1) вычислить среднее;
2) вычислить разности между средним и каждым значением;
3) возвести в квадрат разности, вычисленные на этапе 2;
4) умножить квадраты разностей на частоты наблюдений каждого из значений;
5) просуммировать квадраты разностей, вычисленные на 4 этапе;
6) разделить сумму квадратов на N;
7) извлечь квадратный корень из числа, вычисленного на этапе 6.
Это будет среднеквадратичное отклонение. В том случае, если значения переменных измеряются не однозначно определенными числами (как в предыдущем примере), а изменяются вдоль непрерывного ряда значений, вместо средней арифметической рассчитывается средневзвешенная. Так, предположим, что нам требуется вычислить средний балл успеваемости респондентов, и распределение по баллам оказалось таким, как в таблице 3.7.
Таблица 3.7