Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MSM.doc
Скачиваний:
54
Добавлен:
27.04.2019
Размер:
1.8 Mб
Скачать
  1. Оцифровка неколичественной информации. Основные способы оцифровки.

Информация может быть измерена в разных шкалах. Особенность заключается в правильном выборе шкалы. Это связано с тем, что большой объем данных является качественным и нуждается в оцифровки.

Оцифровка – способ перевода качественной информации в количественную (присвоение качественным значениям некоторых числовых меток).

Этот способ должен быть корректен, чтобы работал мат. аппарат.

Оцифрованные признаки описываются обычно с помощью дискретных шкал с некоторым фиксированным количеством градаций.

Бинарные признаки, то есть имеющие всего две градации, могут быть оцифрованы произвольным образом, однако из соображений наглядности чаще всего их градациям присваивают значения 0 и 1.

Если признак имеет более двух градаций, то существенным оказывается соотношение расстояний между соседними метками. Например, оцифровка признака «состояние объекта» со значениями «удовлетворительное», «хорошее», «отличное» может быть принята как 1,2,3, или как 0,1,2 (эти две оцифровки дадут эквивалентный результат), или как 1,2,4.

Существует несколько стандартных процедур оцифровки признаков неколичествен. природы.

  1. Сведение к совокупности бинарных (булевых) переменных, которые в эконометрической литературе чаще называются фиктивными или искусственными для оцифровки.

  2. Испол-ние равномерного кодирования для качественных признаков, когда расстояние между числовыми метками соседних градаций одинаково, например, «удовлетворительное», «хорошее», «отличное»  1, 2, 3. Такая кодировка весьма груба и может не отражать реал. степень отличия градаций фактора. Несколько сгладить недостатки, присущие равномерному кодированию, позволяет использование порядковой шкалы качественных оценок. При этом, однако, задание «неравномерности» числовых меток полностью возлагается на эксперта, то есть весьма субъективно, а в ряде случаев еще и затруднительно.

  3. Альтернативой субъективному экспертному подходу явл-ся испол-ние оптимизацион. процедур при оцифровке признаков, основанных на максимизация лин. зав-ти между влияющей (xj) и зависимой (y) переменными в эконометрич. модели. В частности, могут быть испол-ны следующие критерии, являющиеся взаимосвязанными: - максим-ция коэф-та сопряженности между xj и y; - минимизация остаточ. разности квадратов; - максимизация коэф-та детерминации R2.

Применение процедур оцифровки не должно нарушать экономического смысла.

Вот несколько прмеров оцифровки анкетных данных:

  1. Относите ли Вы себя к верующим?  1

- Да  1

- Нет  0

  1. Часто ли посещаете церковь?  2

- Часто  1

- Изредка  0

- Никогда  -1 (чтобы показать полярность, лучше использовать разные знаки)

  1. Выполняете ли Вы церковные обряды?  3

- Да, выполняю 1

- Выполняю, но не все  0

- Не выполняю  -1

  1. Помогает ли Вам вера в повседневной жизни и учебе?  4

- Помогает  3

- Изредка  2

- Не знаю  1

  1. Как Вы относитесь к студентам, исповедующим другую религию?  5

- Спокойно, с уважением  3

- Каждый вправе выбирать себе вероисповедование  2

- Мне все равно  1

1) Таблица частот (каждая клетка - безусловная вероятность)):

Кол-во прогульщиков

Кол-во пропущенных дней

Частота

f

0 – 4

I I I I I I I

7

35%

5 – 9

I I I I I I

6

30%

10 – 14

I I I I

4

20%

15 – 19

I I

2

10%

20 ­– …

I

1

5%

20

100%

В данном случае МО – это средняя взвешенная

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]