Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СМК Л5.Анализ данных.doc
Скачиваний:
1
Добавлен:
31.08.2019
Размер:
257.54 Кб
Скачать

Лекция 5. Методы количественного анализа данных кси

  1. Одномерный анализ данных.

  2. Двумерный анализ данных.

Существующие приемы количественного статистического анализа данных чрезвычайно многообразны. Анализ данных — это комплекс практических умений и навыков, которым возможно овладеть только путем реальных упражнений.

Все методы количественного анализа принято раз­делять на две большое группы.

1) Методы статистичес­кого описания направлены на получение количествен­ной характеристики данных, полученных в конкрет­ном исследовании. Цель - мы стремимся к сжатому и наглядному их представлению. Математический язык оказывается очень эффективным средством до­стижения подобной цели.

2) Методы статистического вывода позволяют корректно распространять резуль­таты, полученные в конкретном исследовании, на все явление как таковое, делать заключения общего ха­рактера. Эти методы являются мощным инструментом построения научной теории. Можно сказать, что с их помощью осуществляется переход от изучения локальных явлений к познанию универсальных законо­мерностей, а тем самым и к научному прогнозирова­нию.

Мы рассмотрим только методы статистического описания.

1. Одномерный анализ данных

Цель любого научного исследования заключается в обнаружении закономерно­стей внутри определенного класса явлений. Законо­мерность, в самом широком смысле слова означает не­кую регулярность, однотипность. Статистические методы как раз и предназ­начены для анализа подобных явлений и процессов. Они позволяют выявлять устойчивые тенденции и строить на этой основе теории, предназначенные для их объяснения.

Для использования статистики требуются два ос­новных условия:

а) мы должны иметь данные о группе (выборке) документов;

б) эти данные должны быть представлены в формализованном (кодифицированном) виде.

Поэтому сначала описывается сама группа документов по важным для ученого параметрам.

Далее мы приступаем к анализу данных. Наиболее простой случай возникает тогда, когда наши данные могут быть представлены одной пере­менной.

  1. Одномерный статистичес­кий анализ

1) Построение распределения частот.

2) Данные о распределении пред­ставляем в форме гра­фиков.

3) Оценка параметров распределения.

1) Построение распределения частот.

Шкала наименований.

Переменная «Семейное положение». Переменная может принимать следующие значения: женат/замужем, холост/не замужем, разве­ден/разведена, вдовец/вдова. Подсчитывая число от­ветов в каждом классе, мы можем построить таблицу распределения. Предположим, всего было 30 респондентов, и один из них отказался отвечать на данный вопрос. Тогда таблица распределения частот может иметь следующий вид:

Данные о семейном положении авторов

Таблица 1

Семейное положение

Частоты

(абсолют.).

Доли

Проценты

(относит.)

Женат/замужем

16

0,53

53,3 (55,2)

Холост/не замужем

4

0,13

13,3 (13,8)

Разведен/разведена

7

0,23

23,3 (24,1)

Вдова/вдовец

2

0,07

6,7 (6,9)

Данные отсутствуют

1

0,03

3,3

Всего

30

1,0

99,9 (100)

Из таблицы видно, что большая часть респонден­тов (более половины) женаты или замужем.

Если какие-то отсутствуют, их следует выделить в самостоятельную категорию. Анализ таких пропущенных значений часто выделяют в самостоятельную задачу.

Анализируя таблицу, мы сравниваем между собой категории и видим, как они представлены в нашей выборке. Нас чаще всего интересуют не абсолютные зна­чения, а относительные. И тогда мы переводим часто­ты в доли относительно общего числа наблюдений, ко­торое мы принимаем за единицу. Для этого мы делим каждое значение на общее число наблюдений (в на­шем случае — на 30). Полученные дроби можно внести в таблицу отдельным столбцом. Тогда хорошо видно, что в нашей выборке немногим более половины рес­пондентов находятся в браке, а около четверти — в разводе. Относительные значения удобны еще и тем, что позволяют легко сопоставлять данные по двум вы­боркам разного объема. Если выборки различаются размерами, то мы предварительно вычисляем относи­тельные значения путем деления абсолютной величи­ны на объем выборки. Последний показатель принято обозначать латинской буквой N. В разобранном толь­ко что примере N =30.

Помимо долей, относительными единицами явля­ются также проценты. Если в первом случае целое принимается за единицу, то во втором случае — за сто процентов. От долей легко перейти к процентам: каж­дое значение просто умножается на сто. Процентное выражение предпочтительно тем, что с целыми числа­ми работать удобнее, чем с дробями. Но по существу проценты и доли — это эквивалентные единицы напо­добие рубля и копейки. Относительные единицы поз­воляют сравнивать не только аналогичные показатели, полученные на разных выборках, но и качественно различные показатели между собой.

Последний столбец в Таблице 1 представляет дан­ные в процентах. Обратим внимание, что итог у нас оказался несколько меньше ста процентов из-за округ­лений при вычислениях. Поскольку данные по одному индивиду отсутствуют, можно пересчитать проценты без этой пустой категории, полагая теперь N = 29. Скорректированные данные представлены в скобках. При сравнении с другой выборкой мы будем использо­вать именно их.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]