Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпора техн.docx
Скачиваний:
7
Добавлен:
01.03.2025
Размер:
52.85 Кб
Скачать

9. От чего зависит размер выборки

Вопрос об оптимальном размере вероятностной выборки всегда был спорным. Решение относительно размера выборки принимает с учетом целого ряда факторов, среди которых существенную роль играет два: Во-первых, ценность и новизна получаемой в результате опроса информации; во-вторых, затраты на проведение опроса (включая временные при заданном размере выборки)

Существуют статистические формулы, связывающей размер выборки с вероятностью ошибки и величиной доверительного интервала, задающего пределы этой ошибки. Во-многих важных случаях можно руководствоваться следующей практикой, т.е. размером выборки используется в аналогичных исследованиях. Нужно помнить о «правиле левой руки» для определения размера выборки.

Размер выборки растет

Размер выборки уменьшается

При необходимости опубликовать данные для отдельных подгрупп (размеры подвыборов при этом суммируется и выборка в целом растет пропорционально числу подгрупп)

При исследовании организации институтов и прочих «первичных ед. отбора», если сравнительно невелика величина генеральной совокупоности, и к которой производится отбор. Например совокупность сотрудником решал отдел, школьников, пациентов и т.д.

При проведении общенациональных обследований, когда велика генеральная совокупность (заданная доля генеральной совокупности f будет определять чем больше объем выборки, тем больше генеральная совокупность)

При проведении локальных и региональных исследований

Если уже имеющаяся информация по ключевым вопросам (о намерениях избирателей голосовать за ту или иную партию) явно недостаточно и степень неопределенности незначительна

Если уже существующаяся информация относительно полна и все еще остающаяся степень неопределенности незначительна

Типичные размеры выборок варьируется в пределах от 1000-2500 респондентов(в зависимости от числа анализируемых подгрупп), для региональных опросов и опросов специальных популяций от 200 до 500 (при анализе многочисленных подгрупп размер региональной или специальной выборки обычно возрастает от минимум 1000 регионов). (от лекции)

Размер выборки — число больных, которое необходимо включить в исследование, для исключения случайности в качестве объяснения полученного результата. Размер выборки зависит от четырех характеристик исследования: величины различия в частоте исходов между группами, вероятностей альфа- и бета-ошибок и природы данных. Размер выборки следует учитывать исследователю, планирующему эксперимент, и читателю, решающему, следует ли доверять опубликованным результатам.

10. Математические методы компьютерного контент-анализа оценки

Контент-анализ - это методика выявления частоты появления в тексте определенных интересующих исследователя характеристик, которая позволяет ему делать некоторые выводы относительно намерений создателя этого текста или возможных реакций адресата.

Когда в качестве наиболее объективной оценки текстов избрали частоту появления в нем различных характеристик, казалось, что оптимальное решение найдено. Вскоре поняли, что не все так просто.

Если попросить двух экспертов подсчитать, сколько раз, например, было упомянуто имя президента в конкретном номере конкретной газеты, то скорее всего их ответы совпадут. Причиной расхождений может стать лишь невнимательность при подсчете. Но вот если попросить этих же экспертов подсчитать в той же газете количество слов с негативной окраской, то результаты будут явно отличаться. Более того, один и тот же эксперт на одном и том же материале в разные моменты времени даст разные ответы. Причина кроется в неоднозначности критериев. Эта проблема стоит настолько остро, что она даже отдельно изучается. Существуют специальные методы оценки надежности результатов ручного контент-анализа, когда можно доверять экспертам, а когда нельзя.

Отдельный вопрос - трудоемкость контент-анализа. Имеется интересная методика, позволяющая по тексту объемом от 80 до 150 слов получить достаточно полный психологический портрет автора. Анализируются в основном грамматические характеристики. На ручной анализ одного текста по той же методике уходит от 4 до 6 часов времени.

Гораздо хуже обстоят дела, когда приходится оценивать большие массивы текстов, поступающих непрерывно. Ручной контент-анализ становится просто невозможным.

Выходом в данной ситуации является разработка компьютерных методов контент-анализа. Невнимательность исключена; неоднозначность исключена, если критерии приняты; трудоемкость решается за счет быстродействия. Именно компьютерным методам контент-анализа текстов и посвящена настоящая статья.

Характеристиками или элементами содержания, по отношению к которым применяется процедура подсчета, могут быть отдельные слова, словосочетания, предложения, абзацы, тексты. При этом сами характеристики никогда не являются самоцелью. Они интересны лишь в той степени, в какой являются индикаторами происходящего во внеязыковой реальности. В этом заключается существенное отличие контент-анализа от методов квантитативной лингвистики, от методов статистического изучения языка.(интернет)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]