Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Социологические и психологические методы исслед....doc
Скачиваний:
85
Добавлен:
08.12.2018
Размер:
3.27 Mб
Скачать

2.2. Статистический вывод

Теперь обратимся ко второй большой группе коли­чественных методов анализа, на основе которых дела­ется статистический вывод. В этом случае стоит зада­ча перехода от отдельной выборки к характеристикам (параметрам) генеральной совокупности, то есть всего класса объектов в целом. Дело в том, что исследователь редко имеет возможность изучать всех представите­лей какой-то группы или социальной категории. Мож­но, например, обследовать все многодетные семьи, проживающие в данном микрорайоне. Но тогда выво­ды в полной мере будут относиться лишь к этой кон­кретной группе людей. Насколько они справедливы для многодетных семей всего города или области? Что­бы ответить на этот вопрос, нужно знать, насколько типична или специфична обследованная группа. Если она типична, то сходные проблемы выявятся и у дру­гих многодетных семей. Если группа очень специфич­на, то мы не имеем права обобщать полученные дан­ные. На языке статистики это значит, что наша выбор­ка принадлежит к другой генеральной совокупности. Опять мы сталкиваемся с задачей сравнения характе­ристик выборки и генеральной совокупности, с необ­ходимостью суждения об их тождестве или различии.

В реальной практике исследования вопрос чаще все­го ставится несколько иначе, но логически он относится к тому же классу. Требуется сравнить две группы (вы­борки) и решить, насколько значимо они различаются между собой. Любой эксперимент предполагает оценку эффекта изучаемого воздействия. Исследователь в этом случае стремится показать, что экспериментальная груп­па существенно отличается в интересующем его отноше­нии от контрольной группы. Оценивая эффективность образовательных программ, лечебных и оздоровитель­ных мероприятий, мы смотрим, насколько существенны­ми оказываются позитивные сдвиги. И что называть сдвигом? Если больной выздоровел, то это — явный ка­чественный сдвиг. Если ему стало легче, его меньше бес­покоят боли, то это некоторый количественный сдвиг. Но можно ли говорить о переходе из одного состояния в другое ? Для этого нам нужны критерии тождества или различия двух состояний. Статистика в этой второй сво­ей роли предлагает определенные формальные правила, позволяющие делать такого рода выводы.

Общая логика рассуждений такова. У нас есть два множества объектов. Если различие между ними по какому-то параметру настолько очевидное, что эти два множества не пересекаются, мы с уверенностью гово­рим, что это два разных класса объектов. Например, если минимальное значение дохода в одной группе на­селения превышает максимальное значение дохода в другой группе, то мы в праве утверждать, что группы различаются по своему материальному положению. Но это случай весьма тривиальный. Никому не придет в голову проводить исследования, чтобы доказать, что слон больше муравья. Это очевидно. Наука имеет дело с нетривиальными задачами, то есть с такими ситуаци­ями, где на основании имеющихся знаний мы выдвига­ем какие-то более или менее правдоподобные гипоте­зы, которые еще нуждаются в проверке и в доказа­тельстве. Обычный случай, с которым имеет дело ученый, — это частично пересекающиеся множества (частично перекрывающиеся распределения). Вот тут и встает проблема различения и отождествления.

Проблема осложняется тем, что, кроме нечеткости категорий (математики в этом случае говорят о размы­тых множествах), нужно учитывать возможность вся­кого рода ошибок. Ошибки измерений связаны с точ­ностью тех инструментов, которые мы используем. Никакой инструмент не дает абсолютной точности из­мерений. А надежность тех методов сбора информа­ции, которыми пользуются исследователи в социаль­ных науках, далеко уступает надежности физических приборов. Кроме того, нужно учитывать возможную ошибку выборки. Так как для исследования берутся только некоторые экземпляры, у нас нет никакой га­рантии, что они являются типичными представителя­ми популяции в целом. Рассмотренные нами ранее способы корректного построения выборки направле­ны на устранение систематической ошибки. Но слу­чайные ошибки полностью исключить невозможно. Статистика не претендует на то, чтобы сделать наши суждения абсолютно достоверными. Она ставит перед собой более скромную задачу: оценить степень надеж­ности получаемых данных и степень надежности тех выводов, которые делаются на их основе. Для этой це­ли используется аппарат теории вероятностей.

Нетрудно доказать, что ошибка выборки зависит от двух моментов: от размера выборки и от степени вари­ации признака, который нас интересует. Чем больше выборка, тем меньше вероятность того, что в нее попа­дут индивиды с крайними значениями исследуемой переменной. С другой стороны, чем меньше степень вариации признака, тем в целом ближе будет каждое значение к истинному среднему. Размер выборки нам известен. А степень вариации признака можно при­мерно оценить по степени разброса данных. Таким об­разом, зная размер выборки и получив меру рассеяния наблюдений, нетрудно вывести показатель, который называется стандартная ошибка среднего. Он дает нам интервал, в котором должна лежать истинная средняя популяции.

Описанная процедура основана на том факте, что ошибки выборки и ошибки измерений вообще подчи­няются нормальному закону, поскольку они обуслов­лены множеством случайных факторов. При этом со­вершенно не обязательно, чтобы само распределение данных имело нормальный вид. Представим себе, что мы изучаем разные случайные выборки из одной гене­ральной совокупности. Оценки среднего, получаемые в каждом случае, будут несколько различаться между собой, но в целом они будут группироваться вокруг ис­тинного значения. Если построить распределение этих оценок, то оно окажется нормальным. В центре его бу­дет лежать среднее по генеральной совокупности, а стандартное отклонение будет равно стандартной ошибке среднего. Но последний показатель, как мы видели, можно вывести и на основании одной выбор­ки. Он вычисляется по формуле: стандартное отклоне­ние деленное на корень квадратный из числа наблюде­ний. Теперь, зная свойства нормального распределе­ния, можно указать интервал, в котором должно находиться истинное среднее. Выше, рассматривая свойства нормального распределения, мы отмечали, что в диапазоне двух стандартных отклонений в обе стороны от среднего сосредоточено примерно 95 % всех случаев. Значит, вероятность получить значение, выходящее за эти пределы, не превышает 5 %, то есть такие ошибки будут встречаться не чаще, чем один раз из 20 случаев. С вероятностью 0,95 можно утверждать, что истинное значение лежит в указанных границах, которые задают доверительный интервал.

Итак, поскольку какая-то вероятность ошибки все­гда присутствует, мы вводим количественную меру на­дежности наших выводов. Все статистические крите­рии построены по этому принципу. Уровень 95 % при­нят как соответствующий достаточной надежности суждений. Если мы стремимся к еще большей надеж­ности, то можно взять 99 % уровень. Это означает, что случайная ошибка допускается не чаще, чем в одном случае из ста. Точные доверительные границы для 95 % уровня составляют ±1,96 стандартной ошибки средне­го, а для 99 % уровня мы используем коэффициент 2,58. В первом случае вне этого интервала остается не более 5 % возможных значений (по 2,5 % с каждой стороны). Во втором случае — не больше 1 % (по 0,5 % с каждой стороны). Рассмотрим пример. Допустим, что в неко­торой группе безработных из 25 человек средний воз­раст оказался 32 года. А массовые исследования гово­рят, что средний возраст для этой категории составляет 40 лет, а стандартное отклонение составляет 6 лет. Нас интересует вопрос, типична или нетипична наша выборка. Если это перевести на язык статистики, то мы спрашиваем, можно ли объяснить различие средних ошибкой выборки.

Статистический вывод представляет собой процесс проверки гипотез. Причем первоначально всегда вы­двигается предположение, что наблюдаемые различия носят случайный характер, то есть выборка принадле­жит к той же генеральной совокупности. В статистике такое предположение получило название нулевая ги­потеза. Итак, мы полагаем для начала, что наша вы­борка вполне типична. А затем мы спрашиваем: Како­ва вероятность получить выборку с таким средним (32 года) из генеральной совокупности, средний возраст которой нам известен (40 лет) ? Мы знаем, что при мно­гократных испытаниях получаемые значения будут распределены нормально, и средняя этого распределе­ния будет равна 40 годам. Стандартную ошибку при условии, что мы будем каждый раз брать по 25 чело­век, можно рассчитать по известной нам формуле: мы делим 6 (стандартное отклонение) на корень квадрат­ный из 25 и получаем значение 1,2 года (стандартная ошибка среднего). Затем вычисляется доверительный интервал, который в нашем случае при уровне досто­верности в 95 % составит:

40 ±1,96- 1,2 года = 40 ± 2,35 года (т. е. от 37, 65 до 42, 35)

Значение среднего для нашей выборки (32) лежит вне найденного диапазона. Это может означать, что:

а) либо мы наткнулись на тот чрезвычайно редкий случай, который лежит на самом краю распределения;

б) либо наше предположение, что два средних (по выборке и по генеральной совокупности) не различа­ются, ошибочно.

Если основываться только на имеющихся данных, то мы имеем основание отклонить нулевую гипотезу, то есть считать, что наша группа какая-то особая. Мы говорим, что различие между средними статистичес­ки значимо на уровне р < 0,05. Вероятность ошибки со­ставляет менее 5 %, и поэтому мы с достаточной уве­ренностью утверждаем, что различие не случайно. Если мы задаем более строгий критерий (99 %), то у нас еще больше оснований отклонить нулевую гипотезу. Мы говорим тогда, что различие статистически высо­ко значимо. Для социальных исследований 95 % уро­вень значимости считается вполне приемлемым.

Разобранный пример иллюстрирует случай сравне­ния эмпирического и теоретического распределения. Аналогичная процедура применяется и тогда, когда требуется оценить различие двух выборок. Мы исхо­дим из допущения, что наблюдаемое различие средних обусловлено случайными факторами (ошибкой выбор­ки и измерения). Другими словами, мы предполагаем, что обе выборки принадлежат к одной генеральной со­вокупности, параметры которой нам неизвестны. За­тем мы оцениваем различие средних с учетом наблю­даемого рассеяния данных в каждой из выборок. Кри­тические значения задаются с учетом выбранного уровня значимости. Если заданная величина оказыва­ется превышенной, мы отвергаем нулевую гипотезу и считаем, что наблюдаемые различия не случайны.

Мы разобрали принципы проверки статистических гипотез. Существуют разные статистические крите­рии, разработанные для разных типов данных. Некото­рые из них, так называемые параметрические крите­рии, применимы только к данным, полученным с помо­щью интервальных шкал. Название отражает тот момент, что в основе процедуры оценки лежит предпо­ложение о характере распределения данных. Если эти условия не выполняются, то выводы оказываются со­мнительными. К наиболее известным критериям этого типа относится f-критерий Стьюдента, применяемый для оценки различия средних. Но разработан также целый ряд статистических процедур, которые не при­вязаны к какому-то определенному распределению. Эти критерии, которые называются непараметричес­кими, особенно удобны для анализа данных, с которы­ми обычно имеют дело социальные науки. Примером может случить критерий хи-квадрат, который основан на сравнении частот. Кстати, этот же метод использу­ется для оценки связи между качественными призна­ками. Выбор подходящего критерия — задача весьма непростая. Здесь следует обратиться к помощи специ­алиста по математической статистике.

Заканчивая раздел о количественных методах ана­лиза, сделаем несколько замечаний общего характера. Во-первых, как читатель смог убедиться, грамотное применение статистики требует от исследователя спе­циальной подготовки. Но это касается и приемов каче­ственного анализа, и методов сбора данных. По мето­дам обработки социальной информации имеется об­ширная литература — от элементарных учебников до серьезных руководств. Мы надеемся, что теперь, по­сле знакомства с основными идеями и понятиями ста­тистики, эта литература станет вам доступнее. Во-вто­рых, статистика есть особый инструмент исследова­ния, овладеть которым по-настоящему можно только на практике. Важно подчеркнуть, что статистика — это не собрание стандартных приемов обработки дан­ных, а продолжение логики научного исследования, доведение ее до математической строгости. В этом смысле она полезна не только профессиональному ис­следователю, но и любому специалисту, который пыта­ется осмыслить свой собственный опыт и опыт своих коллег.

Наконец, нельзя не затронуть вопрос о границах применения статистики в социальных науках. Мы воз­вращаемся к той проблеме, которая была поднята в первой главе: к проблеме специфики предмета ис­следования в социальных науках, к спору между пози­тивизмом и феноменологией, между представителями номотетического и идиографического подходов. Дей­ствительно, целый ряд факторов ограничивает сферу применения традиционных математических моделей для изучения социальных явлений. Недаром столь зна­чительное место здесь занимает качественный анализ. Характер данных часто мешает использовать наиболее мощные статистические процедуры, привязанные к нормальному распределению. И тем не менее, коли­чественный анализ прочно занял свое место в арсена­ле социальных наук. Разрабатываются новые матема­тические модели, лучше учитывающие характер ис­следовательских задач. В частности, активнее привлекаются непараметрические критерии. Принци­пиально новые возможности открывает использова­ние компьютера. Все это позволяет прогнозировать новый всплеск интереса к количественным методам анализа данных среди ученых-гуманитариев, более широкое и грамотное их применение во всех сферах исследования.

3. Использование компьютера для анализа данных

Современный компьютер, как известно, является устройством, позволяющим эффективно оперировать информацией разного рода, но в первую очередь текс­товой и числовой. Само название происходит от арг-лийского слова «вычислять». И первые компьютеры действительно предназначались для сложных матема­тических расчетов. Недаром и по-русски их вначале именовали электронно-вычислительными машинами (ЭВМ). Правда, и внешне они существенно отличались от современного персонального компьютера. Такая машина занимала целое большое помещение и обслу­живалась целым штатом инженеров и программистов. Она использовалась в основном для инженерных и экономико-статистических расчетов.

За последние двадцать лет в области компьютерной техники произошла подлинная революция. Прогресс был связан в первую очередь со значительным повыше­нием быстродействия и сокращением размеров ЭВМ. Появился так называемый персональный компьютер, который сейчас становится не только обязательным ат­рибутом любого учреждения, но и широко входит в быт. Современный портативный компьютер, свободно уме­щающийся в портфеле, вовсе не уступает по возможно­стям своим предшественникам — ЭВМ тридцатилетней давности, но при этом он стал значительно проще в об­ращении. Конечно, эта простота относительная. Будучи универсальным устройством переработки информа­ции, компьютер совмещает в себе целый ряд функ­ций — от функции пишущей машинки до функции тер­минала для связи с удаленными базами данных. Всеми этими функциями приходится специально овладевать. * Вряд ли существует человек, который досконально вла­деет всеми возможными операциями. Их слишком мно­го. Но есть базовые навыки, которые необходимы лю­бому пользователю. Они образуют то, что сейчас при­нято называть компьютерной грамотностью.

Удобства, которые компьютер предоставляет в об­ращении с текстовой и цифровой информацией, дела­ют его незаменимым помощником в работе ученого-исследователя. Сейчас уже трудно себе представить, что еще совсем недавно основными инструментами ученого при работе с текстом были ручка, ножницы и клей, а при работе с цифровым материалом — счеты, арифмометр и карандаш. Теперь практически все делается на компьютере. Мы уже не говорим о тех удобствах, которые создает хранение информации на электронных носителях. Недаром многие научные из­дательства сегодня требуют, чтобы материалы подава­лись авторами в компьютерном виде — на дискетах. Это избавляет от необходимости набора текстов. Ко­роче говоря, компьютер превращается в обязательный инструмент исследователя.

Для анализа информации существуют разнообраз­ные специальные программы, но некоторые элементы качественного и количественного анализа можно осу­ществлять даже с помощью обычного текстового ре­дактора. Имеется в виду тот редактор, который входит в состав наиболее распространенной сейчас системы Windows. Он позволяет просматривать текст, выделять его отдельные участки, вставлять заметки, находить в тексте заданные слова и словосочетания, распола­гать списки в алфавитном порядке. С его помощью можно также создавать таблицы, производить ариф­метические вычисления, рисовать диаграммы.

Специализированные программы для качественно­го анализа позволяют более гибко структурировать текст, вычленять его элементы, подсчитывать их, ис­пользовать многоуровневую систему кодирования, выявлять характер отношений между элементами, представлять их в виде наглядных схем. Эти програм­мы удобны для работы с большими массивами инфор­мации, когда непосредственный просмотр становится слишком трудоемким и неэффективным.

Для работы с информацией, представленной в таб­личной форме, в состав системы Windows входит осо­бая программа Excel. Она может работать как с цифро­вой, так и с текстовой информацией. С ее помощью можно сортировать данные, производить основные статистические вычисления, преобразовывать таблицы в диаграммы. Имеются и специальные программы статистической обработки данных. Пожалуй, наибо­лее распространенной из них является программа под названием SPSS, что расшифровывается как «Статис­тический пакет для социальных исследований». Это комплекс программ, реализующий практически все применяющиеся в настоящее время процедуры.

Преимущества машинной обработки количествен­ных данных перед ручной неоспоримы даже при не­большом объеме вычислений. Во-первых, это ско­рость. Результаты получаются практически мгновен­но. Основное время затрачивается на ввод данных. I Jo зато после того как данные заложены в компьютер, мы получаем возможность подвергать их самым раз­ным процедурам обработки. Можно, например, раз­бить какую-то группу и сравнивать между собой под­группы. Во-вторых, это точность. Достаточно правиль­но ввести данные и правильно задать нужную процедуру, и верность любых дальнейших результатов гарантирована. При расчетах вручную почти неизбеж­но вкрадываются ошибки, обнаружение pi устранение которых отнимает очень много времени. В-третьих, что легкость внесения изменений. При ручной обра­ботке любое изменение означает, что нужно заново пес пересчитывать. Если мы работаем с программой h'xeel или аналогичной ей, то при изменении содержи­мого любой клетки или добавлении новых значений машина сама производит пересчет итогов по столбцам и по строкам. Наконец, чрезвычайно облегчается про­цедура построения всевозможных графиков. Машина i ама строит их по тем данным, которые содержатся и таблице, выбирая оптимальный масштаб. А затем уже человек получает возможность варьировать дета­ли внешнего оформления. Исследователь освобожда­ется от рутинной работы и может сосредоточиться на содержательной стороне анализа.

Говоря о преимуществах машинной обработки данных и о тех новых возможностях, которые она открынаот, нельзя не отметить, что в связи с этим к исследователю предъявляются дополнительные требования. И это естественно. Компьютер — это только инстру­мент в руках исследователя, инструмент мощный, но довольно сложный. Он может многое, но ему нужно точно сказать, что требуется сделать. И сделать это надо на языке, понятном машине. Конструкторы нема­ло потрудились над тем, чтобы облегчить общение че­ловека с машиной. Сейчас для работы на компьютере не надо быть специалистом-программистом. Но опре­деленная подготовка, конечно, требуется. Нужно иметь базовые навыки обращения с компьютером, а также разобраться в устройстве соответствующей программы. Что касается овладения новой програм­мой на уровне пользователя, то лучше всего найти че­ловека, который в ней хорошо разбирается, и делать первые шаги под его непосредственным руководст­вом. Дальше уже можно переходить к чтению описа­ний. Никакое описание не может заменить прямого показа. В некоторых современных программах, в част­ности в последней версии SPSS, имеются специальные обучающие подпрограммы. Они являются хорошим подспорьем для начинающего.

Но самое главное требование, которое компьютер предъявляет к исследователю — это четкое представ­ление структуры данных и тех потребностей анализа, которые вытекают из задач исследования. Постановка задачи и интерпретация результатов не могут быть пе­реданы машине. Самые изощренные приемы фор­мального анализа способны только помочь преобразо­вать первичные данные в вид, удобный для интерпре­тации. Компьютер сам не думает, он лишь точно выполняет инструкции, которые ему дает человек. И эти инструкции должны быть совершенно опреде­ленными и недвусмысленными. Все проблемы опреде­ления и осмысления выпадают на долю человека.

Собираясь проводить исследование с использова­нием машинной обработки данных, следует заранее продумать, в каком виде мы будем вводить их в ком­пьютер. Проще всего в этом случае работать с данны­ми, структурированными еще на этапе их сбора. Про­блем не возникает, когда используются готовые анке­ты или тесты: тогда мы сразу получаем информацию, пригодную для дальнейшего количественного анализа. Если наша исходная информация носит неструктури­рованный (текстовый) характер, а мы хотим использо­вать количественные методы анализа, то нужно преду­смотреть способ ее кодирования. О кодировании речь уже шла выше. Сейчас мы укажем на некоторые осо­бенности этой процедуры, когда она проводится с ори­ентацией на машинную обработку данных.

Очень важно, чтобы данные были приведены к еди­нообразной форме. В качестве стандартной формы для введения количественных данных в компьютер ис­пользуется таблица, где строки соответствуют случа­ям, а столбцы — переменным. В каждую клетку зано­сится число, характеризующее значение некоторой переменной для данного случая.

Если данные носят количественный характер, то заносится результат измерения или оценки. Если данные представляют собой качественные категории, то в таблицу заносятся их условные коды. Каждая клетка должна содержать одно и только одно значе­ние. Вся таблица должна быть заполнена, то есть в ней не должно оставаться пустых клеток. В практике не­редко случается, что какие-то значения отсутствуют. Например, респондент при заполнении анкеты пропу­стил один или несколько вопросов. Или отвечает «не знаю». Все такие случаи должны особым образом ко­дироваться.

Отсутствующие данные могут быть двух типов: принципиально невозможные или реально отсутству­ющие. В первом случае к какой-то подгруппе испытуе­мых вопрос просто неприложим. У неграмотного бес­смысленно спрашивать, какие газеты он читает. У до­мохозяйки нет смысла спрашивать про ее зарплату. У сироты — про возраст родителей. Но если вопросы такого рода задавались другим испытуемым, то прин­ципиально невозможные ответы нужно особым обра­зом кодировать. Если такие случаи не единичные, то их следует анализировать отдельно. Во втором слу­чае человек просто пропускает вопрос или выбирает категорию «не знаю». Такого рода явления чаще всего встречаются в заочных (почтовых) опросах. Если у од­ного респондента подобных ответов много, то надеж­ность остальных ответов тоже оказывается сомнитель­ной. Такого респондента лучше вообще исключить. Правда, если этот случай не единичный, исследователь должен насторожиться. Выбрасывание нескольких случаев не только уменьшает выборку, но может стать источником систематической ошибки, поскольку нельзя исключить, что тут мы имеем дело с группой людей, отличающихся от остальных в плане интересу­ющих нас свойств.

После того как данные введены в компьютер, реко­мендуется просмотреть распределение каждой пере­менной путем построения таблицы частот или соот­ветствующих графиков. Компьютер дает возмож­ность делать это легко и быстро. Просмотр может быть полезным в нескольких отношениях. Во-первых, иногда выявляются ошибки, допущенные при вводе данных. Допустим, вопрос предполагает выбор одного из пяти вариантов ответа, а построенное распределе­ние обнаруживает числа больше пяти, которые явно настораживают. Во-вторых, может оказаться, что вы­браны слишком дробные значения переменной и не­которые классы стоит укрупнить. Нужно только по­мнить, что в случае шкалы названий можно объеди­нять любые классы, а в случае шкалы порядка — только соседние. Наконец, характер распределения может помочь выбрать наиболее адекватные методы дальнейшего анализа, а также навести на интересные гипотезы. Так, при скошенном распределении мы склоняемся к использованию непараметрических критериев. При бимодальном распределении возни­кает гипотеза о внутренней неоднородности выборки, и можно попробовать выделить разные типы испыту­емых или ответов.

Сама процедура обсчета целиком передается ма­шине, а исследователь получает готовые результаты, причем часто в виде, пригодном для использования в докладе или отчете. Некоторые более сложные вы­числительные процедуры осуществляются в интерак­тивном режиме: на каждом шаге вычислений машина запрашивает дополнительные инструкции. Обычно пользователь каждый раз выбирает одну из возмож­ных альтернатив. Понятно, что для этого надо иметь представление о том, какие задачи решаются на каж­дом этапе вычислений и как выбор той или иной такти­ки может повлиять на окончательные результаты.

Итак, компьютер значительно облегчает процесс обработки эмпирических данных, но одновременно заставляет исследователя овладевать дополнительны­ми знаниями и навыками. Иногда кажется, что игра не стоит свеч, что затраты сил и времени не окупают вы­игрыша, что проще ограничиться карандашом и кар­манным калькулятором. На это можно ответить, что машинная обработка данных совершенно необходима в случаях, когда: а) имеются большие массивы инфор­мации, б) используются сложные статистические ме­тоды анализа, в) исследования по одной программе проводятся неоднократно (мониторинг). В первых двух случаях без компьютера просто не обойтись. В третьем случае стоит раз потратить усилия на рацио­нализацию всей процедуры, чтобы затем избежать массы рутинной работы. В остальных случаях прихо­дится решить, исходя из конкретных условий, стоит ли затевать игру.

Современная исследовательская практика предъ­являет высокие требования к человеку, который ею занимается. Он должен иметь не только глубокие по­знания в области непосредственных проблем, которые он изучает, но владеть также методологией и техникой проведения исследований и обработки их результатов. Вряд ли возможно одинаково хорошо разбираться во всех этих сферах. Поэтому очень важно налаживать профессиональные контакты, чтобы в случае нужды иметь возможность обратиться за консультацией и по­мощью. Потребность в помощи специалиста по анали­зу данных, как правило, оказывается необходимой на трех этапах проведения исследования:

  1. на этапе планирования исследования;

  1. на этапе подготовки данных к машинной обра­ботке;

  1. на этапе интерпретации полученных результатов.

На практике сплошь и рядом оказывается, что ис­следователь обращается к специалисту-методологу слишком поздно — когда материал уже набран и нуж­но решать, что с ним делать дальше. Тут нередко выяс­няется, что некоторые важные моменты были упуще­ны из виду, что какая-то важная информация потеря­на, что форма данных не отвечает требованиям задуманного анализа. Отсюда совет: учесть этот пе­чальный опыт и не повторять подобных ошибок.

Общение со специалистом другой области имеет свои особенности. Для того чтобы оно было продуктивным, нужно уметь найти общий язык. А это воз­можно лишь в том случае, если каждый имеет некото­рое представление в смежной области. В нашем при­мере, специалист по статистике должен иметь опыт ра­боты с социальной информацией. В свою очередь, от специалиста в любой области требуется иметь пред­ставление о тех приемах анализа информации, кото­рые чаще всего используются в исследовательской практике. Иначе это будет разговор слепого с глухим. Мы возвращаемся к тому пункту, с которого начи­нали во введении. Связь между наукой и практикой в действительности оказывается теснее, чем это может показаться на первый взгляд. Исследования, особенно прикладные, направлены на осмысление практического опыта и служат в конечном счете повы­шению эффективности практических усилий. Про­фессионала отличает знание и понимание дела, глубо­кое осмысление опыта как собственного, так и коллек­тивного. А для этого он должен быть в душе исследователем. Ему нужна достаточная методологи­ческая культура для того, чтобы обобщать свой опыт и передавать его другим, чтобы быть в курсе новейших достижений не только в своей области, но и в смежных областях знаний, чтобы вносить свой личный вклад в повышение эффективности того вида деятельности, которому он посвящает жизнь. Владение арсеналом современных методических приемов, в том числе и ис­следовательских, должно входить в крут его компетен­ции. Компьютер сегодня становится важным инстру­ментом интеллектуального труда вообще. Поэтому компьютерная грамотность превращается в обязатель­ный компонент подготовки любого специалиста, а тем более специалиста-исследователя.

Основные понятия

Сжатие информации, схематизация, кодирова­ние, таблицы, диаграммы, распределение частот, ме­ры центральной тенденции, меры рассеяния, нор­мальное распределение, коэффициент корреляции, факторный анализ, статистическая значимость раз­личий, параметрические критерии, непараметричес­кие критерии.

Темы рефератов

  1. Качественная информация и работа с ней.

  2. Методы статистического описания данных.

  3. Методы графического представления данных.

  4. Корреляционный анализ и сферы его применения.

  5. Многомерный статистический анализ.

  6. Параметрические и непараметрические критерии.

  7. Использование компьютера для статистической об­работки данных.

Вопросы для обсуждения на семинарских занятиях

  1. В чем различие качественных и количественных данных?

  2. Каковы приемы сжатия информации?

Каковы способны наглядного представления информации?

4.Как можно повысить надежность качественных данных?

  1. Каковы основные приемы статического описания данных?

  2. Что такое корреляция и как ее измеряют?

  3. Каковы принципы статистического вывода?

Литература

Калинин СИ. Компьютерная обработка данных для психологов. СПб.: Речь, 2002.

2.

Паниотто В.И., Максименко B.C. Количественные методы в социологических исследованиях. Киев: Наукова думка, 1982.

3.

4.

5.

6.

Саганенко Т.И. Надежность результатов социологи­ческого исследования. Л.: Наука, 1983. Сибирев В.А. Введение в анализ социологической информации. СПб.: Изд-во С.-Петерб. ун-та, 2000. Татарова Г.Г. Методология анализа данных в соци­ологии (введение). 2-е изд. М.: NOTA BENE, 1999. Толстова Ю.Н. Анализ социологических данных: Учебное пособие. М.: Научный мир, 2000. 7. Ядов В.А. Стратегия социологического исследова­ния: Описание, объяснение, понимание социаль­ной реальности. М.: Добросвет, 2000.