Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книги_other / Энциклопедия студента Сост. И.Кузнецов.pdf
Скачиваний:
299
Добавлен:
21.03.2015
Размер:
5.57 Mб
Скачать

1)прочитать текст;

2)проверить приводимый в тексте фактический материал (цифры, даты, статистические данные и др.) с использованием официальных справочников и энциклопедических изданий; исправить неточности;

3)устранить факты, загромождающие текст и затрудняющие его восприятие; при недостаточном количестве фактов следует обратиться к автору с просьбой дополнить текст;

4)определить обоснованность и убедительность выводов, которые делает автор, и предложить автору доработать текст, если выводы безосновательны, голословны;

5)проверить точность цитат (цитата должна представлять собой законченную мысль с сохранением пунктуации и шрифтовых выделений подлинника);

6)проверить правильность дат;

7)уточнить написание имен и фамилий;

8)установить единообразие сокращений;

9)проверить композицию текста - последовательность изложения, соразмерность частей, целостность; в случае необходимости перекомпоновать текст;

10)проверить разделение текста на абзацы (абзац - это более или менее законченный отрывок текста, объединенный общей мыслью);

11)исправить опечатки, грамматические, орфографические, стилистические, пунктуационные ошибки;

12)прочитать исправленный текст с целью контроля за сохранностью смыслового

икомпозиционного единства;

13)проверить правильность внешнего оформления документа;

14)согласовать все существенные поправки с руководителем.

Правка-обработка используется и в тех случаях, когда надо изложить в письменной форме устное выступление или подготовить какую-либо бумагу, получив от руководителя устное сообщение о ее содержании.

Правка-переделка - это коренное изменение текста, автор которого слабо владеет литературным языком. По сути дела это создание нового текста на основе предложенного. Правка-переделка применяется в тех случаях, когда автор, собравший интересные факты, совершенно не умеет излагать свои мысли на бумаге или настолько занят текущими делами, что не может тратить время на создание текста, предоставляя секретарю лишь наброски, идеи, записи, которые нужно использовать для его составления.

3.2. ИНФОРМАЦИЯ В INTERNET

Поиск информации

В самых общих чертах поиск можно определить как упорядоченную последовательность действий, которые вы должны выполнить, когда сталкиваетесь с необходимостью найти интересующую вас информацию.

Системный подход к этой задаче сделает ваш поиск и квалифицированным, и успешным. Кроме того, это поможет найти ответ на вопрос «Почему ничего не

140

найдено?» и избавит от терзаний, вызванных опасениями, все ли найдено по данной теме.

Определение вопроса

Вопрос (question) - это то, на что вы хотите получить ответ; запрос (query)- это то, что вы вводите в компьютер, и это совершенно разные вещи. Вопрос формулируется на естественном языке, и только вы способны это сделать, так как только вам известен контекст. Библиотекари могут вам помочь, но уже на этапе превращения вопроса в запрос.

Источники информации

Уяснив для себя проблему, вы должны решить, где искать, если выбор не предопределен какими-то обстоятельствами. Иногда вы будете ограничены возможностями, имеющимися в вашей организации, или соображениями стоимости.

Тем не менее, следует иметь представление о том, чего вы при этом лишаетесь. К общим заблуждениям относится стремление полагаться исключительно на базы

данных из-за удобства использования или доступности, но ни одна из баз данных не является всеобъемлющей.

Например, в биомедицинской библиографической базе данных MЕDLINE нет книг, большинство статей попадают туда не ранее, чем через 4 месяца, и очень редки ссылки на тезисы конференций. При выборе базы данных:

определите, к какому этапу цикла публикации относится информация нужного вам типа, и сопоставьте, что важнее - ее современность или качество;

используйте третичные источники, чтобы найти возможные источники информации;

решите, достаточно ли будет «указателей» (типа ссылок) или необходима фактическая информация (полные тексты статей), т. е. сделайте выбор между справочной и исходной базой данных;

обдумайте характерные особенности каждого возможного источника информации и определите, где поиск будет наиболее успешным - в базе данных или менее упорядоченных источниках (например, Web).

При оценке источника информации приходится выбирать между его современностью (свежестью) и качеством. Качество обеспечивается при помощи рецензирования, редактирования и общественного мнения, хотя, с другой стороны, электронная почта и компьютерные средства доставляют информацию быстрее, а конференции и другие форумы доносят новости до читателей оперативнее, чем статьи.

Новизна информации - очень сильный довод «за» при оценке источника, но учтите, что она становится фактически бесполезной, если для применения результатов самых современных исследований требуются недоступные вам средства. В то же время источники почтенного возраста и с хорошей репутацией могут содержать общеизвестные сведения, на поиск которых не стоило тратить сил.

С течением времени информация проходит определенный цикл, длительность которого определяется конкретными обстоятельствами.

Например, результаты исследований могут сообщаться неформально, докладываться на конференциях, заноситься в библиографические базы данных, переоформляться и комментироваться другими авторами.

141

На результаты, факторы времени, участников этого процесса и отношения между ними сильно влияет используемая «технология».

Например, авторы могут представлять свои работы сразу в общедоступные базы данных и обнародовать их через Internet без задержек, характерных для традиционных форм публикации.

Результативность поиска зависит от понимания этого цикла; к какой стадии обратиться, какие инструменты имеются для поиска на данной стадии и в чем ограниченность выбранного подхода.

Например, обратившись в базу данных типа MEDLINE, вы должны понимать, что найдете информацию, которая появилась в литературе по крайней мере несколько месяцев назад, но не найдете тезисов последних конференций.

На каждой стадии цикла публикации можно найти:

Текущие источники, которые содержат информацию о самых ранних этапах работы, когда она только началась или находится в стадии подготовки.

Первичные источники (печатные или электронные), в которых результаты работы впервые представляются в формальном виде.

Вторичные источники, в которых первичную информацию каталогизируют, упорядочивают, переоформляют, представляют в сжатом виде или по-другому «повышают ее ценность». Эти источники делают более удобным поиск и оценку первичной информации.

Третичные источники, которые каталогизируют, упорядочивают и дают рекомендации по работе с вторичной (иногда и с первичной) информацией. Они необходимы, так как сейчас появились тысячи справочных и исходных (документальных) баз данных. Третичный источник поможет вам выяснить, существует ли где-нибудь база данных, в которой есть тезисы последней конференции по вашей тематике.

При поиске информации в Internet, безусловно, чаще всего вы будете пользоваться базами данных, поэтому задержимся на некоторых важных моментах.

База данных - это набор записей, состоящих из нескольких полей, который является поэтому идеальной структурой для каталога неструктурированных источников информации.

Если вы решили пользоваться определенной справочной базой данных, вам необходимо знать ее организацию. Кстати, WWW в целом не может считаться базой данных по ряду признаков: например, ее записи (Web-страницы) отличаются по структуре, а Web-узлы - по качеству и возрасту информации.

К важным характеристикам справочных баз данных относятся:

Охватываемая сфера (тематика, типы источников, насколько полно представлен каждый источник, охватываемый период времени).

Структура и содержание записи, возможность обращения к отдельным полям (из каких полей состоит запись, как они организованы, по каким из них можно проводить поиск).

Размер (сколько записей в базе данных, средний размер одной записи).

Современность и обновление информации (сколько времени проходит между публикацией статьи и появлением соответствующей записи в базе данных, как часто добавляются новые записи в базу данных).

142

Качество (кто несет ответственность за базу данных и какой контроль ее качества предусмотрен).

Способы поиска (поиск при помощи произвольного текста или при помощи упорядоченной индексирующей системы - управляемого словаря).

Рекомендации по методике поиска, документация, оперативная справка (обычно обеспечивается в печатном или электронном виде изготовителем или поставщиком).

Стоимость (в зависимости от условий доступа).

Базы данных могут также различаться по характеру информации в них: содержат ли они «указатели» на другую информацию (справочная информация) или фактически саму информацию (исходные данные). Существует, например, разница между MEDLINF, и базой данных полных текстов статей, указанных в MEDLINE, которая находится в стадии развития. При этом базы данных обоих типов могут содержать информацию, находящуюся на разных стадиях цикла публикации. Например, данные в ERRIC помещают сами исследователи, что делает эту базу данных первичным источником. Содержимое же другой базы данных - Current Contents - формируется сотрудниками Института научной информации (Institute for Scientific Information, USA),

которые извлекают его из журналов, и поэтому Current Contentsвторичный источник. Справочные базы данных - это упорядоченные наборы «указателей». Обычно

справочная база данных является лишь первым этапом поиска. Например, часто найдя в ТЕСН (библиографическая база данных по технике и прикладным наукам, включая аэрокосмические исследования, автоматику, компьютерные науки, электротехнику, энергетику, телекоммуникации, оптику) рефераты нужных статей, вы понимаете, что необходимо отыскать и прочитать сами статьи, хотя иногда бывает достаточно и рефератов.

Исходные базы данных - это упорядоченное собрание самих данных или источников информации. Журнальный фонд библиотеки можно рассматривать как исходную базу данных в печатной форме, а ее электронным аналогом была бы база данных полных текстов статей.

Примечание: Сейчас базы данных этого типа уже не редкость. Например, в online-коллекции фирмы Ovid Technologies (http//ww.ovid.com) имеется 300 журналов,

причем при поиске возможен переход между библиографическими и полнотекстовыми базами данных, а также выбор и изменение масштаба отдельных графических элементов. Отметим сразу, что многие из функциональных возможностей баз данных, упоминаемых ниже, предложены этой фирмой.

Другой крупный разработчик электронных баз данных - UMI предлагает onlineбиблиотеку ProQuestDi-rect, в которой 120 журналов, причем самая ранняя информация датируется 1987 г. Пользователь может указать, в какой форме должен будет представлен результат, библиографическая ссылка, реферат, полный текст, полный текст с графикой, отсканированные изображения страниц статьи.

Формулировка запроса

Определив свой вопрос и выбрав ресурсы для поиска, вы должны сформулировать запрос, т. е. выразить вопрос на языке, понятном машине.

Для этого следует:

143

разбить вопрос на понятия, которые будут искаться отдельно, а затем объединить их соответствующими логическими операторами (AND, OR, NOT), если в системе поиска предусмотрены данные операции;

решить, насколько широко проводить поиск: сделать ли акцент на полноту отклика, т. е. найти по данной теме, часто получая при этом много ненужной информации, или на точность, т. е. быстро найти очень ограниченную конкретную информацию по теме, теряя некоторые относящиеся к ней важные сведения; заметьте, это будут совершенно разные запросы;

учесть все варианты написания слов и синонимы, если вы ищете при помощи произвольного текста;

выбрать соответствующую тематическую рубрику, если вы пользуетесь управляемым словарем; это эффективнее ключевых слов;

решить, ограничить поиск определенными полями базы данных или выполнить уточняющие и другие специальные функции. Сейчас поисковые системы предлагают помощь при решении этих задач.

Например, в MEDLINЕ «отображение» вводимого понятия помогает выбрать соответствующую тематическую рубрику.

Выполнение поиска

При поиске чаще всего применяют первый из описанных ниже методов в силу его простоты. Кроме того, далеко не во всех базах данных реализован управляемый словарь, хотя даже при его наличии пользователям нужно некоторое время, чтобы убедиться в его несомненных преимуществах и пользоваться им наряду с привычными ключевыми словами.

Поиск произвольного текста

При таком подходе вы ищете слова, которые были употреблены, например, в заголовках статей и рефератах, перебирая все варианты написания и синонимы. Очевидно, что вы вряд ли будете уверены, что нашли все возможное, так как автор мог использовать редкий и специфический термин.

В некоторых системах поиска алгоритм позволяет вводить набор слов и учитывает некоторые формы слова, например множественное число.

Поиск при помощи управляемого словаря

Предположим, составлен стандартный иерархический список терминов, представляющих все основные понятия некоторой отрасли науки и смежных дисциплин. Тогда, прежде чем добавить ссылку на журнальную статью в справочную базу данных, из этого списка выбираются термины, характеризующие содержание статьи, и вводятся в

запись.

Так организован, например, MeSH - Medical Subject Headings (указатель медицинских рубрик). В его основе лежит следующий принцип: всем статьям об одном и том же предмете присваивается одна и та же стандартная тематическая рубрика, независимо от того, какие именно слова употребил автор.

В этом случае, если вам известна стандартная рубрика, гораздо легче выполнить полный поиск в ее рамках, а найти рубрику, наиболее близко соответствующую

144

введенному вами слову или фразе, помогает функция «отображения», которая выдает вам перечень примерно подходящих рубрик, из которого вы уже сами выбираете нужную.

Но в MeSH сделан еще один шаг: статьи точно индексируются по наиболее близким к их содержанию рубрикам, однако благодаря иерархичности терминов возможен очень мощный прием поиска, называемый «расширением». Когда вы пользуетесь для поиска некоторым достаточно широким понятием, то статьи, индексированные по более узкому термину, не выбираются: если же применять «расширение», то в результат будут включены не только статьи, относящиеся к подрубрикам, расположенным на один иерархический уровень ниже.

В то же время вы можете искать информацию по более узкому понятию и найти именно то, что вам нужно.

Два перечисленных приема, т. е. поиск произвольного текста и поиск при помощи управляемого словаря, не являются взаимоисключающими. Напротив, наиболее эффективные стратегии получаются при их комбинации.

Например, можно найти довольно значительное число статей по терминам MeSH, а затем сузить результат за счет выбора части из них по ключевому слову. Базы данных и прочие источники информации доступны через многие Web-интерфейсы. Некоторые из них бесплатны, а для других необходима регистрация и оплата услуг. В предыдущих главах найдется достаточно примеров.

Оценка результатов поиска

Это необходимый критический этап поиска, которым часто пренебрегают.

Вот некоторые рекомендации для оценки достаточности поиска:

1.Просмотрите результаты своего поиска, чтобы понять, почему выбраны эти элементы и какую часть составляют нужные, т. е. был ли поиск «прицельным».

2.Не забывайте, что ошибки могли быть допущены на любой стадии поиска, например:

• слишком широкая или узкая формулировка запроса в начале;

• выбор не лучшей базы данных для поиска;

• неправильная формулировка запроса (выбор не той рубрики, ошибочное представление о выбранной рубрике, выбор многозначного ключевого слова или сокращения);

• ошибки набора или неправильное применение операторов при вводе стратегии поиска;

3.Оценка достаточности зависит от того, для каких целей будут использованы результаты поиска.

Объем ссылок, необходимый для написания обзорной статьи, будет избыточным, если вам нужны всего лишь несколько хорошо отражающих вашу проблему статей; первые попытки поиска обычно менее точны, чем последующие, когда стратегия уточняется и сфера поиска сужается.

4.Если вам уже известны некоторые из найденных ссылок, но результаты поиска отрицательны, следует предположить наличие ошибки в стратегии.

Если вы нашли слишком мало или слишком много, то считайте это первым сигналом о неэффективности поиска.

145