Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
тоип.doc
Скачиваний:
2
Добавлен:
18.08.2019
Размер:
232.96 Кб
Скачать

8. Процесс обработки информации и его характеристика.

Обработка информации – получение одних информационных объектов из других информационных объектов путем выполнения некоторых алгоритмов.       Обработка является одной из основных операций, выполняемых над информацией и главным средством увеличения объема и разнообразия информации.

     Примеры обработки информации можно увидеть в таблице.

9. Процесс накопления информации и его характеристика.

Информация является одной из основных потребностей современного человека; она нужна для работы, путешествий, приобретения товаров, принятия решений, выполнения школьных заданий, заботы о здоровье и многочисленных других видов деятельности. Человеческий мозг наделен удивительной эффективностью в отношении накопления и поиска информации. Однако в 20 в. информация накапливается человечеством такими темпами, что без специальных технических средств человеку и даже организации становится все труднее справиться с поиском необходимых данных.

Системы накопления и поиска информации собирают, анализируют, организуют, хранят, отыскивают и распространяют информацию. Традиционно много существующей информации было записано на бумаге, накапливалось в библиотеках и информационных центрах и отыскивалось вручную. С середины 1960-х годов для автоматического накопления и поиска информации начали использоваться различные механические и электронные помощники. Такие системы могут обрабатывать сотни миллионов элементов информации и отыскивать отдельные элементы практически мгновенно.

Компьютер и электронные средства связи составляют ядро современных систем накопления и поиска информации. Например, через настольный компьютер или другой терминал можно получить по телефону доступ к файлам местного или удаленного информационного центра и автоматически найти нужную информацию. Виды деятельности, требующие использования бумаги, такие, как чтение газет, написание писем и банковское дело, со временем будут заменены их электронными эквивалентами.

Процесс накопления и поиска информации

В принципе запрос на информацию можно было бы сравнить с содержимым файлов и выявить наилучшее соответствие. На практике, однако, содержание как запроса, так и элементов хранимой информации надо сначала определить более четко. Таким образом, в управлении базой данных содержание каждой записи оценивается согласно некоторому масштабу значений; в системе поиска ссылки документ представляется набором терминов, каждый из которых имеет значение (вес), зависящее от важности термина в документе.

Процесс накопления и поиска информации состоит из некоторого вида индексации, записи в файл, формулирования запроса и операций просмотра и выборки, выполняемых над хранимыми записями при ответе на запрос об информации.

Индексация.

Обычно индексация осуществляется вручную. Индекс (предметный указатель, словарь) может содержать много терминов, взятых из естественного языка, или может быть ограничен некоторыми специальными терминами. Словарь специальных терминов может определять термины с более широкими границами применимости, чем некоторый заданный термин, а также более узкие термины, синонимы и т.д. Документу назначается от 6 до 20 терминов. Ручная индексация представляет собой своего рода искусство, и не следует ожидать какой-либо согласованности между результатами действий отдельных индексаторов.

Были разработаны разнообразные методы автоматической индексации. В простейшем случае для индексации используется каждое слово отрывка из документа, за исключением союзов и предлогов. В более сложных системах выбираются термины, и им назначается вес по частоте появления в отдельных документах: чем выше частота появления данного слова, тем больше назначаемый ему вес. Слова, часто появляющиеся на протяжении всего собрания данных, не представляются подходящими для индексации, поскольку при осуществлении поиска они могут создать ложное представление относительно предпочтительности одних элементов перед другими. В случае автоматической индексации содержание документа может быть представлено не более чем сотней терминов.