- •1.2. Соотношение понятий «информация», «данные», «знания» 20
- •Информация
- •Приведите классификацию и охарактеризуйте основные компоненты ис.
- •Определите основные функции и назначение субд
- •Перечислите основные требования, предъявляемые к базам данных.
- •Прямая и инвертированная форма представления информации
- •16. Технологии информирования. Основные схемы видов информирования: трансинформирование,
- •17. Обобщенная схема абстрактного технологического процесса. Классы ит.
- •18. Технологии распределенной обработки данных. Типовые схемы организации хранения данных и доступа по технологии «клиент-сервер».
- •Синтаксис xml
- •Пример описания книги:
- •Пример описания главы:
- •25. Поисковые системы в Internet. Назначение, область применения.
- •26. Назначение и архитектура протокола z39.50. Понятие абстрактной базы данных.
- •32. Основные принципы систем распознавания речи
- •Классификация систем распознавания речи.
- •33. Основные принципы систем генерации речи
- •34. Основные принципы систем автоматизированного перевода
Определите основные функции и назначение субд
Система управления базами данных (СУБД) — совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
целостности данных.
СУБД (DBMS — database management system) — комплекс языков и программ, позволяющий создавать БД и управлять ее работой. СУБД обрабатывает поступающие от пользователей и прикладных процессов обращения к БД, а затем выдает необходимые им сведения. СУБД характеризуется используемой моделью и средствами администрирования, разработки прикладных процессов, работы в информационной сети.
Эффективное управление внешней памятью является основной функцией СУБД. Эти, обычно специализированные, средства определяют эффективность системы. Без них она не сможет выполнять некоторые задачи уже потому, что их выполнение будет занимать слишком много времени. При этом ни одна из таких специализированных функций, как построение индексов, буферизация данных, организация доступа и оптимизация запросов, не является видимой для пользователя и обеспечивает независимость между логическим и физическим уровнями системы.
СУБД обеспечивает:
описание и контроль данных;
манипулирование данными (запись, поиск, выдачу, изменение содержания);
физическое размещение (изменение размеров блоков данных, записей, использование занимаемого пространства, сортировку, сжатие, кодирование и пр.);
защиту от сбоев, поддержку целостности и восстановление;
работу с транзакциями и файлами;
безопасность данных.
Перечислите основные требования, предъявляемые к базам данных.
К современным базам данных, а следовательно, и к СУБД, на которых они строятся, предъявляются следующие основные требования.
-Высокое быстродействие (малое время отклика на запрос).
-Время отклика - промежуток времени от момента запроса к БД до фактического получения данных. Похожим является термин время доступа -промежуток времени между выдачей команды записи (считывания) и фактическим получением данных. Под доступом понимается операция поиска, чтения данных или записи их. Часто операции записи, удаления и модификации данных называют операцией обновления.
- Простота обновления данных.
- Независимость данных.
- Совместное использование данных многими пользователями.
- Безопасность данных - защита данных от преднамеренного или непреднамеренного нарушения секретности, искажения или разрушения.
- Стандартизация построения и эксплуатации БД (фактически СУБД).
- Адекватность отображения данных соответствующей предметной области.
- Дружелюбный интерфейс пользователя.
Прямая и инвертированная форма представления информации
Инвертированный файл (список) — файл, предназначенный для быстрого произвольного поиска записей по значениям ключей, организованный в виде независимых упорядоченных списков (индексов) ключей — значений определенных полей записей основного файла.
Прямая организация - когда документы размещаются последовательно (не алфавит и не классификация), например, в порядке их поступления.
Инвертированная технология - документы разбиваются на подмножества, которые могут быть классифицированы и имеют индексы, в которых отображается содержание документов. Упорядоченные документы составляют инвертированный справочник. Проводится поиск в инвертированном справочнике. Запрос сравнивается с классом, потом с содержанием документов этого класса. Благодаря этому уходит меньше времени на поиск, т.к. легче просмотреть индекс документа, чем весь документ.
Типология простых запросов.
В контексте задач поиска можно сказать, что существуют два основных способа организации данных. Первый представляет прямую организацию массива. Второй является инверсией первого. Прямая организация массива удобна для поиска по условия «Каковы свойства указанного объекта?», а инвертированная – для поиска по условию «Какие объекты обладают указанным свойством?».
Типология простых (атомарных) запросов:
1) А(Е)=? – каково значение атрибута а для объекта Е
2) А(?)=V – Какие объекты имеют значение атрибута, равное V
3) ?(E)=V – какие атрибуты объекта Е имеют значение, равное V
4) ?(E)=? – какие значения атрибутов имеет объект Е?
5) А(?)=? Какие значения имеет атрибут А в наборе?
6) ?(?)=V – какие атрибуты объектов набора имеют значение, равное V?
Здесь в запросах типов 2,3,6 вместо оператора равенства может быть использован другой оператор сравнения (больше, меньше, е равно или другие).
Запросы типа 1 выполняются поиском по «прямому» массиву: доступ к записи производится по первичному ключу. Запросы типа 2 выполняются поиском по инвертированному списку: доступ к записи(ям) производится по указателю, выбираемому из списка по значению вторичного ключа. Ответом в этих случаях будет значение атрибута или идентификатора. Запросы типа 3 имеют ответом имя атрибута.
Запросы типа 2,5,6 относятся к нескольким атрибутам, и в этом случае могут быть построены несколько индексов, облегчающих поиск по этим ключам.
Составные условия поиска могут использовать несколько простых условий, обычно связанных логическими (булевыми) операторами.
Обобщенная булево-подобная форма выражения запроса документальных ИС
10. Перечислите основные операции процесса поиска информации.
11. Охарактеризуйте типы информационной неопределенности при поиске.
12. Определите условия установления соответствия информационной потребности и содержания документа БД.
13. Охарактеризуйте основные этапы процесса информационного поиска. Перечислите основные и технологические объекты, используемые при поиске
14. Определите назначение «обратной связи» в процессе информационного поиска. Перечислите информационные объекты, используемые для реализации технологии «обратной связи» в процессе информационного поиска.
15. Определение и место понятия «Информационная технология»
Информационная технология — совокупность методов, производственных процессов и программно-технических средств, объединенных в технологический комплекс, обеспечивающий сбор, создание, хранение, накопление, обработку, поиск, вывод, копирование, передачу и распространение информации.
На современном этапе развития общества информационные системы и технологии становятся теми средствами, которые человек может использовать как для расширения, так и для развития своих собственных способностей. Термин «технология», обозначающий существо основного предмета данного пособия, в современных публикациях является настолько часто употребляемым и расхожим, что практически стал исполнять роль прилагательного, отражающего в большей степени специфику какого-либо средства.
Согласно словарю Ожегова, технология —- это:
совокупность методов и приемов воздействия на какие-либо предметы, объекты или процессы (труда);
наука, посвященная изучению или разработке этих методов (приемов).
Следует заключить, что информационные технологии должны относиться к совокупности методов воздействия на информационные объекты (информация, данные, знания, системы, ресурсы, программы и пр.) или процессы (обработка, поиск, хранение, представление, передача информации), а также с теоретическими знаниями о таких методах. При этом сами эти методы могут носить ярко выраженный информационный (нематериальный) характер.
В большинстве случаев термин «информационные технологии» ассоциируется с системой методов, способов и средств сбора, регистрации, хранения, поиска, обработки и передачи информации на основе применения средств вычислительной техники и телекоммуникаций.
Сбор данных (информаци и) представляет собой процесс регистрации, фиксации, записи данных о событиях, объектах (реальных и абстрактных), связях, признаках и соответствующих действиях. Более сложным является понятие «сбор информации» — процесс отбора из различных источников данных, необходимых для решения целевой задачи основной деятельности, их идентификации и представления в форме, необходимой для ввода в ЭВМ, последующего поиска и функциональной обработки.
Обработка данных включает в себя ряд взаимосвязанных операций, таких, как поиск, выборка, сортировка, слияние, проведение расчетов и т. д. Обработка данных представляет собой процесс управления данными, по возможности, без учета смысла, заложенного в данные.
Обработка информации представляет собой переработку данных, реализующую содержательное (функциональное) преобразование информации какого-либо определенного типа (текстовой, цифровой, графической и др.). Причем, зачастую тип данных (как форма существования информации) определяется характером содержания, т. е. обработка информации — это преобразование данных с учетом их содержания.
Особенностью информационных технологий является то, что они не могут рассматриваться изолированно, вне материальной сферы. Информация является неотъемлемой и, часто, определяющей компонентой практически всех материальных процессов, которые инициирует (или в которых участвует) человек. Такое соотношение материальной и информационной составляющих определяет, что эффективность использования информационных технологий (в том числе вычислительной техники, программного и информационного обеспечения) проявляется и может быть оценена только в сфере материального производства.
Другая важная особенность ИТ предопределена естественным для больших систем требованием надежности и устойчивости функционирования и развития, а также возможности интеллектуального (человеческого) контроля в условиях большой сложности. Это означает, что сфера информационных технологий должна быть распространена практически на все этапы жизненного цикла продукта, в том числе обеспечивающие и инструментальные средства.
Третья особенность — это непосредственное или опосредованное участие человека в технологических процессах. Любой автоматизированный и даже автоматический процесс на том или ином этапе связан с необходимостью представления (или получения) информации в форме удобной (иногда единственно возможной) для человека. Это породило отдельное направление — технологии человеко-машинного взаимодействия и интерфейсы информационных систем.
Данный учебник написан в предположении, что читатели владеют основами информатики и вычислительной техники, а также знакомы с языками программирования.
Книга должна рассматриваться скорее как введение в проблематику автоматизированной обработки информации, в силу ограниченности объема, не претендующее на полномасштабное изложение материала разделов, каждый из которых представляет отдельную дисциплину и зачастую представлен полноценным пособием. Для заинтересованного читателя материал книги может стать отправной точкой и путеводителем в многообразии методов, средств и технологий обработки информации с использованием средств вычислительной техники