- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •Информация (первоначальное) – это сведения, сообщения о каком-либо событии, деятельности и т.п.
- •Информация (по Шеннону): I = - ∑pi*log(pi), где pi – вероятность i-ого сигнала
- •Информация – это продукт научного познания, средство изучения реальной действительности в рамках, допустимым одним из информационных подходов.
- •Информация(по ГОСТу) – сведения, воспринимаемые человеком и(или) специальными устройствами как отражение фактов материального и духовного мира в процессе коммуникации.
- •Прагматические свойства – характеризуют степень полезности информации для пользователя.( т.е проявляются в процессе использования информации)
- •Эмерджентность – эмерджентные те свойства, что порождаются взаимодействием элементов,но не наблюдаются у элементов, если рассматривать их отдельно.
- •Старение- устаревает, когда не имеет ценности для потребителя, понять, что устарела, можно только в сравнении с новой.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ИПС. Отличия документальных и фактографических ИПС.
- •12. Структурная схема процессов в абстрактной АИПС. Режимы ретроспективного поиска и ИРИ.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •Кодирование информации
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •НАДО: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •ИДЕЯ: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •31. Линейная модель механизма поиска документов-аналогов.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ИПС.
- •36. Основные частные и интегральные критерии оценки АИПС.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики АИПС.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •39.Диаграмма Эйлера-Венна (диаграмма <L>). Критерии оценки АИПС в координатах <L>.
- •Критерии оценки АИПС в координатах <L>
- •40.Таблица сопряжённости. Критерии оценки АИПС в координатах <a,b,c,d>.
- •Таблица сопряженности <a,b,c,d>
- •Критерии оценки АИПС в координатах <a,b,c,d>
- •41. Диаграмма <n,x>. Критерии оценки АИПС в координатах < n,x>.
- •Критерии оценки АИПС в координатах <n,x>:
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ИС.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •Навигация (процесс поиска по запросу в выбранной БД) – целенаправленная последовательность использования методов, средств и технологий конкретной АИПС, определяемая стратегией, для получения и оценки результата.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
30. Линейная модель механизма поиска по логическому выражению.
Логическое выражение поискового условия – это синтаксическая конструкция языка, задающая порядок и способ вычисления величины, принимающей значение «0» или «1». Выражение представляет собой последовательность операндов, соединенных друг с другом знаками операций. Нотация Бэкуса для такого выражения следующая: <Выражение>::=<Операнд> <Выражение><Операция> <Выражение> (<Выражение><Операция><Выражение>) Обычно: операнд
– термин(дескриптор); операция – одна из логических операций. Первый этап вычисления логического выражения может состоять в построении двоичного дерева операций. Все логические операции (кроме NOT) – бинарные => можно представить любое логическое выражение запроса в виде несбалансированного двоичного дерева, прохождение по которому снизу вверх приводит к получению результата. В узлах дерева расположены логические операции (oi), а листья (конечные узлы) представляют собой
строки матрицы L0, соотвующие терминам запроса ti bij, j 1,n0 .Операнд
запроса – отдельно вычисляемое выражение, соответствующее поддереву
запроса. Расширенная матрица «термин-документ» L . Строки – не только 0
показатели встречаемости терминов, но и результирующие векторы запросов
(Qi).
|
|
|
b |
b |
|
b |
|
|
|||
|
|
|
|
11 12 |
|
|
1n |
|
|
||
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
b |
b |
|
|
b |
|
|
||
L |
|
|
21 22 |
|
|
2n |
|
|
|||
|
|
|
|
|
|
|
0 |
|
|
||
0 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b |
|
b |
|
|
b |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
||||
|
|
|
|
D 1 D 2 |
D n |
||||||
|
|
|
|
|
|
|
|
|
|
|
0 |
, где 1,K – количество включенных в матрицу
результирующих векторов запросов,а
|
|
b |
|
|
|
ij |
|
|
|
b |
, если строка принадлежит матрице L |
ij |
0 |
q |
, если строка представляет собой результат запроса |
ij |
|
Поставим в соответствие каждой логической операции правило ее выполнения с использованием расширенной матрицы:
|
|
|
|
|
|
|
o |
|
из множества бинарных логических |
|||||
|
|
|
||||||||||||
biokbm |
bijokbmj |
, j 1,n0 , где |
|
k |
||||||||||
операций:ok O,O o1,o2,...,os Для унарной операции NOT это правило |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, j 1,n |
|||||
реализуется следующим образом: b |
|
b |
|
|||||||||||
|
|
|
|
|
|
|
|
|
i |
|
ij |
0 |
|
Тогда алгоритм разрешения двоичного дерева поискового запроса состоит в последовательном выполнении снизу вверх логических операций и в
пополнении на каждом шаге матрицы L0 очередной строкой-результатом.
Условием выполнения k-той операции служит наличие в матрице L0 |
строк, |
|
|
соответствующих правому и левому операнду. После выполнения k-той
операции формируется результирующий вектор q |
|
|
|
, который |
|
b o b |
|||||
|
k |
i |
k |
m |
|
1)-й строкой матрицы. |
|
|
|
|
|
становится ( D |
|
|
|
|
31. Линейная модель механизма поиска документов-аналогов.
Аналогами документа называются такие документы информационного массива, которые имеют заданное количество общих терминов с исходным. Задается пороговое значение близости m. Процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц документов и составлением логических выражений над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.
Выделим в матрице L0 столбец lk bik ,i 1, D , соответствующий ПОДу рассматриваемого документа, и построим подматрицу LDoc, оставив в матрице L0 те строки, в кот-х bik 0 . По матрице LDoc строится результирующий вектор запроса на поиск аналогов (QDoc ) и м.б. получен поисковый результат с учетом (или без) некоторого заданного порога «близости» (m). Результирующий вектор QDoc=(q1q2…qm), где qi=∑=1 , т.е. суммированием элементов столбца. Далее получаем окончательный поисковый результат Kn=(k1…km), ki равно либо 0 (qi<m), документ не является аналогом,либо 1(qi>=m), является аналогом.