Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[7 семестр] Расписанные вопросы к экзамену.pdf
Скачиваний:
10
Добавлен:
05.06.2015
Размер:
1.52 Mб
Скачать

42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.

Коэффициент линейной корреляции R выдачи и релевантности документов представляет собой корреляционный момент двух случайных величин: С – «быть выданным документом» (формально релевантным с точки зрения системы)и И – «быть релевантным» (истинно релевантным с точки зрения пользователя).

Каждая из величин может иметь значения 0 и 1 в зависимости от конкретного документа.

Математические ожидания С и И:

[

 

]

(

 

)

 

 

 

 

+

 

 

 

[

 

]

(

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= + + + ;

И

 

 

 

=

+ + + ;

 

 

 

 

= = 1

 

 

 

= И = 1

 

 

 

дисперсии определяются аналогично: 2С

=

 

 

+

 

(1 −

+

) =

+ + +

+ + +

( + )( + )

; 2

И =

( + )( + )

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( + + + )

 

 

( + + + )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ковариационный момент C, И равен:

 

= [ И] − [ ] [И] =

 

 

 

 

 

 

( + )( + )

 

 

 

 

 

 

 

 

 

 

 

 

И

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ + +

( + + + )2

( + + + )2

 

 

 

 

 

 

 

 

 

 

 

 

 

Окончательно: =

 

 

И

=

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2С 2И

 

√( + )( + )( + )( + )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Очевидно, что в различных точках координат <n,x> значения (знаки) R

следующие:

(0) = 0, ( 0) = 0, (И) = +1, (Д) = −1, (1) > 0, (2) > 0, (3) < 0 (из рис.3.4.).

В частности, легко убедиться, что = 0 повсюду на линии 0 − 0. Для этого достаточно показать, что − = 0:

− = ( 0 0 − ( − )) − ( − )( 0 − )

= 0 0 − + 2 0 + 0 + − 2 = 0 ( − 0)0

= 0( − 0); ( )

Т.к. на линии 0 0 выполняется = 0 = 0, то ( ) = 0.

0

43.Назначение, состав и структура лингвистического обеспечения ИС.

Лингвистическое обеспечение ИС - совокупность языковых средств, позволяющих представить информационную составляющую ИС на различных этапах внутрисистемного взаимодействия и взаимодействия с пользователем (это то как мы представляем ЛО, оттуда следуют аспекты).

Назначение лингвистического обеспечения: Лингвистическое обеспечение определяет форму представления информации, которая в свою очередь характеризует информационный фонд (информационный фонд – одна из составляющих информационной системы).

Два аспекта использования ЛО: выражение смыслового содержания информационной составляющей ИС и выражение информационной потребности пользователя.

Состав лингвистического обеспечения (ЛО) информационных систем может быть представлен следующей схемой

Лингвистическое обеспечение ИС

Языки описания

 

Языки

данных

 

манипулирования

 

 

данными

 

 

 

ИПЯ, языки

 

Терминологические

запросов

 

структуры

 

 

 

 

 

 

линейные

 

иерархические

 

сетевые

 

 

 

 

 

Эта схема не классифицирует ЛО (т.е. не распределяет по признакам), она просто иллюстрирует эволюцию и особенности применения языковых средств в ИС.

44.Основные методы идентификации объектов.

Объекты – рассматриваемые в контексте понятия «информационная система» элементы реального мира, информацию о которых мы сохраняем и обрабатываем. Объект может быть материальным (например служащий, изделие) и нематериальным (имя, понятие). Типология задач идентификации объектов.

Сущностная

Уникальная

идентификаци

Функциональня

Идентификаци

объектов

Класификационная

Идентификаци

Описательная

Группы

объектов

Смешанная

Задачи уникальной идентификации объекта можно условно разделить на 2 группы:

1.Выделить объект для определения или описания его персональных (индивидуальных) характеристических свойств в рамках конкретной предметной области – сущностная идентификация

2.Выделить объект, выполняющий в данное конкретное время некоторую уникальную функцию – функциональная идентификация

Недостаток любой уникальной идентификации – её неинформативность, т.е. отсутствие каких – либо явных признаков(атрибутов), характеризующих объект с содержательной стороны.

В основе идентификации групп объектов может использоваться один из следующих методов:

1)Классификационный: Классификационная идентификация ориентирована на применение специализированных условных обозначений для объектов, у

которых выделенные свойства имеют одинаковые значения. В основе такой идентификации лежит использование мнемонических или классификационных кодов, однозначно характеризующих объект.

Мнемонический код предполагает однозначную расшифровку значений выделенных свойств объекта. Например, условное обозначение «Электронасос ГНОМ 100-25»: Г – для грязной воды, Н – насос, О – одноступенчатый, М – многоблочный, 100 – с подачей 100 м³/ч, 25 – с напором 25 м.

Классификационный код устанавливает взаимнооднозначное соответствие характеристики объекта стандартным кодификаторам и классификаторам. Классификационные методы обеспечивают систематизацию объектов в соответствии с некоторой заданной классификационной схемой. Код, присвоенный отдельному классу(как и мнемоническое обозначение), обеспечивает его полную идентификацию в рамках конкретного классификатора.

2)Описательные методы идентификации. Используются в тех случаях, когда необходимо идентифицировать конкретный объект или группу объектов путем описания произвольного набора его характеристик. Описательный метод предполагает наряду с указанием классификационных характеристик выделение дополнительных наборов свойств, углубляющих характеристику объекта и сужающих область поиска.

В ряде случаев для идентификации объектов используются ссылки на нормативные документы, содержащие описания конкретных характеристик (свойств, показателей, отличительных признаков). Тогда идентификация объекта включает наименование объекта и ссылку на документ, содержащий требования к этому объекту.

Одним из основных преимуществ описательного метода идентификации является возможность осуществления сопоставительного анализа однородных (родственных) объектов путем сравнивания характеристик, вошедших в их идентификацию. Такое сравнение позволяет выбрать объект, обладающий наилучшими характеристиками для заданных условий применения или обеспечивающий полную замену другого. Описательные методы широко используются в медицине, в криминалистике, в геологии.

3)Смешанные методы. Предполагают использование при характеристике предмета всех возможностей и преимуществ как классификационных, так и

описательных методов. Наряду с произвольным многосторонним описанием объекта могут быть заданы его атрибуты, определяющие принадлежность к определенному классу некоторой классификационной схемы, а также ссылки на нормативный документ, где помещены все его характеристики.

Преимущества методов идентификации группы объектов состоят в их большей информативности: идентификация объекта непосредственно содержит информацию, позволяющую, с одной стороны, группировать объекты, обладающие определенным набором признаков, и, с другой, выделить объекты с уникальными свойствами в рамках одной классификационной группы.