Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика зачет.docx
Скачиваний:
113
Добавлен:
13.06.2017
Размер:
598.54 Кб
Скачать

47. Понятие экспертной системы.

Экспертная система (ЭС, англ. expert system) — компьютерная система, способная частично заменить специалиста-эксперта в разрешении проблемной ситуации. Современные экспертные системы начали разрабатываться исследователями искусственного интеллекта в 1970-х годах, а в 1980-х получили коммерческое подкрепление.

48. Применение экспертных систем.

а) Медицинская диагностика.

б) Прогнозирование.

в) Планирование.

г) Интерпретация.

д) Контроль и управление.

е) Диагностика неисправностей в механических и электрических устройствах.

ж) Обучение.

(если нужны подробности- http://plasma.karelia.ru/~ekostq/PUBLIC/IntSrIzm_NEW/..)

4. Области применения экспертных систем plasma.karelia.ru

49. Проблемы поиска информации в Интернет.

Дисклеймер. Так как наши вопросы основаны на учебниках 1797 года, некоторые вопросы (и особенно этот) уже давно не вопросы. Конкретно здесь - все проблемы, которые удалось нагуглить, были актуальны для поисковиков 209 лет назад. Сейчас всё изменилось, а поисковики остались. Так что имеем то, что имеем ©

Высокий риск натолкнуться неверную / нерелевантную информацию

Однако с развитием ПС этот риск снижается, и всё благодаря алгоритмам ранжирования поисковой выдачи, основанных на машинном обучении. Риск всё ещё остаётся на тех запросах, которые выполняются очень редко, когда предсказательная модель ранжирования не может нормально обучиться на маленькой выборке. Живой пример - неверные ответы на вопросы по физике.

Наполнение базы данных

Индексация всего Интернета - дело затратное, особенно по памяти. К тому же, многие поисковики даже кэшируют веб-страницы. Гигантский объем информации, которую надо где-то хранить. Но. Железо дешевеет, и всем как-то ̶п̶о̶е̶б̶а̶т̶ь̶ всё равно.

Язык поисковых запросов

Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно. Однако, опять же, с развитием поисковиков, потребность в использовании специального синтаксиса резко снизилась. Сегодня на >99% запросов поисковики выдают релевантные результаты без использования всяких понтовых фильтров.

Отклик поисковой системы

Жонглировать терабайтами данных за миллисекунды - главная задача поисковиков. И с этим они вполне справляются, благодаря светлым умам добрых программистов, которые реализовывают эффективные математические алгоритмы в программном коде. Хотя, раньше низкая скорость отклика была проблемой номер один. Раньше

50-

DB2 Universal Database (IBM)

Oracle 10g (Oracle)

SQL Server 2000 и SQL Server 2005 (Microsoft)

Adaptive Server Enterprise и Adaptive Server IQ (Sybase)

Teradata Database V2R6.0 (Teradata)

Netezza Performance Server 8000 Series (Netezza)

51

Существуют два типа графических файлов, это растровый и векторный, которые имеют различные форматы.

  1. растровому графическому файлу соответствуют форматы *.bmp, *.tif, *psd, *.gif, *.png, *.jpg;

  2. векторному графическому файлу соответствуют форматы *.wmf, *.eps, *.cdr, *.ai

Знание форматов файлов – являются основой работы с цифровыми фотографиями т.к. они определяют способ хранения информации в файле (растровый или векторный), а также форму хранения информации (используемый алгоритм сжатия). Сжатие применяется для растровых графических файлов, так как они имеют обычно достаточно большой объем. Сжатие графических файлов отличается от их архивации с помощью программ-архиваторов (гаг, zip, arj и пр.) тем, что алгоритм сжатия включается в формат графического файла.

52

Вот список наиболее известных систем ТМ:

- Transit швейцарской фирмы Star,

- Trados (США),

- Translation Manager от IBM,

- Eurolang Optimizer французской фирмы LANT,

- DejaVu от ATRIL (США),

- WordFisher (Венгрия).

Концепция фразеологического машинного перевода была впервые четко сформулирована профессором Г. Г. Белоноговым в 1975 г. Далее она была развита и в настоящее время реализована в ВИНИТИ в виде двух систем: системы русско-английского перевода (RETRANS) и систем англо-русского перевода (ERTRANS). Если в других системах перевода в качестве основной минимальной единицы смысла, представляемой в машинных словарях, рассматривается слово и их можно охарактеризовать как системы преимущественно пословного семантико-синтаксического перево­да, то в системах фразеологического перевода в качестве основной единицы смысла считаются фразеологические словосочетания, выражающие понятия, отношения между понятиями и ситуации. Это позволяет точнее передавать смысл переводимых текстов.

53

распознавание речи – процесс преобразования акустического сигнала, преобразованного в электрический, в последовательность слов

54

Документ в ODA представлен в виде профиля и собственно документа, организованных в форме древовидной структуры. Профиль содержит информацию о документе в целом и его прохождении; формальные признаки - дата составления, вид, регистрационный номер и так далее.

Собственно документ содержит текст и сведения о его структуре и стиле, а именно:

  • структуру документа - заглавие, параграфы, оглавление и тому подобное. (логическая структура), а также абзацы, расположение текста, шрифты (физическая структура);

  • архитектуру содержания - набор графических элементов, выделение определенных слов, строк и тому подобное.;

  • коммуникативный формат - способы кодирования объектов, признаков и содержания документов.

Логическая структура

База данных документальной ИПС IRBIS - это именованная совокупность массива документов и структурированных справочников, обеспечивающих эффективность поиска. Логическая структура БД документальной ИПС IRBIS представлена на слайде

Документ базы данных как структурированная форма представления информации в общем случае определяется своим уникальным (в массиве документов БД) идентификатором и составом полей.

Поле как часть документа представляет собой однозначно идентифицируемый в информационном массиве фрагмент, для которого определены тип, имя и характер обработки.

Слово как фрагмент поля, выделяемый по некоторым формальным (заданным в схеме представления документа) правилам, является единицей информации в операциях поиска.

Схема базы данных (документа) определяет логическую связь именования, физического размещения и наполнения полей, образующих документ, а также стратегию поиска (при этом представление всех или отдельных документов БД может быть доопределено контекстно средствами разметки. Использование встраиваемых определений структуры позволяет ввести «самоопределяемые» форматы представления документов. Это обеспечивает практически неограниченную гибкость при организации хранения коллекций разнородных документов, хотя и создает проблемы согласованного использования материала из-за возможности различной интерпретации определений). Особенностью этой реализации является логическая независимость схемы. Для одной базы данных может быть определено несколько разных схем, причем они в принципе равноправны, и в то же время одна и та же схема может быть использована для определения документов в нескольких БД.

В схеме документ определяется совокупностью описаний отдельных полей, для каждого из которых задается:

- идентификация материала в базе данных, обеспечивающая пользователю доступ средствами документального поиска;

- представление материала при вводе и выводе (формат и длина поля, размещение и оформление материала при отображении и т. д.);

- спецификация стратегии документального поиска (прямое сканирование записей или использование инвертированных поисковых справочников). Для полей, специфицированных как ключевые, т. е. имеющих поисковые справочники, дополнительно определяются правила формирования дескрипторов (заданием списков символов-разделителей слов и списков стоп-слов).

Логически непрерывный массив документов БД в общем случае размещается в нескольких физических файлах, данные в которых связаны через указатель логического следования.

Справочник базы данных размещается отдельно от массива документов и имеет специализированную структуру (частотный словарь, алфавитный индекс и инвертированные списки). Поисковые справочники являются производным по отношению к массиву документов.

у информационной системы куча определений

Вот одно из:

Информационная система - это организационно упорядоченная совокупность документов и информационных технологий, в том числе использующих средства вычислительной техники и связи, реализующих различные информационные процессы.

пам информации - документальные, фактографические и документально-фактографические ИС.

Документальные ИС включают информационно-поисковые системы (ИПС), информационно-логические и информационно-семантические системы.

Фактографические ИС делятся на две категории:

1) системы обработки данных (СОД),

2) автоматизированные информационные системы (АИС) и автоматизированные системы управления (АСУ).

Документально-фактографические ИС содержат:

1) автоматизированные документально-фактографические информационно-поисковые системы научно-технической информации (АДФИПС НТИ) и

2) автоматизированные документально-фактографические информационно-поисковые системы в автоматизированной системе нормативно-методического обеспечения управления (АДФИПС в АСНМОУ).