
- •1. Базы знаний. Основные определения и назначение дисциплины.
- •2. Знания и данные.
- •3. Модели представления знаний. Формальные логические модели. Продукционные модели.
- •4. Модели представления знаний. Семантические сети. Фреймы.
- •5. Формальные логические модели представления знаний.
- •6. Метод резолюций.
- •7. Продукционная модель представления знаний. Виды продукций (3).
- •8. Процесс разработки продукционной модели знаний. И-Или граф.
- •9. Экспертные системы. Методология разработки экспертных систем. Стратегии разрешения конфликтов.
- •10. Деревья решений. Определение, назначение.
- •11. Алгоритмы обучения деревьев решений. Алгоритм id3. Критерии разбиений.
- •12. Алгоритм c4.5
- •13. Алгоритм cart. Построение дерева классификации и регрессии.
- •14. Ансамбли деревьев решений. Алгоритм Random Forest.
- •15. Алгоритм cart. Метод Cost complexity tree pruning.
- •16. Алгоритм сart. Выбор итогового дерева решений. Метод V-fold cross-validation.
- •17. Модель представления знаний на основе семантических сетей.
- •18. Ассоциативные сети.
- •19. Концептуальные графы.
- •20. Фреймовая модель представления знаний. Описание модели.
- •21. Применение фреймовых моделей.
- •22. Ооп как модель представления знаний.
- •24. Семантические технологии Web (Semantic Web). Определение и общее назначение технологии. Преимущества семантических сетей для интернета.
- •25. Технологии Semantic Web. Архитектура Semantic Web. Описание стека технологий и как они приведут к реализации Semantic Web.
- •26. Технологии Semantic Web. Xml. XmlSchema.
- •27. Технологии Semantic Web. Rdf.
- •29. Особенности поисковых систем. Структура организации и алгоритм работы.
- •30. Язык запросов поисковых систем.
- •31. Семантическая поисковая система.
- •34. Процесс разработки онтологий.
- •35. Технологии Semantic Web. Owl.
- •36. Компоненты онтологического языка Web на основе owl.
- •37. Применение онтологий. Значение онтологий для бизнеса.
- •38. Система разработки онтологий Protйgй. Назначение. Модель
- •39. Data Mining. Определение, назначение и решаемые задачи.
- •40. Data Mining. Классификация.
- •41. Data Mining. Кластеризация.
- •42. Date Mining. Прогнозирование.
29. Особенности поисковых систем. Структура организации и алгоритм работы.
1) Поисковый робот: Как браузер просматривает страницы, анализируя и выделяя существенные компоненты и отсылает их в специальном виде на сервера поисковика, далее по ссылкам переходит на другую страницу. Порядок обхода страниц, частота визитов и алгоритм выделения значимой информации зависит от конкретного языка.
Индексация – выделение наиболее значимых термов из документа и соханение их в специальном виде (Под термом понимают все слова или понятия) D-> {t1, t2, …, tn}
Обратная индексация – для многих термов ищются документы, в которых они встречаются: t1-> D1, D2, …, Dm.
Ранжирование – упорядочивание по важности. Поиск определяет множество наиболее релевантных (соответствующих запросу) документов и выдает их в вершине поиска.
Наивный алгоритм ранжирования:
1) частота встречающегося терма
2) определение взвешенной суммы терма среди других слоев.
Модели поиска:
Подходы:
1) Логическая модель: t1 and t2 or t3 not t4
2) векторная модель
3) Вероятностный поиск – Доказательство оценивается по вероятности пользователя встретить в нем свой поисковый запрос.
30. Язык запросов поисковых систем.
Язы́к запро́сов — это искусственный язык, на котором делаются запросы к базам данных и другим информационным системам, особенно к информационно-поисковым системам.
Примеры:
SQL — де-факто стандартный язык запросов к реляционным базам данных.
Language Integrated Query — расширение для некоторых языков программирования в .NET Framework, добавляющее к ним SQL-подобный язык запросов.
XQuery — язык запросов, разработанный для обработки данных в формате XML.
XPath — язык запросов к элементам XML-документа.
Язык, на котором формулируются запросы к поисковым системам называется языком поисковых запросов или информационно-поисковым языком.
В различных поисковых системах язык запросов может различаться, однако обычно он является некоторым подобием языка регулярных выражений с дополнениями, связанными со спецификой работы той или иной поисковой системы. Знание и правильное применение языка запросов конкретной поисковой машины улучшает и упрощает пользователю процесс поиска информации.
Язык поисковых запросов состоит из логических операторов, префиксов обязательности, возможности учета расстояния между словами, морфологии языка, регистра слов, расширенных операторов, возможностей расширенного поиска, уточнения поиска.
Специльные операторы:
allintitle: чтобы результаты (терм-запрос) находились в заголовке
related: поиск в найденном
allinURL: ссылка с запросом
Ex: Related: цветы ~ полевые
^
|
синонимы
inURL: поик найденного запроса в тексте гиперссылки.
site: поиск в каком-либо сайте
link: поиск по сайтам, кот. ссылаются на данный запрос. (link: адрес)
into: адрес – выдает информацию о данном адресе
define: слово – поиск толкования
safesearch: безопасный поиск
Filetype: тип функции
Scholar – поиск в научных статьях и документах
Cache: адрес|слово
allintext: поиск ключевых слов только в тексте страницы
allinlinus: слова – поиск по названию гиперссылки