- •1. Методы распределенной обработки данных
- •1.1. Цели распределенной обработки данных
- •1.3. Архитектура удаленного доступа
- •1.5. Многоуровневые модели. Модель сервера приложений
- •1.6. Физическая модель срод
- •Основные понятия сетевой терминологии
- •2. Распределенные базы данных
- •2.2. Режимы работы с бд
- •2.3. Классификация систем по способам обработки данных
- •2.6. Свойства распределенных баз данных
- •2.7. Функции и архитектура сурбд
- •2.8. Распределенная база данных на примере вуЗа
- •3. Параллельные процессы (или процесс транзакций)
- •3.1. Транзакции
- •Свойства транзакций
- •3.2. Параллелизм операций над бд
- •3.3. Проблемы параллельных процессов
- •3.4. Элементы блокировки.
- •3.5. Расписание транзакций Последовательное исполнение транзакции при использовании блокировок элементов замедляет процесс работы с бд, хотя и работает правильно. Т1: lock a; unlock a;
- •3.6. Модели с блокировками для чтения и записи
- •3.7. Блокировки в Visual FoxPro
- •4. Структурированный язык запросов sql
- •5. Безопасность бд
- •5.3. Целостность данных
- •5.4. Шифрование данных
- •6. Хранилище данных
- •6.1. Концепции хранилища данных
- •6.2. Многомерная модель данных
- •6.4. Интеллектуальный анализ данных
- •7. Базы данных в Интернете
- •7.1. Язык html
- •Гипертекстовые ссылки
- •7.3. Средства взаимодействия.
- •8.1. Архитектура сервера
- •8.2. Табличные пространства и файлы данных
6.4. Интеллектуальный анализ данных
(Data Mining – добыча данных)
В OLAP системах аналитик выдвигает гипотезы и затем проверяет их. Он решает задачи, основываясь на своих знаниях и опыте. Однако знания есть не только у человека, но и в накопленных данных, которые подвергаются анализу. Такие знания называются “скрытыми”, так как они содержатся в гигабайтах и терабайтах информации, которые человек не в состоянии исследовать самостоятельно. Для определения скрытых знаний необходимо применять специальные методы анализа, при которых приходится практически добывать знания из “завалов” информации.
Пятницкий-Шапиро в 1996г. дали следующее определение добычи данных.
Data Mining – исследование и обнаружение машиной (алгоритмами, средствами искусственного интеллекта) в сырых данных скрытых знаний, которые ранее не были известны, нетривиальны, практически полезны, доступны для интерпретации человеком.
Свойства обнаруживаемых знаний:
- должны быть новые, ранее неизвестные,
- нетривиальны,
- практическими,
- доступными для понимания.
В Data Mining для представления полученных знаний служат модели. Наиболее распространенными являются: правила, деревья решений, кластеры и математические функции. А также: классификация, регрессия, поиск ассоциативных правил и кластеризация.
Вопросы
-
Дайте определение хранилища данных
-
Задачи СППР
-
На основе, каких средств, производится анализ данных?
-
Что такое витрины данных?
-
Каковы составляющие схемы СППР?
-
Каково представление данных в ХД?
-
Для чего используется OLAP система?
-
Способы реализации многомерной модели в OLAP системах.
-
Отличие MOLAP систем от ROLAP.
-
Основные схемы реализации многомерного представления данных.
-
Интеллектуальный анализ данных?
-
Свойства обнаруживаемых знаний в Data Mining.
7. Базы данных в Интернете
В 90х годах появилась новая технология, которая позволила связывать территориально разнесенную информацию и осуществлять к ней единообразный доступ. Такой сетью явилась Internet. Internet - представляет собой глобальную информационную сеть, обеспечивающую пользователям быстрый доступ к целому океану различной информации. Появившаяся система WWW предельно упростила доступ к информации. Одним из способов электронного представления данных во всемирной сети является публикация баз данных в Интернете, позволяющая размещать информацию из базы данных на Web- страницах сети.
Различают следующие технологии: WWW (World Wide Web) - позволяет общаться пользователям сети. Используется архитектура «Клиент-Сервер».
Для адресации файлов, расположенных на серверах используется универсальный локатор ресурсов (URL – Uniform Resource Locater). URL включает в себя название протокола и адрес сервера. http://URL Для адресации данных используется доменная структура:
Адрес: http://kai.kazan.ru При обращении к серверу, с сервера поступают текстовые файлы с расширением html.
7.1. Язык html
HTML (Hyper Text Markup Language) – это язык гипертекстовой разметки. Для построения HTML страниц используется теговая модель. Теги – это управляющие коды, которые заключаются в угловые скобки <…>. Типы тегов: 1. Структурные 2. Текстовые 3. Кадровые 4. Табличные 5. Графические 6. Ссылочные 7. Теги форм 8. Теги внедряемых объектов (модули, аплеты, объекты ActiveX)
Тело документа начинается и заканчивается тегом HTML <HTML> тело документа </HTML> Пример: <HTML> <HEAD> <TITLE> <Заголовок> название документа</TITLE> </HEAD> <BODY> <Тело документа> </BODY> </HTML>
Тело документа
· Заголовки H1-H6 (<H1> … </H1>) Пример: <H1 ALIGN=center> Заголовок </H1> · Параграф <P> - начинать абзац с новой строки. Пример:
<P> Абзац1 <P> Абзац2 · Перенос строки <BR> - может стоять в начале или в конце параграфа · Шрифт <I> … </I> - курсив <B> … </B> - полужирный <U> … </U> - подчеркивание <TT> … </TT> - пишущая машинка · Размер шрифта <BASEFONT> - размер шрифта (базовый от 1 до 7) <FONT> - текущий шрифт Пример: <P> < BASEFONT SIZE=4> основной шрифт <P> <FONT SIZE=+1> крупнее основного на 1 <P> <FONT SIZE=7> самый большой размер шрифта · Для задания гарнитуры и цвета внутри тега FONT используются атрибутыFACE и COLOR. <FONT FACE=”Helvetica” SIZE=’7’ COLOR=”Blue”>
Списки
Списки бывают:
· Ненумерованные <UL> · Нумерованные <OL> Пример: <UL> <Li> первый элемент списка <Li> второй элемент списка <Li> третий элемент списка </UL> Результат:
-
первый элемент списка
-
второй элемент списка
-
третий элемент списка
<LH> - тег, позволяющий именовать списки
Пример.
<HTML>
<HEADE>
<TITLE>Пример вложенных списков</TITLE>
</HEADE>
<BODY>
<H1>Списки товаров</H1>
<UL>
<LI>Мебель
<UL>
<LI>Стол
<LI>Шкаф
<LI>Комод
</UL>
<LI>Автомобили
<UL>
<LI>ВАЗ
<LI>Волга
<LI>Ока
</UL>
</UL>
</BODY>
</HTML>