- •Характерные особенности современных информационных систем. Основные определения. Задачи теории систем.
- •2. Краткая историческая справка. Терминология теории систем. Понятие информационной системы. Системный анализ.
- •3. Качественные и количественные методы описания информационных систем. Кибернетический подход. Динамические описание информационных систем.
- •5. Принципы минимальности информационных связей агрегатов. Агрегат как случайный процесс.
- •6. Анализ и синтез информационных систем. Формализация результатов изучения систем. Выделение функций систем.
- •7. Методология постановок и алгоритмизация задач задач на макро-и микро-уровнях.
- •8. Методы синтеза структур информационных систем. Задача оптимизации структур. Интеллектуализация информационных систем.
- •9. Информационные процессы-основа информационных систем.
- •10. Понятие и структура информационного процесса.
- •11. Математические модели сигнала.
- •12. Частотная форма представления детерминированных сигналов.
- •13. Классификация методов дискретизации. Дискретизация по времени.
- •14. Выбор точности отсчетов по теореме Котельникова. Квантование по уровню.
- •2. Виды импульсной модуляции.
- •3. Импульсные и цифровые методы в системах автоматического управления
- •15. Модели процесса. Измерение информации.
- •16. Модель непрерывного и дискретного каналов связи.
- •17. Пропускная способность дискретного и непрерывного каналов связи
- •18. Оценки потерь информации. Понятие избыточности информации.
- •19. Рассмотрение информационного процесса на физическом уровне. Назначение и содержание процедур модуляции и демодуляции.
- •Гармоническая модуляция
- •3. Импульсная модуляция
- •4. Широтно-импульсная модуляция
- •5. Дискретная модуляция
- •20. Сравнительные характеристики по помехоустойчивости различных видов модуляции.
- •21. Цифровые методы модуляции. Информационные характеристики сигнала и канала.
- •Цифровая модуляция
- •22. Согласование статистических свойств источника сообщений и канала связи.
- •23. Сети передачи данных. Пропускная способность сети связи.
- •24. Методы решения задачи статистической маршрутизации. Рассмотрение информационного процесса на канальном уровне.
- •Связь между офисами на канальном уровне
- •Проблема шифрования на сетевом уровне
- •Детальное рассмотрение прозрачного шифратора
- •Аналогии с режимами шифрования блочных шифров
- •25. Общие понятия теории кодирования. Фундаментальные теоремы Шеннона о кодировании.
13. Классификация методов дискретизации. Дискретизация по времени.
Некоторые алгоритмы, используемые для создания моделей интеллектуального анализа данных в службах SQL Server Analysis Services, для своей работы требуют наличия специальных типов содержимого. Например, упрощенный алгоритм Байеса (Майкрософт) не может использовать непрерывные столбцы на входе и прогнозировать непрерывные значения. Кроме того, некоторые столбцы могут содержать так много значений, что алгоритм будет не в состоянии легко выявить содержательные закономерности в данных, из которых создается модель.
В таких случаях можно дискретизировать данные в столбцах, чтобы воспользоваться алгоритмами для выработки модели интеллектуального анализа данных.Дискретизация — это процесс разделения значений на сегменты, результатом которого является ограниченное число допустимых состояний. С самими сегментами обращаются как с упорядоченными дискретными значениями. Можно дискретизировать как численные, так и строковые столбцы.
Существует несколько способов дискретизации данных. Если в решении по интеллектуальному анализу данных используются реляционные данные, можно ограничить число сегментов, используемых для группирования данных, задав свойство DiscretizationBucketCount. Число сегментов по умолчанию равно 5.
Если в решении интеллектуального анализа данных используются данные из куба оперативной аналитической обработки (OLAP), то алгоритм интеллектуального анализа данных автоматически вычислит число создаваемых сегментов по следующей формуле, где n — число уникальных значений данных в столбце:
Number of Buckets = sqrt(n)
Если не нужно, чтобы службы Analysis Services вычисляли число сегментов, можно воспользоваться свойством DiscretizationBucketCount, чтобы вручную указать число сегментов.
Следующая таблица описывает методы, которые можно использовать для дискретизации данных в службах Analysis Services.
Метод дискретизации |
Описание |
AUTOMATIC |
Службы Analysis Services определяют, какой метод дискретизации использовать. |
CLUSTERS |
Алгоритм разделяет данные на группы путем создания выборки обучающих данных, инициализации по ряду случайных точек и дальнейшего запуска несколько итераций алгоритма кластеризации (Майкрософт) с помощью метода кластеризации с максимизацией ожидания (EM). МетодCLUSTERS полезен, так как он работает с любой кривой распределения. Однако он требует большего времени на обработку, чем другие методы дискретизации. Этот метод можно использовать только для числовых столбцов. |
EQUAL_AREAS |
Алгоритм делит данные на группы, содержащие равное число значений. Этот метод лучше всего использовать для кривых нормального распределения, но он не работает, если распределение содержит большое число значений, встречающихся в узкой группе непрерывных данных.Например, если половина элементов имеет значение цены 0, то половина данных окажется в одной точке кривой. При таком распределении, этот метод разрушит данные в попытке установить равномерную дискретизацию по нескольким областям. Это вызовет неточное представление данных. |
