- •Тема: «Представление информации»
- •Статистическая обработка данных.
- •Статистическая оценка законов распределения Статистическая оценка плотности вероятности.
- •Статистическая оценка функции распределения
- •Статистическая оценка числовых характеристик случайной величины
- •Точечные оценки числовых характеристик
- •Регрессионный анализ
- •Проверка статистических гипотез
- •Критерий качества оценки решающего правила
- •Интеллектуальный анализ данных
- •Предварительная обработка
- •Предварительная обработка при мультипликативной помехе
- •Локализация объекта распознавания
- •Идентификация
Интеллектуальный анализ данных
Отличительная черта систем интеллектуального анализа данных это принятия классификационного решения о типе объекта. Систему интеллектуального анализа данных можно представить в следующей обобщенной схеме:
…
ИВ – испытательное воздействие.
ОА – объект анализа.
Д – датчик
АЦП – аналого-цифровой преобразователь
БКХ – блок кодирования и хранения
ПрО – предварительная обработка
С – сегментация
И – идентификация
К – классификация
ОА – поток
ИВ – освещение
Свет отражается от наших лиц и поступает на датчик (камера)
Целью сегментации является сокращение объема обрабатываемой информации и объединение значений по определенному принципу.
Вектор признаков поступает на классификацию для обработки.
Испытательное воздействие может иметь различную физическую природу и для генерации его используется достаточно сложный и дорогостоящие приборы и устройства. Это воздействие может быть потоков ионов или электронов (электронно-ионная телескопия), акустическим воздействием, рентгеновскими гамма излучениями, электромагнитным полем (система радио виденья), тепловое поле. Одной из главных задач испытательного воздействия является обеспечение равномерности освещающего пучка. Во многих практически важных областях это достаточно сложная и дорогостоящая задача, в других областях эта проблема не решена даже в научном плане.
Испытательное воздействие отражается от объекта и если пучок неравномерный, то плотность пучка отражается на отражающую способность объекта и возникает мультипликативная помеха.
Целью датчика является преобразование отраженного от объекта испытательного воздействия в электрический сигнал. Одной из основных характеристик датчика является уровень шумов.
Электрический сигнал полученный на выходе из датчика, как правило, является непрерывным или аналоговым. Этот сигнал существует в любой момент времени и может принять любое значение в заданном диапазоне. Так как во времени это бесконечное число значений, то аналоговый сигнал не может быть подвергнут компьютерной обработке. Для того чтобы преобразовать этот сигнал для обработки для компьютера используется АЦП.
Действие АЦП:
Формируется последовательность отсчетов, которая существует только в моменты времени
,
где
– целое число, а
-
шаг дискретизации.Квантование – диапазон разбиения сигнала разбивается на интервалы. Отсчет попавший в интервал округляется или отсекается. В результате количество градаций сигнала становиться конечным.
Сигнал подверженный дискретизации называется дискретным. А дискретизации и квантованию – цифровым.
При большом шаге дискретизации возможна потеря информации, а малый шаг увеличивает количество данных.
Шаг дискретизации выбирается на основании теорем Котельникова-Шеннона:
Если сигнал ограничен
в спектральной области Fв
(верхняя частота), то в случае если
выполняется следующее правило
,
то аналоговый сигнал можно восстановить
из дискретного, с любой заданной точностью
и потеря информации не происходит.
Операция квантования необратима – цифровой сигнал принципиально отличается от аналогового и аналоговый сигнал полностью быть восстановлен не может. …
Для оценки шума квантования используют дисперсию.
Для того чтобы уменьшить шум квантования нужно уменьшить интервал, но это приводит к увеличению разрядов.
Применение неравномерного квантования (расстояние между уровнями не одинаковое) – в этом случае расстояние определяется в таком случае, чтобы минимизировать дисперсию. Расстояние между уровнями определяются законами распределения шума квантования.
Задача минимизации решена для нормального закона распределения шума квантования, полученный неравномерный квантователь получил название Макса-Ллойда.
БКХ (блок кодирования и хранения)
Как правило реальные изображения и сигналы обладают статистической и семантической избыточностью.
Статистическая избыточность определяется статистическими связями между элементами в информационной последовательности и не равной вероятностью их появления. При статистическом кодировании, первичная информационная последовательность преобразуется во вторичную. Таким образом, чтобы результат был близок к взаимно-независимым и равновероятным отсчетам (условие максимума информационной энтропии).
Семантическая (логическая) избыточность обусловлена тем, что в сигнале или изображении присутствует информация, которая не влияет достижение цели обработки.
