
- •Тема: «Представление информации»
- •Статистическая обработка данных.
- •Статистическая оценка законов распределения Статистическая оценка плотности вероятности.
- •Статистическая оценка функции распределения
- •Статистическая оценка числовых характеристик случайной величины
- •Точечные оценки числовых характеристик
- •Регрессионный анализ
- •Проверка статистических гипотез
- •Критерий качества оценки решающего правила
- •Интеллектуальный анализ данных
- •Предварительная обработка
- •Предварительная обработка при мультипликативной помехе
- •Локализация объекта распознавания
- •Идентификация
6.09.2012
Тема: «Представление информации»
Любое практическое исследование на начальном этапе включает стадию сбора информации. Для изучения предмета или объекта необходимо систематизировать данные. Для обобщения необходимо выделять совокупности общих или различных свойств объектов. Такие свойства называются признаками. Признаки бывают:
Детерминированные
Логические
Вероятностные
Структурные
Одним из универсальных представлений является табличное. Чтобы извлечь информацию необходимо представить данные в виде модели. Модель – абстрактное представление данных с целью улучшения интерпретации.
Виды моделей:
Математическая
Физическая
Информационная
Классификация моделей:
Гипотеза (какое могло бы быть).
Феноменологические модели (если бы это произошло)
Информационные модели рассматривают объекты в виде «черного ящика» с входящим и выходящим
Упрощения (опустим для ясности некоторые детали)
Эвристическая модель (подтверждений нет, но модель позволяет понять суть)
Аналогия (учтём особенности предыдущего опыта)
Мысленный эксперимент (состоит в опровержении возможностей)
Демонстрация возможности (показать внутреннее непротиворечие)
Типы шкал признаков:
Непрерывная шкала – признаки могут принимать любые вещественные значения.
Дискретные шкалы – признаки не являются вещественными:
Номинальные шкалы – применяются если число не является выражением какой-то меры а служит меткой варианта ответа на вопрос.
Порядковые – целое число отражает степень проявление определённого качества (степень уверенности).
При представлении и обработке данных необходимо учитывать :
Не всегда признаковые таблицы полные (неопределённые данные)
Значение признаков измеряется с определенной точностью.
Данные допускают отклонения (данных)
Представление данных
Для представления данных часто используется признаковое геометрическое пространство.
|
X1 |
X2 |
01 |
10 |
20 |
02 |
11 |
22 |
03 |
20 |
5 |
… |
23 |
7 |
В таком пространстве объекты представляются точкой, координаты которой являются значениями признаков. Если есть допустимость, то вместо точки изображаем геометрическую фигуру.
Классом называют область в признаковом пространстве, объединённая схожестью свойствами объектов.
Пример формального анализа
|
Признак |
Правило |
Класс |
Решение анализа |
+ |
+ |
+ |
Классификация |
+ |
? |
+ |
Кластеризация сегментация |
+ |
+ |
? |
Информатизация признакового пространства |
? |
+ |
+ |
Для построения правила решений вводится понятие метрики пространства. Метрические пространства должны удовлетворять следующим свойствам:
Метрика должна быть положительна
Симметрична
Метрика равна 0, если объекты совпадают
(A=B)
Для того чтобы величина была метрикой необходимо
13.09.2012
Тема: «Статистическая обработка данных»
Параграф: Основные сведенья из теории вероятности.
Случайное событие – событие, которое может произойти и может не произойти. Существует достоверное и невозможное событие.
A, B, C – обозначение случайных событий.
Случайные событие бывают совместные и несовместные (наступление одного исключает события другого). Противоположные событие в группе составляют достоверное событие (например: подбросить монету).
Полная группа – это попарно несовместные события, которые вместе составляют достоверные события.
Алгебра событий:
Сумма событий -> C=A+B -> заключает в себе события и A и B.
Произведение событий -> C=AB -> произойдет и событие A и событие B.
Классическое определение вероятностей:
-> n- общее количество, m
– благоприятствующие события.
C=A+B
->
– если они не совместны.
C=A+B
->
– если они не зависимы
– при условии, что событие А уже произошло.
Формула полной вероятности (формула Байеса):
– вероятность того, что студент сдавший
экзамен будет с группы с плохой
посещаемостью.
Случайная величина – определяет:
Отношение строгого порядка, введенного на множестве элементарных событий.
Вероятностью того, что это случайная величина примет конкретное значение.
|
1 |
2 |
3 |
4 |
5 |
6 |
|
|
|
|
|
|
|
- для кубика.
|
1 |
2 |
|
|
|
- для монеты.
Если случайная величина может принять любое значение из диапазона, тогда она называется аналоговой (или непрерывная).
– это функция, полученная как попадание
случайной величины в бесконечно малый
интервал.
Функция распределения
->
Пример:
|
1 |
2 |
3 |
4 |
5 |
6 |
|
|
|
|
|
|
|
– не бывает грани меньше единице.
Для нахождения функции:
Числовые характеристики случайных величин делятся на три группы:
Центра группирования
Разбросы или вариации.
Статистические связи.
20.09.2012.
Числовые характеристики центра группирования:
Среднее арифметическое или математическое ожидание – если величина дискретная, то мы можем найти значение просуммировав все результаты и разделив на количество
– базовая формула нахождения математического ожидания.
Для
непрерывной случайной величины
Мода – применяются в случае, если закон распределения мультимодален и эти точки наибольшей вероятности.
.
Медиана – используя полученные данные в порядке возрастания. В качестве результата обработки используем результат расположенный посередине. 1,6 1,85 1,75 5,4 1,7 1,6 1,7 1,75 1,85 5,4 ... …
Физический смысл – вероятность того, что величина будет меньше этого значения, равна вероятности появления большего значения.
Квантиль уровня 0,9 – это значение в точке распределения 0,9 (Графически).
Для разрешения мультипликативного фактора мы логарифмируем значение закона распределения. (?)
Дисперсия – характеризует разброс значений распределения.
Среднеквадратическое отклонение -
.
Числовые характеристики …
X – случайная величина рост.
Y – случайная величина вес.
– значение отклонения
– значение отклонения
Ковариация
-
Нормирование
-
Коэффициент
корреляции -
.
Закон больших чисел
При достаточно большом количестве испытаний, математическое ожидание приближается к среднему значению вероятности.
X1, X2, …, Xn – закон распределения среднего арифметического не зависит от законов распределения каждого значения распределения.
(Центральная предельная теорема)
4.10.2012