Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Otvety_na_voprosy_GEK.docx
Скачиваний:
14
Добавлен:
01.04.2025
Размер:
6.7 Mб
Скачать

3. Метод последовательной верхней релаксации

Метод последовательной верхней релаксации (ПВР) основан на линейной экстраполяции по двум итерационным шагам метода Зейделя. Новое значение каждого компонента вектора неизвестных X вычисляет­ся по формуле:

(6)

где - значение i-того компонента вектора , получаемое на k-том итерационном шаге методом Зейделя (т.е. по формуле (5);

- релаксационный параметр, регулирующий сходимость.

Для матриц, встречающихся в задачах моделирования физических процессов (симметричных, положительно определенных с диагональным преобладанием, см. / 2 /), его значение может лежать в диапазоне от 0 до 2. При метод ПВР превращается в метод Зейделя. Для каж­дого типа матриц можно подобрать оптимальное значение параметра , позволяющее получить решение при минимальном числе итераций.

4. Матрично-векторное представление итерационных методов

В современных алгоритмах используется более красивое предс­тавление итерационных формул метода Якоби и Зейделя, основанное на векторно-матричной записи. Сначала матрица коэффициентов СЛАУ представляется в виде трех слагаемых:

, (7)

где A1 - нижняя треугольная матрица, D - диагональная матрица, A2- верхняя треугольная матрица.

Например, матрица раскладывается следующим образом:

Несложные преобразования, приведенные в / 2 /, позволяют полу­чить:

  • для метода Якоби:

(8)

  • для метода Зейделя:

(9)

Итерационные формулы состоят из двух частей: первая предс­тавляет собой СЛАУ, которую на каждой итерации нужно решить отно­сительно , а вторая - итерационный шаг. Решение СЛАУ проблемы не представляет, так как в первом случае матрица - диагональная, а во втором - нижняя треугольная.

Метод ПВР в матрично-векторной форме принимает вид:

(10)

  1. Метрические и неметрические меры сходства многомерных данных (евклидово и гильбертово пространство, основные аксиомы треугольника; корреляционные меры сходства, понятие оптимальных по различению мер сходства; сравнение частотных распределений – критерий хи-квадрат, применение критерия для проверки гипотез о статистической зависимости факторов).

Евклидово пространство

1) Пространство, свойства которого описываются аксиомами евклидовой геометрии.

2) Векторное пространство E над полем R действительных чисел, в котором каждой паре векторов x и y из E ставится в соответствие действительное число (называемое скалярным произведением (x, y) этих векторов). Через скалярное произведение в евклидовом пространстве определяются длина |x| вектора x и угол между векторами x и y:

а также вводится понятие ортогональности: ортогональными считаются векторы, если их скалярное произведение равно 0.

Примеры евклидовых пространств:

1) Множество всех векторов плоскости или трёхмерного пространства элементарной евклидовой геометрии с обычным скалярным произведением.

2) Конечномерное векторное пространство над R, в котором скалярное произведение векторов x = (x1, x2, ..., xn) и y = (y1, y2, ..., yn) определено формулой

(x, y) = x1y1 + x2y2 + ... + xnyn

(евклидово n-мерное арифметическое пространство).

Любые два евклидовых пространства одной и той же размерности изоморфны, т. е. существует изоморфизм соответствующих векторных пространств над R, сохраняющий скалярное произведение.

Бесконечномерное евклидово пространство обычно называют предгильбертовым пространством.

Гильбертово пространство, математическое понятие, обобщающее понятие евклидова пространства на бесконечномерный случай. Возникло на рубеже 19 и 20 вв. в виде естественного логического

вывода из работ нем. математика Гильберта в результате обобщения фактов и методов, относящихся к разложениям функций в ортогональные ряды и к исследованию интегральных уравнений. Постепенно развиваясь, понятие «Гильбертово пространство» находило все более широкие приложения в различных разделах математики и теоретической физики; оно принадлежит к числу важнейших понятии математики.   Первоначально Гильбертово пространство понималось как пространство последовательностей со сходящимся рядом квадратов (т. н. пространство l2). Элементами (векторами) такого пространства являются бесконечные числовые последовательности   x = (x1, x2,..., xn,...)   такие, что ряд x21 + x22 +... + х2n + ... сходится. Сумму двух векторов х + y и вектор lx, где l - действительное число, определяют естественным образом:   x + y = (x1 + y1,..., xn + yn,...),   lx = (lx1, lx2, ..., lxn,...)/   Для любых векторов х, y Î l2 формула   (x, y) = x1y1 + x2y2 + ... +xnyn + ...   определяет их скалярное произведение, а под длиной (нормой) вектора х понимается неотрицательное число      Скалярное произведение всегда конечно и удовлетворяет неравенству |(х, у)| £ ||x|| ||y||. Последовательность векторов хn называется сходящейся к вектору х, если ||хn-х|| ® 0 при n ® ¥. Многие определения и факты теории конечномерных евклидовых пространств переносятся и на Гильбертово пространство Например, формула      где 0 £ j £ p определяет угол j между векторами х и у. Два вектора х и у называются ортогональными, если (х, у) = 0. Пространство l2 полно: всякая фундаментальная последовательность Коши элементов этого пространства (т. е. последовательность хn, удовлетворяющая условию ||хпm||® 0 при n, m ® ¥) имеет предел. В отличие от евклидовых пространств, Гильбертово пространство l2 бесконечномерно, т. е. в нём существуют бесконечные системы линейно независимых векторов; например, такую систему образуют единичные векторы   e1 = (1, 0, 0,...), e2 = (0, 1, 0,...),...   При этом для любого вектора x из l2 имеет место разложение   x = x1e1 + x2e2 +...     (1)   по системе {en}.   Другим важным примером Гильбертово пространство служит пространство l2 всех измеримых функций, заданных на некотором отрезке [a, b], для которых конечен интеграл      понимаемый как интеграл в смысле Лебега. При этом функции, отличающиеся друг от друга лишь на множество меры нуль, считаются тождественными. Сложение функций и умножение их на число определяется обычным способом, а под скалярным произведением понимается интеграл      Норма в этом случае равна      Роль единичных векторов предыдущего примера здесь могут играть любые функции ji(x) из L2, обладающие свойствами ортогональности      и нормированности      а также следующим свойством замкнутости: если f(x) принадлежит L2 и      то f(x) = 0 всюду, кроме множества меры нуль. На отрезке [0,2p] в качестве такой системы функций можно взять тригонометрическую систему      Разложению (1) соответствует разложение функции f(x) из L2 в ряд Фурье      сходящийся к f(x) по норме пространства L2. При этом для всякой функции f(x) выполняется равенство Парсеваля      Соответствие между функциями f(x) из L2 и последовательностями их коэффициентов Фурье a0, a1, b1, a2, b2,... является взаимно однозначным отображением L2 на l2, сохраняющим операции сложения, умножения на числа, а также сохраняющим длины и скалярные произведения. Т. о., эти пространства изоморфны и изометричны, значит имеют одинаковое строение.   В более широком смысле под Гильбертово пространство понимают произвольное линейное пространство, в котором задано скалярное произведение и которое является полным относительно нормы, порождаемой этим скалярным произведением. В зависимости от того, определено ли для элементов Гильбертово пространство Н умножение только на действительные числа или же элементы из Н можно умножать на произвольные комплексные числа, различают действительное и комплексное Гильбертово пространство В последнем случае под скалярным произведением понимают комплексную функцию (х, у), определённую для любой пары х, у элементов из Н и обладающую следующими свойствами:   1) (х, х) = 0 в том и только том случае, если х = 0,   2) (х, х) ³ 0 для любого x из Н,   3) (х + у, z) = (x, z) + (у, z),   4) (lx, у) = l(x, у) для любого комплексного числа l,   5)    где черта означает комплексно сопряжённую величину. Норма элемента х определяется равенством   

Метрическое пространство есть упорядоченная пара  , где   — множество элементов (точек) произвольной природы, а   — числовая функция, которая определена на декартовом произведении  , принимает значения в множестве вещественных чисел и удовлетворяет следующим трём аксиомам[1]:

  1.  (аксиома тождества).

  2.  (аксиома симметрии).

  3.  (аксиома треугольника или неравенство треугольника).

Функция  , удовлетворяющая трём указанным аксиомам называется метрикой.

Нера́венство треуго́льника в геометриифункциональном анализе и смежных дисциплинах — это одно из интуитивных свойств расстояния. Оно утверждает, что длина любой стороны треугольника всегда не превосходит сумму длин двух его других сторон. Неравенство треугольника включается как аксиома в определение метрического пространстванормы и т.д.; также, часто является теоремой в различных теориях.

Аксиома 1: Существуют три точки не лежащие на одном отрезке.

Аксиома 2: Если прямая пересекает сторону треугольника и не проходит через его вершину, то она пересекает и другую сторону.

Будем считать, что изображение эталонного фрагмента (выбранного на снимке A и представляемого матрицей   размером  ), сравнивается с изображениями фрагментов снимка B в «зоне поиска»   размером  . Перекрытие между фрагментами определяется шагом  дискретной решетки   (в плоскости  ), на которой заданы наблюдаемые переменные   на A или   на B. В процессе скользящего поиска (когда каждый очередной фрагмент получается из предыдущего простым сдвигом на один дискрет) вычисляется «функция сходства» между изображением эталонного фрагмента   и изображениями текущих (контролируемых) фрагментов  . Здесь требуется найти функцию сходства, которая бы с максимально возможной точностью и достоверностью позволяла локализовать фрагмент, соответствующий изображению эталонного фрагмента, фиксируя таким образом сопряженные точки на снимках.

Взаимно соответствующие элементы изображений одного объекта на снимках должны, очевидно, удовлетворять соотношению

                (5.25)

где   и   - параметры контраста и средней освещенности;   - параметры относительного сдвига образца и его аналога на контролируемом снимке;  - шум;

В такой формулировке процедура селекции образца должна найти параметры   и  , характеризующие сдвиг реперных фрагментов.

Ради простоты будем считать, что параметр   не меняется по полю снимков, что позволяет перейти к центрированным переменным

.

В качестве меры различия в точке   будем брать среднеквадратичную ошибку

               (5.26)

которая минимизируется перебором всех допускаемых сдвигов эталона по заданной области контролируемого снимка. Считается, что в точке экстремума реализуется сходство, если  , где   - некоторый установленный порог. Из требования минимума ошибки   находим оценку  , подставляем ее в формулу (5.26) и приходим к выражению

.               (5.27)

Первый член выражения (5.27) - «энергия» эталонного сигнала, является величиной постоянной, не зависящей от параметров сдвига  . Поэтому точка экстремума не изменится, если мы нормируем среднеквадратичную ошибку к энергии эталона 

,

и вместо минимума нормированной среднеквадратичной ошибки будем искать максимум коэффициента корреляции текущего фрагмента с эталоном

.              (5.28)

Соблюдение условий достоверности обнаружения также приводит к необходимости установления порога для величины взаимной корреляции  : если  , то с заданной вероятностью гарантируется действительное сходство найденной пары фрагментов. Величина порога определяется функцией распределения коэффициента корреляции (при случайных выборках) и задаваемой доверительной вероятностью принятия решения о действительном сходстве фрагментов.

Функционирование данного (по существу классического) алгоритма при наличии искажений в изображениях рассмотрено в работе [5.9]. Различия между эталонным и текущим ( ) изображениями были обусловлены аддитивным шумом и геометрическими искажениями, которые моделировались аффинными преобразованиями координат изображений:  , где  - матрица относительного поворота изображений на угол   - коэффициент изменения масштаба. В работе показано, что среднее значение основного пика корреляционной функции геометрически искаженных изображений, нормированное к средней величине пика при отсутствии искажений, зависит от интенсивности искажений и при малых   и   имеет вид

Было практически продемонстрировано, что серьезным недостатком корреляционной меры сходства  является ее чувствительность к геометрическим искажениям видимых размеров сопряженных фрагментов  при изменении ракурса съемки.

 Обычно в качестве критериев эффективности процедур идентификации сходства принимается точность совмещения фрагментов и вероятность ложной привязки, когда экстремум функционала сходства значимо смещен относительно истинного положения. Анализ результатов имитационных экспериментов позволил сделать следующие выводы .

1. При наличии геометрических искажений существует оптимальный размер фрагмента эталонного изображения, позволяющий минимизировать вероятность ложной привязки. Оптимальный размер фрагмента пропорционален эффективному радиусу корреляции (полуширине графика автокорреляционной функции) и уменьшается с увеличением геометрических искажений.

2. При заданном уровне искажений размер эталонного изображения, при котором погрешность совмещения минимальна, меньше, чем размер изображения, необходимый для минимизации вероятности ложной привязки.

Здесь  можно порекомендовать использовать полезную модификацию метода идентификации сходства, заключающуюся в том, что искажения  геометрии на втором снимке (относительно первого) предварительно компенсируются аффинной (или полиномиальной) "подгонкой".  Например, параметры аффинного преобразования

=   ,    ,

можно оценивать адаптивно (в несколько "проходов"), когда на первом этапе задается достаточно большая зона  поиска по образцу, что позволяет на искаженном (по отношению к исходному) снимке находить сопряженные точки. Даже трех пар опорных точек достаточно, чтобы оценить  (в первом приближении) параметры аффинного преобразования и осуществить аффинную подгонку геометрии изображения   к геометрии изображения  . Это дает возможность повторным просмотром найти уже существенно большее число пар сопряженных точек  на исходном   и аффинно-преобразованном    снимках и  уточнить по ним  параметры  аффинной аппроксимации.  Дальнейшее повторение этой процедуры  позволяет, в принципе, идентифицировать любое (допустимое данной аппроксимацией) число пар сопряженных точек и, следовательно, добиться заданной точности в оценивании параметров геометрического преобразования.

Поиск по образцу в данном методе сводится к вычислению нормированной взаимной корреляции распределения яркости (двумерного  сигнала) на текущем фрагменте первого снимка с распределениями яркостей  фрагментов, лежащих в некоторой предполагаемой окрестности образа этого фрагмента на аффинно-преобразованном втором снимке и определению целочисленных параметров взаимного смещения исходного фрагмента и его образа, устанавливаемого по экстремуму  корреляционного функционала.

 Критерием для определения схожести и различия кластеров является расстояние между точками на диаграмме рассеивания. Это сходство можно "измерить", оно равно расстоянию между точками на графике. Способов определения меры расстояния между кластерами, называемой еще мерой близости, существует несколько. Наиболее распространенный способ - вычисление евклидова расстояния между двумя точками i и j на плоскости, когда известны их координаты X и Y:

(13.1)

Примечание: чтобы узнать расстояние между двумя точками, надо взять разницу их координат по каждой оси, возвести ее в квадрат, сложить полученные значения для всех осей и извлечь квадратный корень из суммы.

Когда осей больше, чем две, расстояние рассчитывается таким образом: сумма квадратов разницы координат состоит из стольких слагаемых, сколько осей (измерений) присутствует в нашем пространстве. Например, если нам нужно найти расстояние между двумя точками в пространстве трех измерений, формула (13.1) приобретает вид:

(13.2)

Для вычисления расстояния между объектами используются различные меры сходства (меры подобия), называемые также метриками или функциями расстояний.

Квадрат евклидова расстояния.

Для придания больших весов более отдаленным друг от друга объектам можем воспользоваться квадратом евклидова расстояния путем возведения в квадрат стандартного евклидова расстояния.

Манхэттенское расстояние (расстояние городских кварталов), также называемое "хэмминговым" или "сити-блок" расстоянием.

Это расстояние рассчитывается как среднее разностей по координатам. В большинстве случаев эта мера расстояния приводит к результатам, подобным расчетам расстояния евклида. Однако, для этой меры влияние отдельных выбросов меньше, чем при использовании евклидова расстояния, поскольку здесь координаты не возводятся в квадрат.

Расстояние Чебышева. Это расстояние стоит использовать, когда необходимо определить два объекта как "различные", если они отличаются по какому-то одному измерению.

Процент несогласия. Это расстояние вычисляется, если данные являются категориальными.

Критерий Пирсона, или критерий χ² (Хи-квадрат) — наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая требует статистической проверки.

Обозначим через X исследуемую случайную величину. Пусть требуется проверить гипотезу   о том, что эта случайная величина подчиняется закону распределения  . Для проверки гипотезы произведём выборку, состоящую из n независимых наблюдений над случайной величиной X. По выборке можно построить эмпирическое распределение   исследуемой случайной величины. Сравнение эмпирического распределения   и теоретического (или, точнее было бы сказать, гипотетического — то есть соответствующего гипотезе  ) распределения   производится с помощью специального правила — критерия согласия. Одним из таких критериев и является критерий Пирсона.

Для проверки критерия вводится статистика:

где   — предполагаемая вероятность попадания в  -й интервал,   — соответствующее эмпирическое значение,   — число элементов выборки из  -го интервала,   — полный объём выборки. Также используется расчет критерия по частоте, тогда:

где   — частота попадания значений в интервал. Эта величина, в свою очередь, является случайной (в силу случайности  ) и должна подчиняться распределению  .

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющегося функцией от результатов наблюдения.

Статистический критерий – это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н0.

Как уже отмечалось выше, следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер, так как принимаемые вывод основываются на изучении свойств распределения случайной переменной по данным выборки, а потому всегда существует риск допустить ошибку. Однако с помощью статистической проверки гипотез можно определить вероятность принятия ложного решения. Если вероятность последнего невелика, то можно считать, что применяемый критерий обеспечивает малый риск ошибки.

При проведении проверки статистических гипотез в первую очередь приходится решать задачи статистической проверки гипотез о:

1) принадлежности «выделяющихся» единиц исследуемой выборочной совокупности генеральной совокупности;

2) виде распределения изучаемых признаков;

3) величине средней арифметической и доли;

4) наличии и тесноте связи между изучаемыми признаками;

5) о форме корреляционной связи.

При проверке гипотез имеется возможность совершить ошибку двоякого рода:

а) ошибка первого рода - проверяемая гипотеза (нулевая гипотеза Н0) является в действительности верной, но результаты проверки приводят к отказу от нее;

б) ошибка второго рода - проверяемая гипотеза в действительности является ошибочной, но результаты проверки приводят к принятию.

В статистике в настоящее время имеется большое число критериев для проверки практически любых гипотез. Притом основные принципы их построения и применения являются общими. Для построения статистического критерия, позволяющего проверить некоторую гипотезу, необходимо следующее:

1) сформулировать проверяемую гипотезу Н0. Наряду с проверяемой гипотезой формулируется также конкурирующая (альтернативная) гипотеза;

2) выбрать уровень значимости, контролирующий допустимую вероятность ошибки первого рода;

3) определить область допустимых значений и так называемую критическую область;

4) принять то или иное решение на основе сравнения фактического и критического значений критерия.

Проверка статистических гипотез складывается из следующих этапов:

- формулируется в виде статистической гипотезы задача исследования;

- выбирается статистическая характеристика гипотезы;

- выбираются испытуемая и альтернативная гипотезы на основе анализа возможных ошибочных решений и их последствий;

- определяются область допустимых значений, критическая область, а также критическое значение статистического критерия (t, F) по соответствующей таблице;

- вычисляется фактическое значение статистического критерия;

- проверяется испытуемая гипотеза на основе сравнения фактического и критического значений критерия, и в зависимости от результатов проверки гипотеза либо отклоняется, либо не отклоняется.

Уровнем значимости будет называться такое малое значение вероятности попадания критерия в критическую область при условии справедливости гипотезы, что появление этого события может расцениваться как следствие существенного расхождения выдвинутой гипотезы и результатов выборки. Обычно уровень значимости принимают равным 0,05 или 0,01. Исходя из величины уровня значимости, можно определить критическую область, под которой понимается такая область значений выборочной характеристики, попадая в которую они будут свидетельствовать о том, что проверяемая гипотеза должна быть отвергнута. К критической области относятся те значения, появление которых при условии верности гипотезы было бы маловероятным.

Допустим, что рассчитанное по эмпирическим данным значение критерия попало в критическую область, тогда при условии верности проверяемой гипотезы Н0 вероятность этого события будет не больше уровня значимости. Поскольку выбирается достаточно малым, то такое событие является маловероятным и, следовательно, проверяемая гипотеза Н0 может быть отвергнута.

Если же наблюдаемое значение характеристики не принадлежит к критической области и, следовательно, находится в области допустимых значений, то проверяемая гипотеза Н0 не отвергается. Вероятность попадания критерия в область допустимых значений при справедливости проверяемой гипотезы Н0 равна 1.

Чем меньше уровень значимости, тем меньше вероятность браковать проверяемую гипотезу, когда она верна, т.е. меньше вероятность совершить ошибку первого рода. Но при этом расширяется область допустимых значений и, значит, увеличивается вероятность совершения ошибки второго рода.

Все значения рассматриваемой характеристики, не принадлежащие к критической области образуют так называемую область допустимых значений. Если наблюдаемое значение характеристики находится в области допустимых значений, то проверяемая гипотеза принимается с вероятностью.

можно было бы найти критическую точку Ккр распределения f(k), которая распределила бы область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезыВыбор критерия для проверки статистических гипотез может осуществляться на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном условии значимости Н0.

рассчитать по выборочным данным наблюдаемое значение критерия Кнабл и определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой гипотезы Н0.Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае.

Как уже отмечалось ранее, проверка статистических гипотез применяется в разных областях для изучения массовых явлений. Изучение массовых явлений, как правило, осуществляется по неполной информации. В составе собранных данных могут встречаться единичные наблюдения, у которых отдельные значения изучаемых признаков заметно отличаются от общей тенденции изменения большинства значений. Причины таких отличий могут быть разными:

1) из-за ошибок наблюдения;

2) вследствие случайного стечения различных обстоятельств, каждый из которых в отдельности несущественный, но совокупное их влияние привело к таким резко выделяющимся от общей картины значениям признаков;

3) как следствие нарушения однородности изучаемой совокупности.

В общем случае все значения изучаемых признаков фиксируются по известным единицам совокупности по их части, отобранной с учетом всех требований. Следовательно, первичные статистические данные, включая и резко «выделяющемся», соответствуют конкретным случаям проявления изучаемого явления. Следовательно, субъективное отбрасывание «выделяющихся» единиц недопустимо.

Рассмотрим использование критериев для проверки статистических гипотез на примере закона нормального распределения. Закон нормального распределения лежит в основе многих теорем и методов статистики

- при оценке репрезентативности выборки (расчете ошибки выборки и распространении характеристик выборки на генеральную совокупность);

- измерении степени тесноты связи и составлении модели регрессии;

- построении и использование статистических критериев и др.

Как показывают многочисленные статистические исследования, частоты (частости) эмпирических распределений за редким исключением будут отличаться от значений теоретического распределения. Расхождения между частотами (частостями) эмпирического и теоретического распределения могут быть несущественными и объяснены случайностями выборки и существенными при несоответствии выбранного и эмпирического законов распределения.

Для проверки гипотезы о соответствии эмпирического распределения теоретическому закону нормального распределения используются особые статистические показатели-критерии согласия (или критерии соответствия). К ним относятся критерии К.Пирсона, А.Н. Колмогорова, Романовского, Ястремского и др.

Большинство критериев согласия базируется на использовании отклонений эмпирических частот от теоретических. Очевидно, что чем больше эти отклонения, тем хуже теоретическое распределение соответствует эмпирическому. Статистические характеристики таких критериев согласия являются некоторыми функциями этих отклонений.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]