Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Коршунов / ЛабРаб1234MMO.doc
Скачиваний:
16
Добавлен:
26.04.2015
Размер:
251.9 Кб
Скачать

5

Лабораторная работа №1. При создании и актуализации ГПД (карт, ЦКМ, ортофото и т.п.) перед тем, как запустить проект в работу проводится оценка качества исходного материала. Для этого набирается представительная выборка измерений, по коим получают надежные оценки метрического качества материала.

Для примера получить оценки ЦМР из 200 высот точек и проверить Ho (0-гипотезу): высоты следуют нормальному распределению. Найти все оценки, указанные в примере и в списке оценок. Оценить надежность найденных значений, робустность оценок: какие устойчивы, какая как, куда и насколько смещается.

ПРИМЕР построения статистического ряда. Избыточное число цифр после запятой дано только для наглядности.

номера ___1____2___3_____4____5____6_____7____8_____9___10_

границы 0 2 4 6 8 10 12 14 16 18 20

середины х 1 3 5 7 9 11 13 15 17 19

частоты m* 8 4 12 20 28 53 30 29 9 7

кумул.част m* 8 12 24 44 72 125 155 184 193 200

эмп вер p* .040 .020 .060 .100 .140 .265 .150 .145 .045 .035

кумул вер .040 .060 .120 .220 .360 .625 .775 .920 .965 1.000

ВЫбОРОЧНЫЕ ОЦЕНКИ

.04 .10 .4 1.1 2.36 5.275 7.225 9.40 10.165 10.83

-9.83 -7.83 -5.83 -3.83 -1.83 0.17 2.17 4.17 6.17 8.17

=16.3511 m3 =(x-xср)3p*= 24.25636 А= 0.3668

S=4.0436 m4 =(x-xср)4 p*= 809.3899 Е= -0.02735

По параметрам xср, S вычисляем приведенные значения (x-xср)/s границ интервалов

-2.68 -2.184 -1.689 -1.194 -.700 -.205 .289 .784 1.279 1.773 2.268

ДЛЯ НОРМАЛЬНОГО распределения с

б) значения функции распределения на границах интервалов

.0037 .0147 .0456 .1162 .2420 .4188 .6149 .7835 .8995 .9619 .9882

Теоретическая вероятность пропадания в интервалы как разность граничных значений

.0110 .0308 .0706 .1258 .1768 .1961 .1687 .1160 .0624 .0263

Теоретические частоты попадания в интервалы

2.20 6.16 14.12 25.16 35.36 39.22 33.74 23.20 12.48 5.26

2 =27.20897 r=10-3=7 p=

Значения ФПВ на границах интервалов .03 .0 . . . . . .

Порядок проверки гипотезы о законе распределения по представительной выборке (см. пример):

1.Вычисляем количество интервалов k=1+3.32 ln200=1+3.32*17.59=19. В примере, приведено 10 групп.

2.Находим (xmin =1.239 и xmax =1.817), просматривая ряд и записывая каждые последующие большее и меньшее значения, получаем искомые числа – те числа, кои записаны последними.

3.Вычисляем длину интервала h=(xmax - xmin)/k=0.0578.

4.Вычисляем границы интервалов: x1 =xmin, x2=x1+h, x3=x1+2h,...x k+1=xmax . Удобно границы нумеровать с постоянным шагом через два: 0 2 4 6 8 10 12 14 16 18 20..., а потом учесть, что 2 соответствует h.

5.Вычисляем средние значения на каждом интервале x jср =(xj+x j+1)/2. (если номера, то целые числа: 1,3,5,7,9,11,13,15,17.

6.Находим частоты m*j попадания в интервалы, просматривая ряд и проставляя 1 в том интервале, куда попадает очередное значение.

7. Вычисляем эмпирические вероятности p* j =m* j /n .

8. Строим по ним гистограмму (можно и эмпирическую функцию распределения).

9. Вычисляем четыре оценки: среднее xср=xip*, дисперсию S2=(xi-xср)2p* и СКО S; асимметрию m3 =(xi-xср)3p* и A= m3 /S3 ; эксцесс m4=(xi-xср)4 pi*; Е=(m4 /S4 )-3, где xi - середина i-го интервала. Здесь два пути: если значения границ и середин интервалов простые или целые числа, то используем их. Если громоздкие, как у вас, то проще пронумеровать границы (0,2,4…) и считать по номерам. Единицей измерения будет номер. Оценки получатся в номерах и их долях. Сопоставляя «2» и h, переходим к реальным единицам.

Преимущества: проще контроль, ибо числа изменяются на целочисленный шаг, и определение вероятностей теоретического распределения.

10. По предполагаемому (здесь нормальному) распределению находим значения функции распределения на границах интервалов. Разности значений дают теоретические вероятности p попадания в интервал. Умножив p на n=200, получим теоретические значения частот mj.

11. По частотам строим гистограмму предполагаемого распределения, совмещенную с эмпирическим. На ней найти (или нанести по функции распределения), среднее весовое хср (мат ожидание Медиану, Сгиб (как среднее между 25% и 75% квартилью), Центр распределения = среднее (#100+# 101)/2 в ранжированном ряду), Моду,. Найти и нанести на гистограмму СКО хср и границы доверительного интервала хср. Заштриховать положительные и отрицательные разности эмпирических и теоретических вероятностей.

12. По расхождениям частот на интервалах (m* -m)j вычислить оценку 2 =27.21. Для нее по распределению 2 выбрать значение p при числе степеней свободы r=10-3=7. (У вас другие числа будут).

13. Если Н0 не отвергается, то строите сглаживающую кривую эмпирического распределения. ВНИМАНИЕ, на графике гистограмм, эмпирической и построенной по предполагаемому закону, показывают вероятности. На графике функции плотности вероятности - плотности. Поэтому графики несовместимы: на гистограмме вероятность - это высота столбика, на графике функции плотности вероятности - вероятность - это площадь столбика.

ИЗ ТЕОРИИ. Критерий согласия указывает правило вычисления критического значения характеристики, которое обеспечивает единообразный подход для принятия решения о согласии эмпирического распределения с предлагаемым законом, для принятия H0. Критерием называют и числовую характеристику.

Критерий 2 Пирсона. Числовая характеристика 2=(m*j -npj )2/(npj), j=1,k, где n -объем выборки, m*j количество наблюдений, попавших в j-й интервал; pj - теоретическая вероятность попадания наблюдения в этот интервал, откуда npj =mj - теоретическая частота попадания наблюдений в j-й интервал. Если вынести за скобки n и учесть m*j/n=p*j (эмпирическая вероятность), то: 2=(p*j -p j)2 n/pj , j=1,k . Это сумма квадратов уклонений теоретической вероятности от полученной из выборки. Каждому квадрату уклонения приписан вес n/pj , т.е. есть квадратичная форма (сферическая норма) [pv2]. Так как вероятность pj<<1, то вес тем больше, чем меньше pj . Каждому наблюдению приписывается вероятность 1/n. Для больших вероятностей p*j относительное влияние одного наблюдения невелико. Для малых - каждое попавшее в этот интервал наблюдение сильно влияет на значение p*j. Поэтому его вес больше. Если предполагаемый закон хорошо подходит к данным, то расхождения вероятностей (p*j -pj) следуют нормальному закону, а критерий - распределению . Применяют один из двух равнозначных подходов

(1). По числу степеней свободы r и заданной доверит. вероятности находят теоретическое значение критерия 2. При согласии данных опыта с теорией 2экс < 2 теор . Говорят: данные не противоречат выдвинутой гипотезе H0. Критерий не отвергает Н0. Если оценка в критической области p=1-, то гипотеза H0 отвергается.

(2). По числу степеней свободы r и эмпирической оценке 2 экс из распределения 2 находят доверительную вероятность  или вероятность попадания в критическую область p=1-. Если p более 0.1- 0.005, то H0 отклоняется.

Могут одновременно рассматриваться альтернативные гипотезы. При более тонком анализе учитывают вероятности ошибок 1го и 2го рода и их цену.

Определим степени свободы. Объем выборки n. Из него мы сформировали k групп (интервалов), которые определяют объем преобразованной выборки частот m*j . Причем m*j=n или p*j =1 (j=1,k). Это одно условие.

Далее вычислили оценки параметров предполагаемого закона. Каждая оценка дает одно условие, на него ушла одна степень свободы.( Если бы сравнивали выборку с распределением Пуассона, то достаточно одной оценки . Число степеней свободы было бы r=k-1-1= k-2.) Вы проверяете на нормальность. Это требует две оценки: мат- ожидания xср=xj p*j и дисперсии S2 =(x-xср)2j p*j. Поэтому при проверке на нормальность r=k-1-2= k-3.

Если надо НАЙТИ НОВОЕ аналитическое выражение для данных опыта, то вначале решают обратную задачу: находят оценки параметров при минимуме , например, по С.Н.К. Затем уже по2 экс и по r выбирают вероятность попадания в критическую область. Из двух новых выражений, дающих равные минимумы, лучшее то, где меньше параметров (больше степеней свободы), т.к. выше надежность определения оценок..

Искомые оценки центра распределения. Медиана значение, стоящее в центре ранжированного ряда. Не зависит от крайних значений такого ряда. Или же медиана это квантиль: граничное значение Х1/2, кое делит площадь под кривой плотности вероятности на две равные части. Определяют при большом разбросе или малой точности крайних значений, при асимметричных распределениях, когда среднее арифметическое ненадежно. Медиана слабо реагирует на отдельные большие отклонения, это робустная (надежная, устойчивая) оценка. При положительной асимметрии 1 смещено вправо от медианы, при отрицательной влево, т.е., к хвосту (к шлейфу) распределения.

Сгиб. Отбросив справа и слева в ряду значений СВ по 25% значений, берем геометрическую середину оставшегося интервала. Применяют при антимодальных распределениях, когда xср не существует.

Мода Мд наиболее часто встречающееся в выборке значение. Для непрерывной СВ максимум ФПП. Для дискретных – наиболее вероятное значение. Используют как характеристику центра распределения из-за простоты нахождения. Находят обычно при распределениях с большой асимметрией (для них среднее арифметическое не обладает максимумом плотности вероятности) как максимум частоты значений наблюдения в выборке x1,...,xn , т.е. Mo=X при p=max. Распределения классифицируют по количеству и положению пиков как одномодальные, многомодальные и антимодальные. При отрицательной асимметрии мода смещена вправо от 1, при положительной влево от 1, т.е. в противоположную от шлейфа (хвоста распределения) сторону

Искомые оценки рассеяния. СКО, САО, срединное отклонение, интерквантильная широта

Срединное отклонение: значение отклонения элемента выборки от среднего арифметического, стоящее в центре ранжированного по модулю ряда отклонений, т.е. это медиана отклонений. Характеризует рассеяние выборки, аналогично СКО или САО. Слабо реагирует на отдельные большие отклонения, это робустная оценка.

К в а н т и л и. При матобработке должно всегда определить вероятность того, что значения СВ не выйдут из заданного интервала, или же - найти длину интервала, в котором может находиться СВ при заданной вероятности. Для этих целей применяют наборы точечных характеристик, указывающих значения правых границ. Эти наборы обобщенно называют квантили. Если диапазон значений функции распределения 0 < F (х) < 1 разделить на k равных частей, то каждое соответствующее вероятностям 1/k, 2/k,... значение СВ X1/k,X2/k,... называют квантилью. Ряд квантилей имеет собственное название по числу k. Это медиана(2), квартиль(4), дециль(10), процентиль(100), промилле(1000). Квартили: первая- Х1/4, вторая-Х2/4 и третья X3/4 - это три значения абсциссы, которые делят площадь(!) под кривой плотности вероятности от Хmin до Хmax на четыре равные части. Вторая квартиль есть медиана.(X3/4 - Х1/4)/2 или (X3/4 - Х1/4). Оценка рассеяния интерквантильная широта X3/4 -:- Х1/4 характеризует отклонение от медианы с р=0.5. Она более устойчива, нежели СКО, т.е. робустная.

Лаб.Работа №2. На всех этапах выполнения проекта создания или актуализации ГПД фотограмметрическим методом оценивается качество выполнения каждого этапа, как исполнителем, так и проверяющим и принимающим работу.

Для этого применяется оценка распределения по малой выборке. Для примера получите оценки профиля ЦМВ из 25 точек: найти xср,S,A,E и их доверительные интервалы. Сравнить с нормальным распределением по этим оценкам. Подсчитать попадание в интервал СКО+-Sx. Вывод о смещенности Sx. Для выявления периодичности построить автокорреляционную функцию на участке до 17й точки (в качестве второй выборки берете первую, прибавив S к 5,10 и 15 точке). Указать Х максимумы коррелированности.

Пояснения. Выборка не представительна. Построить надежный ряд распределения нельзя: мало интервалов, в интервал попадет мало или ни одного значения. Поэтому вывод о не противоречии выборки предполагаемому закону делаете на основе оценок (а не частотного ряда).

Какие свойства пикетов высот описывает Хсред, СКО, А, Е и АКФ пикетов регулярной ЦМР

Корреляционную функцию находите по готовому шаблону в Excel, подставляя свои значения

Тип закона распределения предполагают, исходя из сущности задачи. Параметрами закона служат подходящие числовые характеристики. Так, при проверке на нормальность, вычисляют xср,S,A,E. Для оценки периода колебаний - корреляционную функцию. Первые две оценки определят конкретный близкий к эмпирическому распределению нормальный закон, если А и Е не выходят за пределы своих доверительных интервалов. При отрицательном Е - можно сравнить с равномерным, а при большом отрицательным - с бимодальным или антимодальным распределением. Расширенное толкование. Если объем выборки позволяет получить надежные оценки моментов пятого, седьмого, то, нормируя их можно точнее определить вид кривой: наличие прогибов и всплесков (мод). Если А выходит за пределы доверительного интервала, то, возможно, подойдут кривые Пирсона (см. статистику) Соотношение оценок помогает подобрать тип распределения. Для этого надо сравнить их с соотношениями числовых характеристик выбранного типа распределения. Например, выбрав закон Пуассона и получив четыре первых оценки, по их связи с его единственным параметром надежно проверяется согласие с ним выборки. Так как все широко употребляемые распределения взаимосвязаны, то для определения наиболее подходящего применяют методику, при которой исходной оценкой служит эксцесс (контрэксцесс), а другие характеристики получают из него.

Лаб.Работа №3. В процессе фотограмметрической съемки ситуации по ДДЗЗ контура объектов, горизонтали, профили аппроксимируют с помощью параметрических (Бернштейна, Безье) или степенных (сплайны, Чебышева) и др. видов полиномов. Отсюда возникает задача оценки этой аппроксимации.

Для примера Аппроксимировать строку регулярной ЦМВ рельефа из 21 точки полиномами Чебышева 1- 3 степени; оценить качество аппроксимации по критерию Фишера; построить профиль по измеренным и вычисленным значениям y; дать выводы о качестве аппроксимации, учтя, что точность съемки рельефа 0.4м. Схематически разбить участок на части и указать степени полиномов, обеспечивающих аппроксимацию по частям. (Программа для вычислений файл Excel, туда подставить свои данные.)

Формулы вычисления частных полиномов для счетного x, кое принимает возрастающие на единицу целые значения от 0 до n:

,

в общем виде .

Соседние файлы в папке Коршунов