Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория эксп. Разд. мат..docx
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
497.43 Кб
Скачать

Пуассоновское распределение

Для проверки случайности появления группы событий (или некоторого числа объектов)рассматриваемое распределение проверяется на соответствие пуассоновскому распределению, которое отличается от нормального и выводится на основе допущений о случайных эффектах.

Если эмпирическое распределение* по форме очень близко к пуассоновскому, то можно предположить, что случайно появляющиеся большие числа не являются неожиданными, а представляют собой выборку из соответствующей совокупности, распределенной по пуассоновскому закону.

Пуассоновское распределение является ассиметричным и описывает вероятность появления случайных событий (объектов и т.д.).

Допустим, что : R – общее число событий в каком-либо эксперименте ; N – общее число рассматриваемых интервалов времени, часть которых может содержать нулевое число событий.

Тогда среднее число событий в определенном интервале времени будет равно т = R/N.

Вероятности появления определенного числа событий при пуассоновском законе распределения приведены в таблице:

Число событий в одном интервале времени

0

1

2

3

п

Вероятность появления данного числа событий

е-т

те /1!

т2е /2!

т3е /3!

тпе /п!

Каждый член выражает вероятность того, что произойдет данное число событий.

Эти члены образуют Пуассоновский ряд .сумма членов которого равна 1.

При : т<1 вероятность максимальна при нулевом числе событий.

1<т<2 вероятность максимальна при появлении одного события.

Для проверки на соответствие пуассоновскому распределению обычно вычисляется каждый член ряда и с помощью χ2- критерия эти члены сравниваются с членами эмпирического ряда.

Для приближенной инженерной прикидки можно использовать проверку с помощью графиков – аналогично тому, как проверка на «нормальность» выполнялась с помощью вероятностной бумаги.

Если не принимать во внимание член е, выражающий отсутствие событий, то :

Фактическое число ожидаемых интервалов Еп времени (или участков) для п-го члена определяется выражением :

. (5) или ln En= n ln m + lnN – m ln п!

или ln(Enn!) =C1n + С2 . (6)

где: С1 – постоянная ;С1 = lnm; C2 – постоянная, С2 = (ln Nm).

Ни С1 , ни С2 не зависят от номера п (номера члена).

Формула 6 уравнение прямой в отрезках .

Таким образом : если необходимо проверить, является ли данное распределение пуассоновским , то вычислять m (среднее число событий в интервале ) не надо. Достаточно умножить наблюдаемое число En на каждое значение п! и отложить полученные результаты на логарифмической шкале ,а на линейной шкале отложить п.

Если график зависимости Епп!от п представляет собой прямую (или близкую к ней), то можно предположить, что рассматриваемый ряд является пуассоновским.

*Эмпирическое распределение –результат наблюдений (форма таблицы чисел, гистограммы , в которой указывается , какое число раз переменная принимала определенные значения.

Пример: В течение 2х месяцев (60дней) велось наблюдение на перекрестке.

Данные наблюдений

Число ДТП за 1 день (интервал)п

0

1

2

3

4

5 и более

Число интервалов, в которых наблюдается п ДТП

13

22

14

7

4

0

Предположим: Данные случайные и образуют пуассоновский ряд

Вопрос : Справедливо ли такое предположение для этих данных

Решение: Построим график зависимости Enn! от п.

Проведенные вычисления представим в виде таблицы:

n

0

1

2

3

4

5

n!

1

1

2

6

24

120

En

13

22

14

7

4

0

En∙n!

13

22

28

42

96

0

С троим график зависимости Enn! от п (рис.13)

Первые 4е точки вблизи прямой, 5я – отклонение вверх. Отдельные отсчеты могут иметь отклонения.

Нижние значения (на графике) – наиболее значимые , и свидетельствуют о хорошем соответствии пуассоновскому распределению.

Более строгую проверку проведем с помощью χ2- критерия

Среднее число событий равно т = R / N= 87 / 60 = 1,45,

где : R= 1·22+ 2·14+3·7+4·4 =87

Рис. 13. График зависимости Enn! от п.

Зная т по формуле 5 можно вычислить значения En для каждого п.

Получаем: =

Результаты представлены в таблице :

п

0

1

2

3

4

5

En

13

22

14

7

4

0

Σ =60

En* предсказываемое

пуассоновским распределением

14

20

15

7

3

1

Σ =60

*предсказанные значения En округлены до ближайшего целого.

=

Число степеней свободы равно 3. На графике χ2 = f(число степеней свободы) видно, что вероятность этого (или большего0 значения χ2 составляет ~ 0,99.

Т.о. гипотеза о том, что выборки данных относятся к одной и той же совокупности , является почти достоверной.

Итак: Результаты проверки с помощью χ2- критерия соответствуют результатам приближенной графической проверки.

Графический анализ данных .

Метод наименьших квадратов

Большое значение имеют научные аспекты графического анализа:

- относительная точность переменных, наносимых на график;

- исключение резко отклоняющихся значений;

- выбор наиболее удачных шкал;

- построение наилучшей прямой

Самый строгий и точный способ построения на плоскости ХУ наилучшей прямой (или прямой корреляции) по некоторой группе точек - метод наименьших квадратов.

Допустим, что как независимая переменная Х, варьируемая в некотором интервале, так и зависимая переменная У имеют случайную ошибку, которая больше при малых значениях этих величин, и уменьшается с их увеличением.

Задавая все возможные значения Х и многократно считывая значения У, получим бесконечную совокупность экспериментальных точек, заполняющих область значений (Х ,У) и имеем бесконечное множество двумерных нормальных распределений переменной У.

Построив для каждого интервала зависимость величины отклонения от числа отсчетов получим распределение (рис.14а) :

Рис.14. а) - График зависимости величины отклонения от числа отсчетов для каждого интервала;

б) - График одинаковых нормальных распределений при многократном снятии 4х показаний, лежащих на прямой при условии : только переменная У имеет случайную ошибку, которая одинакова для всех значений У.

При нормальном распределении ошибок измерительного прибора , как известно , сумма квадратов отклонений показаний от наилучшего значения минимальна.

Это положение справедливо и для рассматриваемого общего случая – бесконечного множества кривых нормального распределения (см. рис.14).

Т.о. наилучшая линия, проходящая через множество точек, рассеянных на плоскости ХУ, должна занимать положение, при котором сумма квадратов отклонений точек от этой линии минимальна.

Если при многократном снятии 4х точек (ожидается, что они лежат на истинной кривой ) переменные Х и У имеют неопределенность или случайную ошибку, уменьшающуюся при увеличении Х иУ, то получаются двумерные нормальные распределения, изображенные на графике.

Именно это правило и объясняет происхождение термина «метод наименьших квадратов».

Классическая задача наименьших квадратов

Известно : 1.Бесконечная совокупность точек на плоскости ХУ дает прямую.