
PZMS
.pdf
|
|
|
|
|
21 |
|
|
|
|
|
|
|
|
y(t |
0 |
t) y(t |
0 |
t) y(t |
0 |
t) y(t |
0 |
t) |
|
||||
|
|
|
|
, |
|
|
|
. |
(2.7) |
||||
|
|
2 |
|
|
|
|
2t |
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
Определив из (2.6) (2 b2 t0 b1), (t0 a) |
и, подставив С, преоб- |
||||||
разуем уравнение (2.2) к виду: |
|
|
L |
|
|
|
|
y(t0 t) (2 b2 t0 b1) b2 (t (t0 |
a)) |
|
|
|
|||
t (t0 |
a) |
||||||
или |
|
|
|||||
|
|
L |
|
|
|
||
y(t0 t) (2 b2 t0 b1) b2 (t (t0 a)) |
|
|
. (2.8) |
||||
|
|
|
|||||
|
|
t (t0 a) |
Домножив (2.8) на t (t0 a) и, подставив L, получим уравнение:
y(t |
0 |
t) (2 b t |
0 |
b ) t (t |
0 |
a) b (t2 (t |
0 |
a)2) |
|
||||||||
|
|
2 |
|
1 |
|
|
|
|
2 |
|
|
(2.9) |
|||||
b0 a (b1 a b2) b2 t2 |
b0 |
a b1 b2 (t02 2 a t0) |
|||||||||||||||
Спрямление уравнения (2.9) достигается в координатах: |
|
||||||||||||||||
|
|
y(t |
0 |
t) (2 b |
t |
0 |
b ) t (t |
0 |
a) ,t2 . |
(2.10) |
|||||||
|
|
|
|
|
2 |
|
|
|
1 |
|
|
|
|
|
Из уравнения (2.9) определяются оставшиеся параметры b0, b1, b2. Общий алгоритм выглядит следующим образом:
1) для исходных данных функций плотности распределения
f(x) построим производную f (x),
2)возьмем соотношение y(x) f (x),
(x)f
3)выберем значение t0 (если распределение близко к симметричному, то взять значение t0 отличное от μ),
4)построим данные в анаморфозе (2.7),
5)определим параметры (2 b2 t0 b1), (t0 a),
6)построим анаморфозу (2.10),
7)определим параметры b0, b1, b2.
Проведем проверку анаморфозы С.Д. Давыдова на ряде известных распределений из табл.1
а) экспоненциальное распределение
На рис.2.1 представлены модельные данные экспоненциаль-

22
ного распределения с параметром τ = 0.9. Возьмем произвольную точку t0 = 2.5. Построение исходных данных в координатах (2.7) дает точку с координатами (0, -1.1) (рис.2.2). Подстановка координат этой точки в уравнение (2.6) приводит к соотношению:
y(t0 |
t) y(t0 t) |
|
|||||
|
|
|
|
1.1 |
|
||
|
2 |
|
|
||||
|
|
|
1 y(t0 t) y(t0 t) 1.11. |
||||
|
|
|
|
||||
y(t0 |
t) y(t0 t) |
|
|||||
|
|
|
|
0 |
|
||
|
2t |
|
|
||||
|
|
y(t0 t) y(t0 t) const. |
|
||||
Таким |
образом, |
|
Так как, |
||||
y(x) |
f (x) |
1.1 или |
f (x) |
0.9, то есть τ = 0.9 (табл.2.1), вос- |
|||
f (x) |
|
||||||
|
|
f (x) |
|
производит исходное значение параметра τ.
Рис.2.1 Плотность экспоненци- |
Рис.2.2 Анаморфоза (2.7) для |
ального распределения, τ = 0.9 |
данных рис.2.1. t0 = 2.5 |
Таким образом, признаком принадлежности данных статистической выборки к экспоненциальному распределению являет-
ся точка в анаморфозе (2.7) с координатами (0, 1).
τ
б) нормальное распределение
На рис.2.3 представлены модельные данные нормального распределения с параметрами μ = 4.5, σ = 1.7.

23
Рис.2.3 Плотность нормального распределения, μ = 4.5, σ = 1.7
Возьмем произвольную точку t0 = 5. Построение данных нормального распределения в координатах (2.7) дает прямую (рис.2.4). По углу наклона прямой равного (t0 a) 0.5 определяем значение параметра a 0.5 t0 0.5 5 4.5. Величина свободного параметра прямой 2 b2 t0 b1 0. Из табл.1.1 a μ 4.5, что воспроизводит исходное значение параметра μ.
Полученные коэффициенты уравнения прямой подставляем в уравнение (2.9), построение исходных данных в координатах (2.10) дает прямую (рис.2.5).
Рис.2.4 Анаморфоза (2.7) для |
Рис.2.5 Анаморфоза (2.10) для |
данных рис.2.3. t0 = 5 |
данных рис.2.3. t0 = 5 |
По углу наклона прямой (2.10) определяется значение пара-

24
метра b2 = 0. Далее, по значению свободного параметра уравне-
ния (2.10) b0 a b1 b2 (t02 2 t0) 2.89 и величине свободного параметра уравнения (2.9) 2 b2 t0 b1 0 определяем значе-
ния параметров b0 = -2.89 и b1 = 0. Из табл.1.1 b0 σ2 , значит σ = 1.7, что воспроизводит исходное значение параметра σ.
Отметим, что в связи с симметричностью функции плотности нормального распределения для эффективного применения анаморфозы требуется брать значения t0 μ, для того, чтобы избежать неустойчивости при построении анаморфозы.
Таким образом, признаком принадлежности данных статистической выборки к нормальному распределению является: 1) линейная зависимость, проходящая через точку (0,0) анаморфозы (2.7), 2) постоянный уровень ординат для анаморфозы (2.10).
в) распределение Коши
На рис.2.6 представлены модельные данные распределения Коши с параметрами x0 = 5, γ = 1.2.
Рис.2.6 Плотность распределения Коши, x0 = 5, γ = 1.2
Возьмем произвольную точку t0 = 5.4. Построение данных распределения Коши в координатах (2.7) дает прямую (рис.2.7). По углу наклона прямой, равному (t0 a) 0.4, определяем

25
значение параметра a 0.4 t0 0.4 5.4 5. Величина свободного параметра прямой 2 b2 t0 b1 0.4. Из табл.1.1 a x0 5, что воспроизводит исходное значение параметра x0.
Полученные коэффициенты уравнения прямой подставляем в уравнение (2.9), построение исходных данных в координатах
(2.10) дает прямую (рис.2.8).
Рис.2.7 Анаморфоза (2.7) для |
Рис.2.8 Анаморфоза (2.10) для |
данных рис.2.6. t0 = 5.4 |
данных рис.2.6. t0 = 5.4 |
По углу наклона прямой (2.10) определяется значение параметра b2 = 1/2. Далее, по значению свободного параметра уравне-
ния (2.10) b0 a b1 b2 (t02 2 t0) 0.64 и величине свободного параметра уравнения (2.9) 2 b2 t0 b1 0.4 определяем зна-
чения параметров b0 |
= -13.22 и b1 |
= 5. Из табл.1.1 b |
x02 |
γ2 |
, |
|
|
||||
|
|
0 |
|
2 |
|
|
|
|
|
|
значит γ = 1.2, что воспроизводит исходное значение параметра γ.
г) распределение Ципфа
На рис.2.9 представлены модельные данные распределения Ципфа с параметром x0 = 1, γ = 0.4, С = 3. Возьмем произвольную точку t0 = 5. Построение исходных данных в координатах (2.7) дает точку (-10,2.5) (рис.2.10). Подстановка координат этой точки в уравнение (2.6) приводит к соотношению

|
|
|
|
|
26 |
|
y(t |
0 |
t) y(t |
0 |
t) |
||
|
|
|
|
10 |
||
|
|
2 |
|
|
||
|
|
|
|
y(t0 t) 2.5 t 10. |
||
|
|
t) y(t0 |
|
|||
y(t0 |
t) |
|||||
|
|
|
|
|
|
2.5 |
|
|
2t |
|
|
||
|
|
|
|
|
Подставив значение t0, получим: y(t 5) 2.5 ((t 5) 1) или
f (x) |
|
0.4 |
|
|
f (x) |
x 1 |
|||
|
Откуда, γ = 0.4, x0 = 1, что воспроизводит исходные значения параметров γ и x0. Значение параметра С находится из:
c
f (x)
(x x0) γ
Рис.2.9 Плотность распределе- |
Рис.2.10 Анаморфоза (2.7) для |
ния Ципфа, С = 3, γ = 0.4, x0 = 1 |
данных рис.2.9, t0 = 5 |
Таким образом, признаком принадлежности данных статистической выборки к распределению Ципфа является точка с ненулевыми координатами по осям абсцисс и ординат для анамор-
фозы (2.7).
д) гамма распределение
На рис.2.11 представлены модельные данные гамма распределения с параметрами k = 5, C = 1.2.

27
Рис 2.11 Плотность гамма распределения, С = 1.2, K = 3
Возьмем произвольную точку t0 = 3. Построение данных гамма распределения в координатах (2.7) дает прямую (рис.2.12). По углу наклона прямой, равному (t0 a) 0.6, определяем значение параметра a 0.4 t0 0.6 3 2.4. Величина свободного параметра прямой 2 b2 t0 b1 1.2.
Полученные коэффициенты уравнения прямой подставляем в уравнение (2.9), построение исходных данных в координатах
(2.10) дает прямую (рис.2.13).
Рис 2.12 Анаморфоза (2.7) для |
Рис.2.13 Анаморфоза (2.10) |
данных рис.2.11, t0 = 3 |
для данных рис.2.11, t0 = 3 |
По углу наклона прямой (2.10) определяется значение пара-
28
метра b2 = 0. Далее, по значению свободного параметра уравне-
ния (2.10) b0 a b1 b2 (t02 2 t0) 2.88 и величине свободного параметра уравнения (2.9) 2 b2 t0 b1 1.2 определяем зна-
чения параметров b0 = 0 и b1 = -1.2. Из табл.1.1 b1 C, a C (1 k), значит С = 1.2 и k = 3, что воспроизводит исходное значение параметров С и k.
Признаком принадлежности данных статистической выборки к гамма распределению является: 1) линейная зависимость, не проходящая через точку (0,0) анаморфозы (2.7), 2) постоянный уровень ординат для анаморфозы (2.10).
Таким образом, система Пирсона позволяет по результатам измерений определять принадлежность их к ряду основных функций плотности распределения и одновременно устанавливать значения параметров этих распределений. Однако эффективными при обработке данных могут явиться и методы построения данных в системах анаморфоз, соответствующих распределениям заданного вида. Рассмотрим возможности использования такой последовательности. При этом могут быть реализованы методы идентификации распределений, не входящих в систему Пирсона.
2.2. Экспоненциальное распределение
Плотность вероятности экспоненциального распределения: f (x) τ e τx
Анаморфоза экспоненциального распределения: ln( f (x)) ln(τ) τx.
Построение данных, соответствующих экспоненциальному распределению, дает спрямления в координатах ln( f (x)) ~ x.
Рассмотрим применение анаморфозы на модельных данных, полученных функцией rexp программы Mathcad (рис.2.14), генерирующей случайные числа с экспоненциальной плотностью распределения, параметр τ = 0,4.
По коэффициенту наклона прямой определяется значение параметра τ. Анаморфоза воспроизводит исходное значение параметра τ.

29
Рис.2.14 Модельные данные, |
Рис.2.15 Анаморфоза для дан- |
полученные функцией rexp. |
ных рис.2.14 |
2.3. Распределение Пуассона
Плотность вероятности распределения Пуассона:
f (k) λk e λ, k!
где, k – целое положительное число. Известно, что при разложении в ряд Тейлора
eλ 1 λ |
λ2 |
|
λ3 |
... |
λk |
. (*) |
|
|
k! |
||||
2! |
3! |
|
|
Разделив обе части уравнение на eλ получим:
|
|
2 |
3 |
|
k |
|
|
1 e λ |
1 λ |
λ |
|
λ |
... |
λ |
. |
|
|
|
|||||
|
|
2! |
3! |
|
k! |
|
|
|
|
|
|
Таким образом, задается к-ый член разложения единицы в ряд. Анаморфоза для распределения Пуассона:
|
f (k 1) |
|
|
ln |
|
ln(λ) ln(k 1). |
(2.11) |
|
|||
|
f (k) |
|
|
|
|
|
Построение данных, соответствующих распределению Пуассона,
дает спрямления в координатах ln
f (k 1) |
|
|
~ ln(k 1). |
|
|
f (k) |
|
|
Распределение Пуассона по праву считается самым ран-

30
ним доказательством мощи математической статистики и широты применения в результате ее успеха при учете годового распределения числа смертельных случаев в прусской армии из-за брыкания лошадей [8].
Таблица 2.2.
Случаи смерти от удара копыта коня
k |
k+1 |
ln(k+1) |
f(k) |
0 |
1 |
0 |
109 |
1 |
2 |
0.693147 |
65 |
2 |
3 |
1.098612 |
22 |
3 |
4 |
1.386294 |
3 |
4 |
5 |
1.609438 |
1 |
|
120 |
|
|
|
|
|
|
100 |
|
|
|
|
|
|
80 |
|
|
|
|
|
(k) |
60 |
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
40 |
|
|
|
|
|
|
20 |
|
|
|
|
|
|
0 |
|
|
|
|
|
|
0 |
1 |
2 |
3 |
4 |
5 |
|
|
|
|
k |
|
|
|
Рис.2.16 Данные табл.2.2 |
|
|
Смертииз-забрыканиялошадей |
|
||
120 |
|
|
|
|
100 |
|
|
|
|
80 |
|
|
|
|
(k) |
|
|
|
|
60 |
|
|
|
|
N |
|
|
|
|
40 |
|
|
|
|
20 |
|
|
|
|
0 |
|
|
|
|
0 |
0.5 |
1 |
1.5 |
2 |
|
|
ln( k+1) |
|
|
Рис.2.17 Анаморфоза для дан- |
||||
|
ных табл.2.2 |
|
|
В действительности здесь данные, которые находятся в правой части распределения, и из 5 точек 3 находятся на равных расстояниях, а оставшиеся 2 точки содержат 2% общего объема выборки.
Рассмотрим применение анаморфозы на модельных данных для распределения Пуассона (табл. 2.3), λ =8.
Данные табл. 2.3 в координатах (2.11) представлены на рис.2.19