Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Папернов А.А. Методы упорядочения информации в цифровых системах

.pdf
Скачиваний:
16
Добавлен:
25.10.2023
Размер:
13 Mб
Скачать

160 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ

Определим эти характеристики. Сначала мы будем использовать только равномерность распределения, не накладывая ограничений на корреляционный момент ме­

жду элементами последовательности,

взятыми

без их

порядкового номера.

 

 

Пусть М(аі ) — xt.

 

 

Это значит, что в интервале (0, xt),

включая

его гра­

ницу, в среднем должно размещаться і элементов, а в

интервале (xt, 1 ) — в среднем

—элементов.

В силу равномерности распределения длина обоих ин­

тервалов должна

быть пропорциональной количеству

размещающихся

в них элементов, т. е.

 

i m + 1 i

Решая уравнение (4.25) относительно xt,

х, = М(аа

= —І—.

1

v

m + 1

(4.25)

получим

(4.26)

Предположение об отсутствии или наличии корреля­ ции между элементами последовательности, взятыми без

их номера,

с точки зрения М(аі) оказывается несуще­

ственным.

 

Однако,

не налагая ограничений на корреляционный

момент между элементами последовательности, взятыми безотносительно к их порядковым номерам, нельзя вы­

числить D(ai)

и К(аіг

о,),

а только их

соотношение.

Докажем это.

 

at

 

 

 

 

Если отклонение

от своего математического ожи­

дания нам известно:

 

 

 

 

 

 

 

А^а-М^),

 

 

(4.27)

то тем самым

интервал

(0, 1) разбивается

на два интер­

вала: интервал (0, M(al)+k

; ) , в котором

размещается

(г—1) элементов, и интервал

(М(аі)+Ъ.і,

1), в

котором

размещается

—/)

элементов. Предполагая,

что рас­

пределение элементов в обоих из упомянутых интервалов остается равномерным, мы можем записать математиче­ ское ожидание значения признака ÜJ, С учетом известно­ го отклонения Д.- :

 

§ 4.2. ХАРАКТЕРИСТИКИ

ОПЕРАТОРА ВСТАВКИ

161

ДЛЯ

/ < /

 

 

 

 

 

 

 

 

 

 

 

 

 

M, (a,) =

-L (M (at)

+

Д() =

±-

Г-4т + Л <

 

 

 

 

 

i

 

 

 

 

 

i

im

+ l

 

 

 

 

 

 

 

 

= ~irr + л < = м

Ы + Х

 

л<".

<4-28>

для

/ >

t

 

/я + 1

I

 

 

 

 

i

 

 

 

М1/)=\-1\-М(а1)-Ц

 

 

 

 

 

 

m +

1 — /

_

 

 

 

 

 

 

 

 

m + 1 — i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 - 1 1

 

 

 

 

A l

m+1—1

 

 

 

 

 

 

 

 

m + 1

 

m + 1 — i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m +

l -

i

Д;.

(4.29)

vi + 1

m + 1 — i

*

 

w

• /n + 1 — г

 

 

 

Корреляционный

момент

/С (а; , а,) равен

интегралу

 

/С (а/, а,)

=

J J Д(. Д, р ( Д Д , ) d (Д,.) d (Д,),

(4.30)

взятому

в пределах

всех возможных

значений

Д(. и Ду-.

Из выражений (4.28) и (4.29) получим:

 

 

 

для

/ < і

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4(Д,) =

Ц - 0 ( а < ) ,

(4.31)

для

/ > і

 

 

 

 

 

 

 

 

 

 

 

 

 

К ( а „ а , ) = ^ < Р ( Д , )

 

m + 1 — j

 

 

 

 

 

 

 

m + 1 — i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m+l—j

 

D(a,).

(4.32)

 

 

 

 

 

 

 

 

 

 

m + 1 i

 

 

 

 

 

 

 

 

 

 

 

 

 

Эти выражения

получены с использованием известно­

го соотношения для совместной плотности

вероятности

 

 

 

р(Д.,Д,) =

р(Д,./Д.)р(Д.),

 

 

 

(4.33)

где р(Ду/А І)—условная

плотность

вероятности

Ду при

известном

А;,

позволяющем

записать выражение

(4.30)

в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

К (at, а;) =

j Д(.р (Л,) [ j

Д,. р (Д/Д,) d у) ] і

(ДД

(4.34)

6 А. А. Папернов, В. Я. Подымоз

162 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ

а также соотношения

 

 

 

j Д, р уг) d (Ду) =

Mt (aj) -

M (aj).

(4.35)

Из формул (4.31) и (4.32) можно один

и тот же

корре­

ляционный момент K{at, aj )

выразить

как через

D(at),

так и через D(a-). Если / < / , то

К (а., а,) = 4-Я (а,) = т+\~[

D (а,).

(4.36)

Из (4.36) следует, что

і(от + 1 — i)

(4.37)

j (m + 1 j) '

т. е. дробь (4.37) не зависит от порядкового номера эле­ мента последовательности. Приравняв ее некоторой кон­ станте с, зависящей только от характеристик последова­ тельности в целом, но не от порядкового номера элемен­ та в последовательности, получим

D (а,) = ci (m + 1 — /).

(4.38)

Из (4.38), (4.31) и (4.32) следует, что

K ( « | t a , ) = { c > < m + 1

- I ' )

Д Л Я

І < 1 '

(4.39)

( ci (m + 1

/)

для

/ >

/.

Определим значение коэффициента с для абсолютно случайной по составу последовательности, в которой от­ сутствует корреляция между признаками элементов, взя­ тых безотносительно к их порядковым номерам. Это можно сделать, сравнив друг с другом дисперсии суммы

всех членов последовательности D I ^ at j в общем слу­ чае и при отсутствии корреляции между признаками

элементов.

Дисперсия элемента равномерно распределенной по­ следовательности равна

i

i

Ща) = Г - M(a)f

da = "j (a— - ^ 2 d a12 ='

§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ

163

а дисперсия суммы m некоррелированных членов

я 12«і ]=-і|.

(4-4°)

С другой стороны, в общем виде

D ( J H -

 

m

 

m

Ii—1

(fl*'a;> +

m

 

 

\

(4-41>

= 2 D

+ 2

2 *

2

* (°/.ау) •

 

і

 

гѴ/=і

 

 

І=І-\

i

 

/

 

 

Преобразуем отдельные члены, входящие в (4.41):

г—1

i r ,

 

г—1

 

! 1

л

с (і — I ) i (m + l — i)

^V

ч

v i • /

К {ait

üj)

= 2с/ (m +

l — 0

= - b

 

L _ L _ r

 

L>

/ = !

 

 

/=l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ci (m + l i) (m

i)

/=('+!

 

 

/=/+1

 

 

 

 

 

 

 

 

I—l

 

 

m

 

 

 

ri(OT+i_/)^

 

 

V/C(ai,a,.)+

Vtf(a,>a.)=

 

 

y=i

 

 

i=t+i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L D ( a < ) .

(4.42)

Подставляя

(4.42) в

(4.41), получим

для D (2а ;)

В Ь І "

ражение

 

 

 

 

 

 

 

 

 

 

 

/ m \

 

m

 

,

m

 

 

 

 

 

 

 

 

 

 

 

m 1

 

 

 

 

 

 

D (2 4= 2D ( a <) + nr2 D ( a <) =

 

 

 

 

 

 

 

 

 

 

 

И +

2

2 D { «

( ) .

(4.43)

 

 

 

 

 

 

 

 

 

 

 

 

6*

 

 

 

 

 

 

 

 

 

 

 

 

164 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ

 

При ЭТОМ

 

 

 

 

 

 

m

m

 

 

 

1) 2

*'~2

4=1

i = l

 

 

( m +

 

 

 

 

i = i

(=i

=

с m ( m + 1 ) 2

m (m +

1) (2m +

1)'

m

(m+l)(m+2)

 

 

 

 

 

 

 

(4.44)

 

Подставляя

(4.44) в

(4.43)),

получим

 

 

 

D (2 a*J=°m(m+ V m + 2

)

'

<4-45>

т. е. выражение, связывающее в общем виде дисперсию суммы членов последовательности с коэффициентом с.

В случае абсолютно случайной по составу последова­ тельности, дисперсия суммы членов которой выражается

формулой (4.40), получаем после

сравнения

(4.40)

и

(4.45)

 

 

 

С = = (m+l)2(m+2)

*

( 4 ' 4

6 )

4.2.5. Степень взаимной неупорядоченности между

двумя равномерно распределенными упорядоченными последовательностями. Степень взаимной неупорядочен­ ности между двумя равномерно распределенными упоря­ доченными последовательностями определим по формуле (4.13).

Начнем с вычисления внутренней суммы для некото­ рого фиксированного і, представляющей собой матема­ тическое ожидание количества инверсий элемента а,- со всеми элементами последовательности В. Отметим на числовой оси элементы at и Ъ t (рис. 4.3). Пусть оказа­ лось, что а1

Элементы последовательности В, лежащие левее

at,

не могут иметь инверсий с аі

, так как они

меньше

аь

как по значению признака, так и по порядковому

номеру.

Элементы

последовательности

В,

лежащие

правее

bit

тоже не могут иметь инверсий

с at,

так как

они

больше

at и по значению признака, и

по

порядковому

номеру.

Элементы

же последовательности

ß, расположенные

на

§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ

165

числовой оси между а1 и Ьі , обязательно имеют инвер­ сию с аь так как по значению признака они больше at, а по порядковому номеру — меньше. Кроме того, с веро­ ятностью, равной 1/2, возможна инверсия непосредствен­ но между элементами at\ib L.

Нетрудно аналогичным образом показать, что в случае

аі > Ьь

количество инверсий

элемента

at с

элементами

 

 

 

 

 

ЧишЬая ось

 

 

к — • — к

 

 

х — *

*•

* -

 

Ъі-к-,аі

bi-k

• •

h - , b L

Ьі+1

 

 

• -

Элементы

послеВоЬательности A

 

 

X -

Элементы

последовательности

В

 

Рис. 4.3.

Распределение

элементов

упорядоченных

последователь­

 

 

ностей

А и В на

числовой оси.

 

последовательности В тоже равно количеству элементов последовательности В, промежуточных по величине ме­ жду at и b i, плюс 1/2.

Определим математическое ожидание количества эле­ ментов последовательности В, промежуточных по вели­ чине между а1 и b t . Начнем с другого вопроса: чему равно математическое ожидание модуля разности at — bt

при заданном

количестве элементов

 

последовательно­

сти В,

промежуточных по величине между aL и b

fi Если

количество промежуточных

элементов

равно

k,

то это

значит,

что элемент

а{

расположен

на числовой

оси

между

и b i-k-i либо

между bl+k

и b t + k + l

. В обоих

случаях

 

 

 

 

 

 

 

 

 

 

M\bt

— bt_k\

— M\bt

— bi+kI

=

—~-

,

(4.47a)

 

 

 

 

 

 

 

7П+ 1

 

 

 

 

M\bl-bi_k_1\=M\bi-bi+k+x\=^-

 

 

.

(4.476)

 

 

 

 

 

 

 

m-\-l

 

 

 

Для M\at—bt\,

промежуточного

между

(4.47a)

и

(4.476), примем среднее

значение

 

 

 

 

 

 

 

M\at

— bA=

.

 

 

(4.48)

m -f- 1

166 ГЛ. 4'. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ

Из (4.48) делаем

вывод, что

 

. M(k)

= (т + \)М\а, — bt\ — у .

(4.49)

Формулу (4.49) можно применять в определенных пре­

делах. П р и М \ а , — Ь,\ <

 

 

она формально даст для

 

у

 

 

'

 

2 (m +

1)

 

^

F

 

 

 

 

 

 

М(&)

не

имеющий

смысла

отрицательный

результат.

Поэтому

при

М\а,

b,\ <

 

 

 

будем

считать,

что

 

:

*

1

4

'

2 +

1)

J

 

 

 

 

 

 

M (k) =0. Математическое ожидание количества

инверсий

между

элементом

at

и всеми элементами

последователь­

ности В соответственно

равно

 

 

 

 

 

 

 

 

 

 

{т+\)М\а.

— Ъ,\

при

М\а,

— Ь.\>

1

 

 

,

(4.50а)

 

 

'

'

 

ѵ

'

 

'

 

2 (m +

1)

 

v

 

 

 

 

 

при

M i a,.

"

/;,. i

 

i

 

.

(4.506)

 

 

 

2

 

^

1

 

" 2(/я + 1)

 

v

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчет M \ al—bt\

в общем случае оказывается

доста­

точно

сложным.

Мы его определим через

дисперсию

разности іі)

 

при упрощающем

расчеты

предполо­

жении,

что закон

распределения

разности

( а ; b t )

яв­

ляется

нормальным.

Для такого

предположения

 

име­

ются следующие основания:

 

 

 

 

 

 

 

 

 

 

а) в силу статистической эквивалентности последо­

вательностей А и В закон распределения

г

— 6()

сим­

метричен относительно нуля;

 

 

 

 

 

 

 

 

 

 

б) разность

1

6,) зависит от большого

количества

случайных

отклонений многих элементов массива от сво­

их математических ожиданий.

 

 

 

 

 

 

 

 

 

 

Допустимость

упомянутого

предположения

в

даль­

нейшем мы проверим, сравнив результаты расчётов, вы­ полненных по точным формулам и формулам, выведен­ ным на основе принятых допущений.

В силу независимости отклонений

элементов

а1 и Ь,-

от своих математических

ожиданий

 

 

D (a, -bt)=D(a,)

+

D(6,) =

2D (a,),

(4.51)

или, с учетом формулы (4.38)

для дисперсии

D(at),

D (at &,) =

2d (m + 1 — i).

(4.52)

§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ

167

Для нормального закона имеет место соотношение

М[а1

— Ьі\ = V2fr

YD(at

 

— Ь^.

(4.53)

Подставляя в (4.53) вместо

D(at—bt

) ее

значение

(4.52), получим

 

 

 

 

 

 

М\а,

Ь,\ =

 

Vі{т+\—

 

t).

(4.54)

 

Y

к

 

 

 

 

Математическое

ожидание

количества

инверсий между

at и элементами

последовательности

В можно

получить,

подставив (4.54)

в (4.50а),

а степень

взаимной

неупоря­

доченности между последовательностями А и В — путем суммирования количества инверсий между всеми парами элементов:

 

/ . з = ^5

+

1) У. Ѵі(т+\-і).

(4.55)

 

V

*

 

/=і

 

 

Сумму в (4.55) заменим приближенным ее значением,

равным

табличному интегралу

(рис. 4.4)

 

 

от+1

 

 

 

 

 

J

Y'i (m +

1 — /') di,

 

 

о

 

 

 

 

равному

после подстановки пределов

 

 

 

 

л (m + 1 ) 2

 

 

 

 

 

8

 

 

и в результате получим

 

 

 

 

Івз=^(т+ІГѴ~с~.

 

(4.56)

Выкладки с I в з ,

которые нам предстоит выполнять в сле­

дующих

параграфах,

упрощаются,

если / в з выразить

через дисперсию

суммы

членов

последовательности

(4.45), которую в дальнейшем мы будем обозначать сим­ волом Ds . Из (4.45) следует, что

168 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ

Подставляя (4.57)

в (4.56),

получим

 

 

/ B 3 =

L i

! ^ L

^ .

(4.58)

 

2

fm(m+2)

 

 

Заменяя

 

 

 

 

V m (m + 2) = Y (m + 1 ) 2 1

 

его приближенным

значением, равным

(m+1),

упростим

Û

1

2

3

4

5

6

7

8

77/

"' I

 

 

 

1 = 1

 

 

r ^

- /о

Vi(mtl-i)di

 

Рис. 4.4 Аппроксимация

суммы

в выражении

для / в з интегралом.

в еще большей степени выражение для

Івз:

U='^-(m+l)YD^-

 

(4-59)

При выводе формулы (4.59) мы использовали формулу (4.50а), справедливую лишь в ограниченных пределах. Следовательно, и формула (4.59) справедлива в тех же пределах.

Ввиду того, что математическое ожидание количества инверсий между а1 и всеми элементами последователь­ ности В не может стать меньше 1/2 (4.506), математиче-

§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ

169

ское ожидание количества инверсий между всеми эле­ ментами последовательностей А и В не может стать меньше т / 2 . При малых значениях М{аt—bt), когда формула (4.59) даст результат, меньший, чем m/S, сле­ дует считать, что мы вышли из области применимости формулы (4.59), т. е.

/ в з = т / 2 .

(4.60)

Для абсолютно случайной по составу последовательно­ сти дисперсия суммы m членов равна

Ds = m/12.

Подставляя в (4.59), получим

+1)ѴИі. (4.61)

В табл. 4.1 приводятся значения / в з для абсолютно слу­ чайной по составу равномерно распределенной в интер­ вале (0, 1) последовательности, подсчитанные по точной

формуле (4.24) и приближенной

формуле

(4.61).

 

 

 

 

 

 

 

Т а б л и ц а 4.1

 

 

/ вз

Относи­

 

^вз

 

Относи­

m

по точной

по форму­

тельная

m

по точной

по фор­

тельная

погреш­

погреш­

 

формуле

ле (4.61)

ность, %

 

формуле

муле

ность, %

 

(4.24)

 

 

 

(4.24)

(4.61)

 

1

0,5

0',888

77,6

16

28,58

30,1

5,3

3

2,4

3,07

28

24

52,37

54,1

3,3

6

6,55

7,62

15,4

30

73,12

75,1

2,7

10

14,2

15,5

9,15

 

 

 

 

Результаты сравнения показывают на вполне удовле­ творительное совпадение, улучшающееся по мере увели­ чения длины последовательности т. При т < 1 0 погреш­ ность формулы (4.61) оказывается существенной, но даже и при малых m формула (4.61) приемлема для многих оценок.

Соседние файлы в папке книги из ГПНТБ