
книги из ГПНТБ / Папернов А.А. Методы упорядочения информации в цифровых системах
.pdf160 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ
Определим эти характеристики. Сначала мы будем использовать только равномерность распределения, не накладывая ограничений на корреляционный момент ме
жду элементами последовательности, |
взятыми |
без их |
порядкового номера. |
|
|
Пусть М(аі ) — xt. |
|
|
Это значит, что в интервале (0, xt), |
включая |
его гра |
ницу, в среднем должно размещаться і элементов, а в
интервале (xt, 1 ) — в среднем |
(т—элементов. |
|
В силу равномерности распределения длина обоих ин |
||
тервалов должна |
быть пропорциональной количеству |
|
размещающихся |
в них элементов, т. е. |
|
i m + 1 —i
Решая уравнение (4.25) относительно xt,
х, = М(аа |
= —І—. |
|
1 |
v |
m + 1 |
(4.25)
получим
(4.26)
Предположение об отсутствии или наличии корреля ции между элементами последовательности, взятыми без
их номера, |
с точки зрения М(аі) оказывается несуще |
ственным. |
|
Однако, |
не налагая ограничений на корреляционный |
момент между элементами последовательности, взятыми безотносительно к их порядковым номерам, нельзя вы
числить D(ai) |
и К(аіг |
о,), |
а только их |
соотношение. |
||
Докажем это. |
|
at |
|
|
|
|
Если отклонение |
от своего математического ожи |
|||||
дания нам известно: |
|
|
|
|
|
|
|
|
А^а-М^), |
|
|
(4.27) |
|
то тем самым |
интервал |
(0, 1) разбивается |
на два интер |
|||
вала: интервал (0, M(al)+k |
; ) , в котором |
размещается |
||||
(г—1) элементов, и интервал |
(М(аі)+Ъ.і, |
1), в |
котором |
|||
размещается |
(т—/) |
элементов. Предполагая, |
что рас |
пределение элементов в обоих из упомянутых интервалов остается равномерным, мы можем записать математиче ское ожидание значения признака ÜJ, С учетом известно го отклонения Д.- :
|
§ 4.2. ХАРАКТЕРИСТИКИ |
ОПЕРАТОРА ВСТАВКИ |
161 |
||||||||||||
ДЛЯ |
/ < / |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
M, (a,) = |
-L (M (at) |
+ |
Д() = |
±- |
Г-4т + Л < |
|
|
|
|||||||
|
|
i |
|
|
|
|
|
i |
im |
+ l |
|
|
|
|
|
|
|
|
= ~irr + —л < = м |
Ы + Х |
|
л<". |
<4-28> |
||||||||
для |
/ > |
t |
|
/я + 1 |
I |
|
|
|
|
i |
|
|
|
||
М1{а/)=\-1\-М(а1)-Ц |
|
|
|
|
|
|
m + |
1 — / |
_ |
|
|
|
|||
|
|
|
|
|
m + 1 — i |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
1 - 1 1 |
|
|
|
|
A l |
m+1—1 |
|
|
|
|
||
|
|
|
|
m + 1 |
|
m + 1 — i |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
m + |
l - |
i |
Д;. |
(4.29) |
vi + 1 |
m + 1 — i |
* |
|
w |
• /n + 1 — г |
||||||||||
|
|
|
|||||||||||||
Корреляционный |
момент |
/С (а; , а,) равен |
интегралу |
||||||||||||
|
/С (а/, а,) |
= |
J J Д(. Д, р ( Д Д , ) d (Д,.) d (Д,), |
(4.30) |
|||||||||||
взятому |
в пределах |
всех возможных |
значений |
Д(. и Ду-. |
|||||||||||
Из выражений (4.28) и (4.29) получим: |
|
|
|
||||||||||||
для |
/ < і |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4(Д,) = |
Ц - 0 ( а < ) , |
(4.31) |
|||
для |
/ > і |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К ( а „ а , ) = ^ < Р ( Д , ) |
|
m + 1 — j |
|
|
|
|
|
|
|||||||
|
m + 1 — i |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
m+l—j |
|
D(a,). |
(4.32) |
||
|
|
|
|
|
|
|
|
|
|
m + 1 — i |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Эти выражения |
получены с использованием известно |
||||||||||||||
го соотношения для совместной плотности |
вероятности |
||||||||||||||
|
|
|
р(Д.,Д,) = |
р(Д,./Д.)р(Д.), |
|
|
|
(4.33) |
|||||||
где р(Ду/А І)—условная |
плотность |
вероятности |
Ду при |
||||||||||||
известном |
А;, |
позволяющем |
записать выражение |
(4.30) |
|||||||||||
в виде |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К (at, а;) = |
j Д(.р (Л,) [ j |
Д,. р (Д/Д,) d (Ду) ] і |
(ДД |
(4.34) |
6 А. А. Папернов, В. Я. Подымоз
162 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ
а также соотношения |
|
|
|
j Д, р (Ду/Дг) d (Ду) = |
Mt (aj) - |
M (aj). |
(4.35) |
Из формул (4.31) и (4.32) можно один |
и тот же |
корре |
|
ляционный момент K{at, aj ) |
выразить |
как через |
D(at), |
так и через D(a-). Если / < / , то
К (а., а,) = 4-Я (а,) = т+\~[ |
D (а,). |
(4.36) |
Из (4.36) следует, что
і(от + 1 — i) |
(4.37) |
j (m + 1 — j) ' |
т. е. дробь (4.37) не зависит от порядкового номера эле мента последовательности. Приравняв ее некоторой кон станте с, зависящей только от характеристик последова тельности в целом, но не от порядкового номера элемен та в последовательности, получим
D (а,) = ci (m + 1 — /). |
(4.38) |
Из (4.38), (4.31) и (4.32) следует, что
K ( « | t a , ) = { c > < m + 1 |
- I ' ) |
Д Л Я |
І < 1 ' |
(4.39) |
( ci (m + 1 |
— /) |
для |
/ > |
/. |
Определим значение коэффициента с для абсолютно случайной по составу последовательности, в которой от сутствует корреляция между признаками элементов, взя тых безотносительно к их порядковым номерам. Это можно сделать, сравнив друг с другом дисперсии суммы
всех членов последовательности D I ^ at j в общем слу чае и при отсутствии корреляции между признаками
элементов.
Дисперсия элемента равномерно распределенной по следовательности равна
i |
i |
Ща) = Г \а - M(a)f |
da = "j (a— - ^ 2 d a12 =' |
§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ |
163 |
а дисперсия суммы m некоррелированных членов
я 12«і ]=-і|. |
(4-4°) |
С другой стороны, в общем виде
D ( J H -
|
m |
|
m |
Ii—1 |
(fl*'a;> + |
m |
|
|
\ |
(4-41> |
||
= 2 D |
+ 2 |
2 * |
2 |
* (°/.ау) • |
||||||||
|
і=і |
|
г=і Ѵ/=і |
|
|
І=І-\ |
i |
|
/ |
|
|
|
Преобразуем отдельные члены, входящие в (4.41): |
||||||||||||
г—1 |
i r , |
|
г—1 |
|
! 1 |
л |
с (і — I ) i (m + l — i) |
|||||
^V |
ч |
v i • / |
||||||||||
К {ait |
üj) |
= 2с/ (m + |
l — 0 |
= - b |
|
L _ L _ r |
|
L> |
||||
/ = ! |
|
|
/=l |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ci (m + l — i) (m |
— i) |
|||
/=('+! |
|
|
/=/+1 |
|
|
|
|
|
|
|
|
|
I—l |
|
|
m |
|
|
|
ri(OT+i_/)^ |
|
|
|||
V/C(ai,a,.)+ |
Vtf(a,>a.)= |
|
|
|||||||||
y=i |
|
|
i=t+i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
L D ( a < ) . |
(4.42) |
|
Подставляя |
(4.42) в |
(4.41), получим |
для D (2а ;) |
В Ь І " |
||||||||
ражение |
|
|
|
|
|
|
|
|
|
|
|
|
/ m \ |
|
m |
|
, |
m |
|
|
|
|
|
|
|
|
|
|
|
|
m — 1 |
|
|
|
|
|
|
|
D (2 4= 2D ( a <) + nr2 D ( a <) = |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
И + |
2 |
2 D { « |
( ) . |
(4.43) |
|
|
|
|
|
|
|
|
|
|
|
|
|
6* |
|
|
|
|
|
|
|
|
|
|
|
|
164 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ
|
При ЭТОМ |
|
|
|
|
|
|
m |
m |
|
|
|
1) 2 |
*'~2 |
|
4=1 |
i = l |
|
|
( m + |
|||
|
|
|
|
i = i |
(=i |
||
= |
с m ( m + 1 ) 2 |
m (m + |
1) (2m + |
1)' |
m |
(m+l)(m+2) |
|
|
|
|
|
|
|
|
(4.44) |
|
Подставляя |
(4.44) в |
(4.43)), |
получим |
|
|
|
|
D (2 a*J=°m(m+ V m + 2 |
) |
' |
<4-45> |
т. е. выражение, связывающее в общем виде дисперсию суммы членов последовательности с коэффициентом с.
В случае абсолютно случайной по составу последова тельности, дисперсия суммы членов которой выражается
формулой (4.40), получаем после |
сравнения |
(4.40) |
и |
(4.45) |
|
|
|
С = = (m+l)2(m+2) |
* |
( 4 ' 4 |
6 ) |
4.2.5. Степень взаимной неупорядоченности между
двумя равномерно распределенными упорядоченными последовательностями. Степень взаимной неупорядочен ности между двумя равномерно распределенными упоря доченными последовательностями определим по формуле (4.13).
Начнем с вычисления внутренней суммы для некото рого фиксированного і, представляющей собой матема тическое ожидание количества инверсий элемента а,- со всеми элементами последовательности В. Отметим на числовой оси элементы at и Ъ t (рис. 4.3). Пусть оказа лось, что а1<Ь
Элементы последовательности В, лежащие левее |
at, |
|||||
не могут иметь инверсий с аі |
, так как они |
меньше |
аь |
|||
как по значению признака, так и по порядковому |
номеру. |
|||||
Элементы |
последовательности |
В, |
лежащие |
правее |
bit |
|
тоже не могут иметь инверсий |
с at, |
так как |
они |
больше |
||
at и по значению признака, и |
по |
порядковому |
номеру. |
|||
Элементы |
же последовательности |
ß, расположенные |
на |
§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ |
165 |
числовой оси между а1 и Ьі , обязательно имеют инвер сию с аь так как по значению признака они больше at, а по порядковому номеру — меньше. Кроме того, с веро ятностью, равной 1/2, возможна инверсия непосредствен но между элементами at\ib L.
Нетрудно аналогичным образом показать, что в случае
аі > Ьь |
количество инверсий |
элемента |
at с |
элементами |
|||
|
|
|
|
|
ЧишЬая ось |
|
|
|
к — • — к |
|
|
х — * |
*• |
* - |
|
|
Ъі-к-,аі |
bi-k |
• • • |
h - , b L |
Ьі+1 |
|
|
|
• - |
Элементы |
послеВоЬательности A |
|
|||
|
X - |
Элементы |
последовательности |
В |
|
||
Рис. 4.3. |
Распределение |
элементов |
упорядоченных |
последователь |
|||
|
|
ностей |
А и В на |
числовой оси. |
|
последовательности В тоже равно количеству элементов последовательности В, промежуточных по величине ме жду at и b i, плюс 1/2.
Определим математическое ожидание количества эле ментов последовательности В, промежуточных по вели чине между а1 и b t . Начнем с другого вопроса: чему равно математическое ожидание модуля разности at — bt
при заданном |
количестве элементов |
|
последовательно |
|||||||
сти В, |
промежуточных по величине между aL и b |
fi Если |
||||||||
количество промежуточных |
элементов |
равно |
k, |
то это |
||||||
значит, |
что элемент |
а{ |
расположен |
на числовой |
оси |
|||||
между |
и b i-k-i либо |
между bl+k |
и b t + k + l |
. В обоих |
||||||
случаях |
|
|
|
|
|
|
|
|
|
|
|
M\bt |
— bt_k\ |
— M\bt |
— bi+kI |
= |
—~- |
, |
(4.47a) |
||
|
|
|
|
|
|
|
7П+ 1 |
|
|
|
|
M\bl-bi_k_1\=M\bi-bi+k+x\=^- |
|
|
. |
(4.476) |
|||||
|
|
|
|
|
|
|
m-\-l |
|
|
|
Для M\at—bt\, |
промежуточного |
между |
(4.47a) |
и |
||||||
(4.476), примем среднее |
значение |
|
|
|
|
|
||||
|
|
M\at |
— bA= |
— |
. |
|
|
(4.48) |
m -f- 1
166 ГЛ. 4'. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ
Из (4.48) делаем |
вывод, что |
|
. M(k) |
= (т + \)М\а, — bt\ — у . |
(4.49) |
Формулу (4.49) можно применять в определенных пре
делах. П р и М \ а , — Ь,\ < |
|
|
она формально даст для |
|||||||||||||
|
у |
|
|
' |
|
2 (m + |
1) |
|
^ |
F |
|
|
|
|
|
|
М(&) |
не |
имеющий |
смысла |
отрицательный |
результат. |
|||||||||||
Поэтому |
при |
М\а, |
— b,\ < |
|
|
|
будем |
считать, |
что |
|||||||
|
: |
* |
1 |
4 |
' |
2 (т + |
1) |
J |
|
|
|
|
|
|
||
M (k) =0. Математическое ожидание количества |
инверсий |
|||||||||||||||
между |
элементом |
at |
и всеми элементами |
последователь |
||||||||||||
ности В соответственно |
равно |
|
|
|
|
|
|
|
|
|
|
|||||
{т+\)М\а. |
— Ъ,\ |
при |
М\а, |
— Ь.\> |
1 |
|
|
, |
(4.50а) |
|||||||
|
|
' |
' |
|
ѵ |
' |
|
' |
|
2 (m + |
1) |
|
v |
|
|
|
|
|
|
— |
при |
M i a,. |
" |
/;,. i |
|
i |
|
. |
(4.506) |
||||
|
|
|
2 |
|
^ |
1 |
|
" 2(/я + 1) |
|
v |
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Расчет M \ al—bt\ |
в общем случае оказывается |
доста |
||||||||||||||
точно |
сложным. |
Мы его определим через |
дисперсию |
|||||||||||||
разности (аі~Ьі) |
|
при упрощающем |
расчеты |
предполо |
||||||||||||
жении, |
что закон |
распределения |
разности |
( а ; — b t ) |
яв |
|||||||||||
ляется |
нормальным. |
Для такого |
предположения |
|
име |
|||||||||||
ются следующие основания: |
|
|
|
|
|
|
|
|
|
|
||||||
а) в силу статистической эквивалентности последо |
||||||||||||||||
вательностей А и В закон распределения |
(аг |
— 6() |
сим |
|||||||||||||
метричен относительно нуля; |
|
|
|
|
|
|
|
|
|
|
||||||
б) разность |
(а1 |
— 6,) зависит от большого |
количества |
|||||||||||||
случайных |
отклонений многих элементов массива от сво |
|||||||||||||||
их математических ожиданий. |
|
|
|
|
|
|
|
|
|
|
||||||
Допустимость |
упомянутого |
предположения |
в |
даль |
нейшем мы проверим, сравнив результаты расчётов, вы полненных по точным формулам и формулам, выведен ным на основе принятых допущений.
В силу независимости отклонений |
элементов |
а1 и Ь,- |
||
от своих математических |
ожиданий |
|
|
|
D (a, -bt)=D(a,) |
+ |
D(6,) = |
2D (a,), |
(4.51) |
или, с учетом формулы (4.38) |
для дисперсии |
D(at), |
||
D (at — &,) = |
2d (m + 1 — i). |
(4.52) |
§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ |
167 |
Для нормального закона имеет место соотношение
М[а1 |
— Ьі\ = V2fr |
YD(at |
|
— Ь^. |
(4.53) |
|
Подставляя в (4.53) вместо |
D(at—bt |
) ее |
значение |
|||
(4.52), получим |
|
|
|
|
|
|
М\а, |
— Ь,\ = |
|
Vі{т+\— |
|
t). |
(4.54) |
|
Y |
к |
|
|
|
|
Математическое |
ожидание |
количества |
инверсий между |
|||
at и элементами |
последовательности |
В можно |
получить, |
|||
подставив (4.54) |
в (4.50а), |
а степень |
взаимной |
неупоря |
доченности между последовательностями А и В — путем суммирования количества инверсий между всеми парами элементов:
|
/ . з = ^5 |
(т + |
1) У. Ѵі(т+\-і). |
(4.55) |
||
|
V |
* |
|
/=і |
|
|
Сумму в (4.55) заменим приближенным ее значением, |
||||||
равным |
табличному интегралу |
(рис. 4.4) |
||||
|
|
от+1 |
|
|
|
|
|
|
J |
Y'i (m + |
1 — /') di, |
||
|
|
о |
|
|
|
|
равному |
после подстановки пределов |
|
||||
|
|
|
л (m + 1 ) 2 |
|
||
|
|
|
|
8 |
|
|
и в результате получим |
|
|
|
|||
|
Івз=^(т+ІГѴ~с~. |
|
(4.56) |
|||
Выкладки с I в з , |
которые нам предстоит выполнять в сле |
|||||
дующих |
параграфах, |
упрощаются, |
если / в з выразить |
|||
через дисперсию |
суммы |
членов |
последовательности |
(4.45), которую в дальнейшем мы будем обозначать сим волом Ds . Из (4.45) следует, что
168 ГЛ. 4. УПОРЯДОЧЕНИЕ С МИНИМАЛЬНОЙ ПАМЯТЬЮ
Подставляя (4.57) |
в (4.56), |
получим |
|
|
/ B 3 = |
L i |
! ^ L |
^ . |
(4.58) |
|
2 |
fm(m+2) |
|
|
Заменяя |
|
|
|
|
V m (m + 2) = Y (m + 1 ) 2 — 1 |
|
|||
его приближенным |
значением, равным |
(m+1), |
упростим |
Û |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
77/ |
"' I |
|
|
|
1 = 1 |
|
|
r ^ |
- /о |
Vi(mtl-i)di |
|
Рис. 4.4 Аппроксимация |
суммы |
в выражении |
для / в з интегралом. |
в еще большей степени выражение для |
Івз: |
||
U='^-(m+l)YD^- |
|
(4-59) |
При выводе формулы (4.59) мы использовали формулу (4.50а), справедливую лишь в ограниченных пределах. Следовательно, и формула (4.59) справедлива в тех же пределах.
Ввиду того, что математическое ожидание количества инверсий между а1 и всеми элементами последователь ности В не может стать меньше 1/2 (4.506), математиче-
§ 4.2. ХАРАКТЕРИСТИКИ ОПЕРАТОРА ВСТАВКИ |
169 |
ское ожидание количества инверсий между всеми эле ментами последовательностей А и В не может стать меньше т / 2 . При малых значениях М{аt—bt), когда формула (4.59) даст результат, меньший, чем m/S, сле дует считать, что мы вышли из области применимости формулы (4.59), т. е.
/ в з = т / 2 . |
(4.60) |
Для абсолютно случайной по составу последовательно сти дисперсия суммы m членов равна
Ds = m/12.
Подставляя в (4.59), получим
(т+1)ѴИі. (4.61)
В табл. 4.1 приводятся значения / в з для абсолютно слу чайной по составу равномерно распределенной в интер вале (0, 1) последовательности, подсчитанные по точной
формуле (4.24) и приближенной |
формуле |
(4.61). |
|
||||
|
|
|
|
|
|
Т а б л и ц а 4.1 |
|
|
|
/ вз |
Относи |
|
^вз |
|
Относи |
m |
по точной |
по форму |
тельная |
m |
по точной |
по фор |
тельная |
погреш |
погреш |
||||||
|
формуле |
ле (4.61) |
ность, % |
|
формуле |
муле |
ность, % |
|
(4.24) |
|
|
|
(4.24) |
(4.61) |
|
1 |
0,5 |
0',888 |
77,6 |
16 |
28,58 |
30,1 |
5,3 |
3 |
2,4 |
3,07 |
28 |
24 |
52,37 |
54,1 |
3,3 |
6 |
6,55 |
7,62 |
15,4 |
30 |
73,12 |
75,1 |
2,7 |
10 |
14,2 |
15,5 |
9,15 |
|
|
|
|
Результаты сравнения показывают на вполне удовле творительное совпадение, улучшающееся по мере увели чения длины последовательности т. При т < 1 0 погреш ность формулы (4.61) оказывается существенной, но даже и при малых m формула (4.61) приемлема для многих оценок.