Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пиотровский

.pdf
Скачиваний:
174
Добавлен:
06.06.2015
Размер:
9.13 Mб
Скачать

 

Т а б л и ц а 7.28

Интервалы

Интервалы

2,40—3,00

0

6,00—6,60

 

3,00—3,60

2

6,60—7,20

 

3,60—4,20

8

7,20 — 7,80

 

4,20—4,80

20

7,80—8,40

 

4,80—5,40

21

8,40—9,00

 

5,40—6,00

22

 

 

 

 

Т а б л и ц а

7.29

Интервалы

 

Интервалы

 

2,40 — 3,60

2

6,00—7,20

18

3,60—4,80

28

7,20—8,40

7

4,80—6,00

43

8,40 — 9,60

2

 

 

N = 100

дов используются следующие четыре эмпирических момента, аналогичные тем четырем моментам, которые характеризовали теоретические распределения (см. гл. 6, § 2, п. 8):

1)

первый начальный момент пх

=» х (средняя арифметическая),

2)

второй центральный момент

ma

=

sa

(опытная дисперсия),

3)

третий нормированный момент г3

=

 

(коэффициент ско-

шенности ряда),

 

 

 

 

4)

четвертый нормированный момент

г4

«= m j ^ (коэффициент

крутости ряда).

 

 

 

 

Пользуясь численными значениями отдельных моментов, а также сравнивая эти значения между собой, можно выдвигать гипотезы о соответствии данного вариационного ряда тому или иному распре-

делению. Выше было показано,

что

нормальное распределение

имеет, в частности, параметры р8

==0,

р4

3. Поэтому если тре-

тий эмпирический нормированный момент г, вариационного ряда не сильно отличается от нуля, что указывает на симметрию ряда, а значение четвертого нормированного момента ri близко к трем, что свидетельствует о средней крутости ряда, то можно выдвинуть гипотезу о нормальности рассматриваемого нами распределения (о методах проверки этой гипотезы см. в гл. 9).

 

Если же величина га заметно отличается от нуля, а г 4 ^ 3 или

г4

3, то предположение о нормальности лингвистического вариа-

ционного ряда должно быть сразу же отвергнуто. Такие оценки широко использовались, например, при определении нормальности эмпирических распределений слов и суффиксов в различных подъязыках и стилях современного латышского языка (31, с. 12—13). Следует иметь в виду, что здесь не указываются те границы, которых

260

могут достигать отклонения эмпирических моментов от их теоретических аналогов, т. е. границы, в рамках которых лингвистический вариационный ряд сохраняет свою принадлежность к нормальному распределению.

Эти границы могут быть определены исходя из следующих соображений. Будем рассматривать значение третьего нормированного момента г8 как показатель суммарного смещения кривой эмпирического распределения наблюдаемых погрешностей от центра кривой нормального распределения. Это смещение можно оценить с помощью среднего квадратического отклонения

a w -

l /

l

l Й Ц Г 1

,

(7.54)

V 87

v

 

(N+l)(N+3)

'

V

'

где N — объем выборки. Если

N велико,

то вместо (7.54)

можно

пользоваться приближенной

оценкой

 

 

 

 

o(r a )&VQ/N .

 

(7.55)

Мерой согласованности эмпирического распределения с нормаль-

ным законом служит отношение

 

|r8 |/a(r8 ) = a .

(7.56)

Если a < 3, то смещение эмпирической кривой относительно центра нормального распределения можно считать несущественным.

Для оценки расхождения эмпирического распределения и теоретического нормального распределения используется среднее квадратическое отклонение

„ Ю ^ т П Ш Ш ш Е Е ,

(7.57)

причем при больших N соотношение (7.57) заменяется приближенным равенством

a(Е) « 2J/6/W = 2а(г3).

(7.58)

Соответственно мерой согласованности эмпирического и теоретического нормального распределений служит отношение эксцесса к среднему квадратическому а(Е):

Е3 /а(Е) = р.

(7.59)

Если Р < 3 , то отличие вариационного ряда от нормального распределения несущественно.

Итак, если для рассматриваемого лингвистического вариационного ряда a < 3 и р <С 3, то можно предполагать, что этот ряд имеет нормальное распределение. Подробнее о применении этой процедуры см. ниже.

Значения опытных моментов могут быть использованы также для сравнения вариационного ряда и теоретического распределения Пуассона. Поскольку для распределения Пуассона имеет место равенство теоретических моментов vx = р,2 = [х3 = А, (см. гл. 6,

261

§ 3, п. 2), то лингвистический вариационный ряд, в котором значения эмпирических моментов п и т а и т 3 мало отличаются друг от друга по величине, может быть гипотетически отнесен к распределению Пуассона.

В работе Т. А. Якубайтис [31, с. 7—46, 69—66] вычислены эмпирические моменты nlt т2, т3 для распределения 120 слов, 6 суффиксов и класса частиц в различных подъязыках и функциональных стилях латышского языка. Обнаружилось, что по мере уменьшения частоты слов численные значения эмпирических моментов nlt т2, та

сближаются. Отсюда

можно сделать

вывод, что распределение неко-

торых

редких слов

(F > 70) в латышском языке

соответствует

закону

Пуассона.

 

 

 

4. Распределение

средних длин словоупотреблений в языках

мира. В § 3, п. 13 было показано, что средняя длина

словоупотреб-

ления может выступать в качестве

статистического параметра сти-

ля. В связи с этим возникает вопрос: можно ли считать среднюю длину словоупотребления типологической характеристикой конкретного языка [8]; [51, с. 178—181]? Статистический анализ распределения средних длин словоупотреблений в языках мира помогает решению этого вопроса. Действительно, если вариационный ряд средних длин хорошо аппроксимируется нормальной кривой, то можно предполагать, что средние длины словоупотреблений разных языков равномерно группируются вокруг некоторой средней, задаваемой возможностями оперативной памяти человека. Отклонения от этой средней в каждом конкретном языке следует рассматривать как результат случайных воздействий, по всей вероятности, не связанных с типологией языка.

Заметное отклонение вариационного ряда от нормальной криЕСЙ можно рассматривать как указание на то, что распределение средних длин словоформ определяется не только случайными, но и детерминированными процессами. В этом случае естественно предположить, что расхождения в средних длинах словоупотреблений связаны с типологическими особенностями конкретных языков.

Чтобы решить, какое из этих двух предположений считать более правдоподобным, обратимся к статистическому анализу распределения средних длин словоупотреблений для ста языков мира, применяющих буквенную графику*. Для этого используем приведенные выше табл. 7.27 и 7.28.

Статистический анализ ряда, проведенный строго по схеме, которая была изложена в п. 1—3, показан в табл. 7.30. Начнем с того, что определим центральное значение xt каждого интервала [столбец (2)]. Затем вычислим начальные моменты относительно а, в качестве которого возьмем среднее значение центрального интервала (а =» = 5,70). Используя общий для разностей xt а множитель I — 0,6

* Расчет произведен по разговорно-беллетристическим текстам этих языков, а также по отрывкам, приведенным в книге [12]. Если учитывать научнотехническую и публицистическую прозу, то значения средних длин будут несколько выше.

262

дг—Ьг

hh

, ( ' + Л )

.

( Л

)

-

i

Л

)

*

ш-

1

0-h

в-»* h 1х

HireadaiHpj

 

 

f-CMO>P~QOOlOr--—•

 

 

 

Ю О Н О М Я Ш О Ч ' О ®

 

50

 

COt^oOlOC^COOailOO

e o 6 s ' s =

 

i n c o m c o o o i c o i n — со

 

 

Tf

 

00 СТ> CMз/.ео'бг9

=*UJ

 

 

 

 

 

CM

 

 

 

M* CO t^ 00 t—i.co O C O l O f

 

 

 

lOt"~Olf~.OOOt"~3;roeM

* 8 E 6 ' 0 =

 

о

— с о с о о с о ^ с л ^ ^ - о

 

о" о"

О*0*01 to СМ СО 00 Ш 8 ' £ 6

= * ш

 

 

см со —I

^f со со

 

 

 

1

1

1 1

 

 

 

СМооОСОСМСОСМОСМСМ

 

 

 

1—' 00 СМ —I СТ> Ж Ol Ю

 

3"

 

СО СО СО СМ СО 00 ^ О СО G1

 

 

СО

^

СМ СМ — 00.О1О1

 

 

О оГо> 00 СМ —Г— Tf о со о"OOOfr'SSl

 

 

 

 

—i

 

—< с-1 см

 

 

 

(ОсОСОСОСОСОСОСОСОСО

 

5? |

IO СО —lOit^lrtCO—i <JJ

 

COCOCMCMlOOt-~tOCOOl

 

 

 

- i n O l C O N O O f O I O M

 

 

1 N - О О О О - < И М СО

 

 

 

1

1

 

п

 

СО о

со см

— п-оо оо щ см п-

 

<о"—Го

м я о п t C t o ( С

 

 

 

 

с о о о с м о — ' с о — —

 

N

о м о о о о ^ ф м а о м

 

 

со см см

см Д со об to а>

 

 

 

— —•

СМ —' см См юSZ89=!S>

 

 

 

 

 

 

—( — см

 

£

 

«О — О —• СО —< <£> Ю <£>

 

 

 

 

 

 

 

ОЧ'сосм — о—•смсоп'Юсо

 

T

i

 

n

 

 

 

 

 

 

 

 

 

5>

O N O O O - ' О СО СМ Ю СМ О

 

—• Tt" CM CM

—COO-"lO

 

 

m со со

 

 

 

 

 

^ i n w 9 i z e = * s

 

OOOcOQ — ОСОСО1ЛООО

аВ

 

СЧ — СОСМ

 

— — сосчю

 

_ см —

 

 

 

 

— — см 0 S = 8 S

 

 

 

I I

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9 S S = e S

S

О 00 О — 1 0 0 - # 1 0 0 0 0

 

 

1

CM Tf CM

 

—1

 

—<

ot—=TS

 

 

 

 

1

I I

 

 

 

 

 

 

Ift

Ю^СОСМ — 0-"СМСО^*Ю

1

 

1

1

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q O Q O O

 

 

o o o o o

?

О

 

 

00 CM CD

 

СОСМОО-^О

со см"—Г — о

о о — Г с м "CO

 

1 1 1 1 т

 

 

 

 

 

 

 

 

о с ч о о о — счсосчюсмсч

 

 

 

 

 

 

CM СЧ <N —•

 

 

 

O O O O O O Q O O O O

 

 

СООТЮ

 

NtOOliO'-HN

 

CM CO CO-Ч" Ю Ю в ffl М » 00

 

 

 

 

 

 

 

 

 

II

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

8

nt<)TfTflOtO<DNNoO®

Д 1

0

и

0

0

1 I I

0

I I

0

I I

 

0

0

 

 

 

0

0

0

0

 

Tf 0 0

м й ^ о в м с о ^

 

W n c O ^ ^ i n e c D N

00

 

6 9 1 8 ' * =

 

=»M

0 s ' 0 = ® «

s e * o ' o =

= « u

э д < е = г ы

9183' 1 =

 

W o — =

 

=XM

63

[столбцы (4) и (5)1, определим сначала рабочие начальные моменты. Для этого, разделив каждую из сумм столбцов (6) —(9) на N = 100, получим:

п'0 = \, п[ = — 0,4, П2 = 3,56, п'г = 0,2, n't = 37,16.

Для проверки правильности вычислений определим четвертый момент для условных вариант —j— + 1 с помощью равенства (7.40):

« Г = 1 + 4-(—0,4) + 6-3,56 + 4-0,2 + 37,16=58 72.

Этот результат совпадает со значением nj*, полученным путем непосредственного вычисления по формуле (7.36) [ход расчетов показан в столбцах (10)—(12) табл. 7.30]. Таким образом, расчет рабочих начальных моментов получен правильно.

Теперь можно перейти к вычислению начальных моментов относительно а = 5,7. Для этого каждое из значений nk нужно умножить на 1Н — 0,6й. Тогда получим:

п0 = 1.0,6° = 1 ; пх = —0,4-0,б1 = —0,24; ла = 3,56-0,б2 = = 1,2816; л3 = 0,2-0,б3 = 0,0432; /г4 = 37,16-0,б1 = 4,8159.

Средняя арифметическая ряда (т. е. средняя длина словоупотребления) в языках мира равна

х = пг (а) + а = —0,24 + 5,7 = 5,46.

Затем, используя начальные моменты относительно а и формулы (7.32)—(7.36), вычислим центральные моменты:

т 0 = 1;

т1 = 0;

ma = s2 = 1,2816 — (—0,24)2 = 1,2816 — 0,0576 = 1,224;

т 3 = 0,0432 — 3-1,2816-(—0,24) + 2(—0,24)3 = 0,0432 + 0,9228—

— 0,0276 = 0,9384;

т 4 = 4,8159 — 4-0,0432-( — 0,24) + 6-1,2816-( —0,24)а

— 3 - (-0,24)4 = 4,8159 + 0,0415+0,4429 — 0,0100 = 5,2903.

Центральные моменты можно получить и с помощью формул (7.47)—(7.49). Для этого каждую сумму из столбцов (16)—(18) разделим на N = 100. Нетрудно заметить, что полученные результаты совпадают до третьего знака после запятой со значениями центральных моментов, полученных по упрощенной процедуре. Таким образом, расчет центральных моментов произведен правильно.

Теперь, используя

значения центральных моментов,

переходим

с помощью выражений

(7.54)—(7.59) к непосредственной

проверке

264

нормальности

распределения

средних

длин словоупотреблений

в языках мира. Имеем:

 

 

 

 

тs = 0,9384/(УП224)8

= 0,693;

 

Еь

= 5,2903/1,224* — 3 = 3,527 — 3 =

0,527.

Далее получаем

 

 

 

а (гя) = К(6-99)/(10Ы04) = /0,05655 =

0,238,

или по приближенной оценке

(7.55),

 

 

 

<т(г3) » / б 7 Т 0 б «

0,245,

 

атакже

о(Е) = К(2400-98-97)/(992-103-105) = ]/0,215244 = 0,464,

или по оценке (7.58),

а

(Е) »

0,490.

 

Поскольку

отношения

 

 

 

 

 

 

а

=

0,693/0,238 =

2,91, а

«

0,693/0,245 «

2,83,

р =

0,527/0,464 =

1,14,

0 «

0,527/0,490 «

1,08

меньше трех, то можно предположить, что распределение средних длин словоформ в языках мира подчиняется нормальному закону. Отсюда следует, что образование словоформ во всех языках мира ориентировано на некоторый эталон, длина которого определена возможностями оперативной памяти человека.

На этом мы заканчиваем описание важнейших приемов формирования вариационных рядов и методики вычисления их характеристик. Каждый вариационный ряд обобщает результаты статистического эксперимента над текстом ограниченной длины, который выступает в роли частной выборки, взятой из некоторой генеральной совокупности (язык в целом, стиль, подъязык, язык писателя). Обычно выборочная текстовая совокупность интересует лингвиста лишь постольку, поскольку она может рассматриваться в качестве

модели, отражающей вероятностные свойства

исследуемой гене-

ральной совокупности текстов и стоящей за ней

нормы языка или

его разновидности.

 

ГЛАВА а

СТАТИСТИЧЕСКАЯ МОДЕЛЬ ТЕКСТА И ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ НОРМЫ ЯЗЫКА

Переход от статистической модели выборки текста к вероятностным характеристикам нормы языка связан с решением трех задач.

Во-первых, по характеристикам 0* вариационного ряда необходимо численно оценить скрытые от прямого наблюдения параметры 0 соответствующего распределения генеральной совокупности, т. е. параметры, выступающие в качестве вероятностных характеристик нормы языка и его разновидностей.

Во-вторых, по данным вариационного ряда следует оценить характер генерального распределения.

В-третьих, имея в своем распоряжении численные оценки параметров генерального распределения, а также зная характер этого распределения, необходимо решить важнейшую технологическую задачу лингвистического исследования, состоящую в определении того, какой объем обследуемого текста даст достаточно надежные лингвистические результаты.

§ 1. Точечная оценка параметров генеральной лингвистической совокупности

1. Понятие точечной оценки. Каждый параметр 0* вариационного ряда, вычисленный на основе ограниченного числа опытов, всегда содержит элемент случайности. Поэтому его значение нельзя отождествлять со значением параметра 0, характеризующего распределение исследуемого лингвистического явления в генеральной совокупности. Величину 0* следует рассматривать лишь как точечную оценку значения 0.

Что же представляет собой эта оценка 0* с вероятностно-статис- тической точки зрения? Чтобы ответить на этот вопрос, проведем следующий мысленный эксперимент.

Предположим, что из генеральной совокупности текстов извлекаются 1-я, 2-я, ..., N-я выборки одного и того же объекта, в каждой из которых наблюдаемая случайная величина X с параметром 0* принимает значения хи х2, ..., xN. Все эти значения имеют одинаковые распределения, идентичные распределению величины X. Каж-

дое

распределение соответственно характеризуется

параметрами

01,

05, ..., 8Jv, которые являются значениями параметра 0*. Этот

последний представляет собой функцию значений jq, х2,

..., xN и яв-

ляется случайной величиной (ведь каждая новая i-я выборка дает новое значение 0* нашей оценки).

Так как точечная оценка 0* является случайной величиной, то она может давать разные отклонения от значения 0, и следовательно, давать разную по своей «доброкачественности» оценку параметра 0. Наша задача состоит в том, чтобы найти критерии, позволяющие выбирать из параметров 0«, 0jj, ..., 0£ исследованной частной вы-

266

борки такую величину 9J, которая давала бы наименьшее отклонение от значения 0 и выступала бы поэтому в качестве наилучшей оценки.

Действительно, мы пока не знаем, что является наилучшей оценкой математического ожидания М (X) — ц в генеральной совокупности: средняя арифметическая х, медиана Me или модаМо. Аналогичным образом мы не можем пока сказать, что является лучшей оценкой дисперсии D (Х) = а2: выборочная дисперсия s2, размах R или среднее абсолютное отклонение \xt — х\.

Чтобы получить критерии выбора наилучших оценок параметров распределений в генеральных совокупностях, необходимо, во-пер- вых, определить те требования к оценкам 0*, которые давали бы хорошее приближение этих оценок к параметру 0, во-вторых, определить методы нахождения оценок; в-третьих, выяснить возможности использования этих оценок для получения надежных выводов относительно значений параметров генеральной лингвистической совокупности. Хорошее приближение характеристики 0* к теоретическому параметру 0 должно отвечать требованию с о с т о я т е л ь - н о с т и , сущность которого заключается в следующем. Идеальной оценкой для параметра 0 была бы такая величина 0*, которая в каждом своем выборочном значении Эt, Oj, ..., 0w в точности совпала бы с искомым параметром 0. Разумеется, что на практике такое положение недостижимо. К идеальному положению, при котором

0* = 0,

можно было бы приблизиться, постепенно

усредняя зна-

чения 0i,

02, ..., Qn при условии, что N -*• оо, как это

предусмотре-

но законом больших чисел (см. гл. 6, § 4).

 

В этом случае согласно закону больших чисел имела бы место

сходимость по вероятности величин 0* к 0, описываемая

равенст-

вом

 

lim Р{|0* — 0 | < е } = 1,

(8.1)

N-*оо

 

в котором е — сколь угодно малая величина.

 

Итак, оценка неизвестного параметра 0 в генеральной

лингвис-

тической совокупности отвечает требованию состоятельности, когда она подчиняется закону больших чисел.

Нетрудно заметить, что требование состоятельности имеет два практических недостатка. Во-первых, оно не всегда обнаруживается в условиях малых выборок, с которыми имеет дело языковед; вовторых, при одной и той же функции распределения генеральной совокупности для данного параметра 8 можно найти бесконечное множество состоятельных оценок, сходящихся по вероятности к 0. Поэтому требование состоятельности дополняется еще двумя требо-

ваниями:

н е с м е щ е н н о с т и

и

э ф ф е к т и в н о с т и .

Не-

смещенной

оценкой называется такое

приближение, при котором

математическое ожидание 0' равно

параметру 0 генеральной

сово-

к^ пности,

т. е.

 

 

 

 

М {0*) -

 

0.

 

267

Иными словами, несмещенность оценки означает равенство по абсолютной величине взвешенных сумм отклонений значений 0J, 02, • ••> 0,v от центра, в качестве которого выступает параметре. Вместе с тем она показывает на отсутствие систематической ошибки, постоянно смещающей указанные значения в одну сторону от этого центра.

2. Несмещенные и эффективные точечные оценки математического ожидания и дисперсии. В работах по математической статистике [10, с. 314—317] доказывается, что средняя арифметическая х выборочной совокупности является несмещенной оценкой математического ожидания случайной величины генеральной совокупности, т. е.

М (х) = М (X),

и что относительная частота f есть несмещенная оценка вероятности р. Одновременно выясняется, что в малых выборках (N ^ 50) опытная дисперсия D x ^ s * не может служить несмещенной оценкой теоретической дисперсии D (X) = а2. Несмещенной оценкой теоретической дисперсии является величина

s2 = ——— s2.

 

(8.2)

JV-l

v

'

При больших значениях N величиной смещения можно пре-

небречь и рассматривать s2 в качестве несмещенной оценки D

(Х)=

= а2.

 

 

Возможные значения 0 могут не давать смещения, однако одновременно могут быть сильно рассеяны вокруг М (0*), что заметно ухудшает оценку параметра 0. Поскольку наилучшей мерой среди рассматриваемых в этой книге мер рассеяния является дисперсия, целесообразно оценивать эффективность оценки 0/ параметра 0 с помощью величины

D (0;) = а2(0Г).

Таким образом, если имеется несколько состоятельных несмещенных оценок параметра 0, то наиболее эффективной служит та, которая имеет наименьшую дисперсию и наиболее тесную концент-

рацию

значений

0* вокруг М (0*) =

0.

В

качестве

примера рассмотрим

две оценки математического

ожидания употребления служебных слов, дающих обычно нормальное распределение в тексте. Этими оценками являются средняя

арифметическая х = 0£

и

медиана Me = 0р. В. И. Романовский

[30, кн. 1, с. 203] показал,

что для средней арифметической диспер-

сия составляет

 

 

 

 

D

(0а) =

а2 (Х) =

oVN,

а для медианы она равна

 

 

 

D (0р) ^ a 2

(Me) =

NA2/(2N)

= 1,57O*/N.

268

Так как концентрация значений 0а вокруг М (в*) в полтора с лишним раза выше, чем концентрация значений 6g, то средняяарифметическая является более эффективной оценкой математического ожидания, чем медиана.

§ 2. Оценка математического ожидания с помощью доверительного интервала и статистическая параметризация

стилей

1. Доверительный интервал. Отвечая требованиям состоятельности, несмещенности и эффективности, точечная оценка 0* имеет один серьезный недостаток: она не дает сведений о точности и надежности приближения к параметру 0 генеральной лингвистической совокупности. Этот недостаток особенно ощутим тогда, когда число наблюдений мало. Чтобы устранить этот недостаток, вводится иной вид оценки — доверительный интервал.

Для определения доверительного интервала необходимо найти

такие случайные

значения 0н, 0J, каждое из которых является функ-

цией выборочных наблюдений хи

х2, ..., XN, чтобы образуемый ими

промежуток (9;,

0£) с вероятностью не менее Р покрывал неравен-

ство 0; < 0 <

0В\ в котором 0J выступает в роли нижней, а 0в —

верхней границы

доверительного

интервала.

При оценке

параметра 0 с помощью доверительного интервала

учитываются две величины.

 

Во-первых,

необходимо указать ширину доверительного интер-

вала

0? — 0н, половину которого составляет величина погрешности

е =

(0* — 0J)/2,

характеризующая точность нашей оценки. Чем

уже интервал, т. е. чем меньше разность 0в — 0н, и следовательно, чем меньше е, тем точнее оценка параметра 0.

Во-вторых, следует учитывать с какой вероятностью интервал (0н, 0в) покрывает параметр 0. Ведь нижняя (0н) и верхняя (0J) границы интервала суть случайные величины, зависящие от опыта: при многократном повторении опыта величина и положение интервала (03, 0в) относительно 0 будут меняться. Однако доверительный интервал должен быть построен так, чтобы доверительная вероятность (надежность) *> захвата им параметра 0 была бы достаточно велика, а вероятность ч, представляющая собой дополнение до единицы и указывающая на то, что 0 не будет покрыт интервалом (8Ц, 0в), была бы соответственно мала (мы будем впредь называть q уровнем значимости). Чем ближе вероятность р к единице, а вероятность <? к нулю, тем меньше риск ошибиться в оценке параметра 0.

2. Определение доверительного интервала для математического ожидания нормально распределенной случайной величины при известном а. Пусть случайная величина X имеет нормальное распреде- ление в интересующей нас генеральной лингвистической совокупности, причем нам известно значение а, но неизвестен параметр

М(X) = р.

Для оценки р естественно использовать среднюю арифметическую х, которая на основании центральной предельной теоремы (см. гл. 6,

269