Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы анализа и обработки наблюдений

..pdf
Скачиваний:
11
Добавлен:
15.11.2022
Размер:
10.29 Mб
Скачать

Ф и з и к о - М а т е м а т и ч е с к а я

Б и б л й о т е к а И н ж е н е р а

Е. И. ПУСТЫЛЬНИК

СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА И ОБРАБОТКИ НАБЛЮДЕНИЙ

ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ

ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ

М О С К В А 1 9 6 8

517.8 П 89

УДК 519.240

Статистические методы анализа и обработки наблюдений,

П у с т ы л ь н и к Е. И.

Книга посвящена изложению некоторых простых, но важных методов обработки числовых результатов наблюдений. Эти методы стали в последнее время обязательным этапом каждого исследования.

Настоящая книга является попыткой изложения большого числа классических методов анализа и обработки наблюдений на минималь­ ной аналитической основе. В ней излагаются важнейшие оценки нормально распределенной случайной величины, сравнение и анализ серий наблюдений. Приводятся элементарные доказательства основ­ ных формул дисперсионного, корреляционного и регрессионного анализа, некоторые принципы планирования эксперимента и после­ довательного анализа. В начале книги излагается необходимый ми­ нимум сведений из теории вероятностей и общей теории наблюдений. В книге илл. 30, табл. 33.

Евгений Изиевич Пустыльник

СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА И ОБРАБОТКИ НАБЛЮДЕНИЙ

М., 1968 г., 288 стр. с илл.

Редактор И. М. Овчинникова.

Техн. редактор

С. Д.

Шкляр.

Корректоры

Jl. Н. Боровина, А. Ф. Серкина

Сдано в набор

20/Х

1967

г. Подписано к

печати

27/11

1968 г. Бумага

84 X Юв'/аг-

Тип. № 1. Физ. печ. л. 9. Услов н.

печ. л.

15,12.

Уч.-изд. л. 14,4 2.

Тираж

28 000 экз. Т-00079.

Цена книги

1 р. 09 к. Заказ № 2138.

 

 

 

 

Издательство «Наука».

 

 

 

Главная редакция физико-математической литературы.

 

 

Москва,

В-7 1,

Ленинский

проспект, 15.

 

 

 

Ордена

Трудового Красного Знамени

 

 

Первая Образцовая типография имени А.

А. Жданова

Главполиграфпрома Комитета по печати при Совете Министров СССР

 

 

 

Москва,

Ж-54, Валовая. 28.

 

 

 

 

 

 

 

 

 

 

2-2 -3

64-68

СОДЕРЖАНИЕ

Предисловие

5

Введение

7

§ 1. Случайные события

13

1.1. Понятие случайного события (13). 1.2.

Вероятность

случайного события (16). 1.3. Классическое определение вероятности (19). 1.4. Геометрическое определение вероят­ ности (26). 1.5. Последовательность независимых испыта­ ний (30).

§ 2. Случайные величины.

33

2.1.Дискретные и непрерывные случайные величины (33).

2.2.Распределение случайной величины (35). 2.3. Число­ вые характеристики случайных величин (43).

§ 3. Нормальное распределение.

52

3.1. Пример нормального распределения (задача о рассея­

нии снарядов)

(52). 3.2. Свойства нормального распределе­

ния

(58). 3.3.

Использование нормального

распределения

для

изучения других случайных величин (67).

§ 4.

Наблюдения.

 

 

 

 

.

76

 

4.1. Наблюдение как этап

исследования

(76). 4.2. Наблю­

 

дение

как случайная величина

(81).

4.3.

Основная схема

 

производства наблюдений

(выборочный

метод) (85).

4.4.

 

Среднее и дисперсия выборки (89).

 

 

 

 

§ 5.

Основные задачи математической статистики

 

99

 

5-1. Параметры распределения

(99).

5.2.

Доверительные

 

интервалы и доверительные вероятности (106). 5.3. Про­

 

верка

статистических гипотез

(111). 5.4.

Односторонние

идвусторонние критерии (116).

§6. Оценка результатов наблюдений над нормально распределен­

ной случайной величиной.

120

6.1. Оценка генерального среднего (120). 6.2. Оценка гене­ ральной дисперсии (126). 6.3. Сравнение дисперсий (131). 6.4. Сравнение средних (138). 6.5. Проверка однородности наблюдений (146).

1

4

 

 

 

СОДЕРЖАНИЕ

 

 

 

 

§ 7.

Анализ

распределения наблюдений.

 

 

 

152

 

7.1. Проверка основной гипотезы (152). 7.2. Неравенство

 

Чебышева и его использование (162). 7.3. Подбор плотнос­

 

ти теоретического распределения (165). 7.4. Оценка

вероят­

 

ности случайного события (172). 7.5. Использование оце­

 

нок вероятности

для анализа

распределения

(179).

 

 

§ 8.

Дисперсионный

анализ.

 

 

 

 

186

 

8.1 Постановка

задачи (186).

8.2 .' Однофакторный

дис-'

 

персионный анализ (189). 8.3.*Двухфакторный дисперси­

 

онный анализ (196). 8.4.NПланирование эксперимента при

 

дисперсионном

анализе (206).

 

 

 

 

 

§ 9. Зависимость между случайными величинами

 

 

 

213

 

9.1. Корреляция

(213). 9.2. Регрессия (221).

9.3.

Вычис­

 

ление

и анализ

приближенной

регрессии

(226). 9.4. Ли­

 

нейная

регрессия (233). 9.5. Нелинейная

регрессия

(239).

 

9.6. Параболическая регрессия (243).

 

 

 

 

§ 10. Некоторые вопросы планирования эксперимента.

 

252

 

10.1. Способы отбора (252). 10.2. Выбор числа наблюдений

 

(257). 10.3. Последовательный анализ (263).

 

 

 

Рекомендуемая литература

 

 

 

 

268

П р и л о ж е н и е .

Математические таблицы

 

 

 

270

ПРЕДИСЛОВИЕ

За последнее время статистические методы, проникнув в самые отдаленные разделы техники, стали одним из ос­ новных приемов анализа и обработки опытных данных. Од­ нако сила и могущество уже разработанных наукой стати­ стических методов исследования все чаще приходят в про­ тиворечие с недостатком соответствующего образования у инженеров, которым эти методы приходится применять. Основы математической статистики самой жизнью превра­ щаются в необходимейший элемент математического обра­ зования студентов технических вузов.

Настоящая книга представляет собой обработанную за­ пись лекций, которые автор в течение ряда лет читал для студентов и научных сотрудников Воронежского техноло­ гического института. Основы математической статистики излагаются в ней непосредственно в применении к задачам обработки наблюдений, что и обусловило соответствующий отбор материала.

Неотъемлемой частью книг по математической стати­ стике является обычно обширный раздел, посвященный тео­ рии вероятностей. Теория вероятностей, несомненно, обла­ дает большой самостоятельной ценностью и прикладными возможностями. Тем не менее, изучение этой теории требует серьезной математической подготовки и, как правило, усложняет для рядовых инженерных работников путь к ов­ ладению основами математической статистики. Поэтому в данной книге теоретико-вероятностная часть по возмож­ ности сокращена до минимума.

Автор ставил задачей избежать и другой крайности не­ которых статистических руководств — чрезмерной рецептурности изложения, отсутствия сколько-нибудь глубоких объяснений применяемых методов. В книге последовательно

6 ПРЕДИСЛОВИЕ

применяется эвристический метод изложения, некоторые пункты специально посвящены общему анализу рассматри­ ваемых в дальнейшем задач.

Желание сделать книгу доступной для широкого круга лиц привело к необходимости жертвовать строгостью мате­ матического изложения: громоздкие доказательства чаще всего заменены простыми, но не очень строгими объясне­ ниями. Для чтения книги требуются лишь начальные све­ дения из математического анализа. Однако в самой книге изложение постоянно опирается на предыдущий материал, в связи с чем ее рекомендуется изучать в строгой последо­ вательности, ничего не опуская (исключение составляет разве лишь п. 3.1, который при первом чтении можно опу­ стить). Только ознакомившись со всей книгой целиком, ее можно в дальнейшем использовать как справочное по­ собие.

В Приложении к книге даются статистические таблицы, что избавляет читателя от необходимости привлекать дру­ гую литературу при анализе и обработке наблюдений по рецептам данной книги. Этой же цели служат помещенные в Приложении таблицы десятичных логарифмов, квадратов, кубов и квадратных корней действительных чисел.

Книга предназначена в первую очередь для студентов втузов и инженеров, интересующихся более применением статистических методов, нежели их строгим математическим обоснованием. Вместе с тем, она, по-видимому, может быть полезна в качестве введения и для лиц, желающих заняться математической статистикой более углубленно. Именно последним адресован приведенный в конце книги список рекомендуемой литературы с краткими аннотациями. Этот список не претендует не только на полноту, но и на охват хотя бы основной литературы по математической статистике; в нем отразились главным образом вкусы и интересы самого автора.

Автор будет весьма признателен читателям за критиче­ ские замечания, направленные на улучшение книги.

ВВЕДЕНИЕ

Все процессы, происходящие в природе, являются ре­ зультатом взаимодействия многих факторов. Для того чтобы изучить эти процессы и в дальнейшем ими управлять, необходимо выяснить, какую роль в рассматриваемом про­ цессе играет каждый фактор в отдельности. Так, например, изучая движение тела, необходимо выяснить, какие силы приводят его в движение, какие тормозят; наконец, каким образом само движущееся тело влияет на эти силы. Все эти факторы необходимо выразить в каких-то количественных оценках — после этого на помощь исследователю приходит могущество математических методов.

Таким образом, математические методы изучения взаимо­ действующих факторов требуют умения выражать действие различных факторов количественно. Чтобы получить необ­ ходимые числовые данные, нужно произвести серию наблю­ дений. Наблюдение — это решающее звено всякого экспе­ римента, всякого исследования.

Однако даже самый тщательно подготовленный экспе­ римент не позволяет выделить интересующий нас фактор в чистом виде. Мы не в силах изолировать многие посторон­ ние факторы: например, изучая падающие тела, мы не мо­ жем избежать действия вращения Земли; изучая химические реакции, мы никогда не имеем дела с чистыми веществами; изучая электронные процессы, не можем вести их в абсо­ лютном вакууме и т. д. Наконец, нужно вспомнить о раз­ личных помехах, связанных с окружающей обстановкой — ведь даже шум идущего по улице автомобиля сказывается на проводимом в лаборатории эксперименте.

Следовательно, каждое наблюдение дает нам лишь ре­ зультат взаимодействия основного изучаемого фактора с многочисленными посторонними. Некоторые из этих фак­ торов (например, вращение Земли) можно учесть, так как

8

ВВЕДЕНИЕ

они сами

по себе достаточно хорошо изучены. Учет других

факторов (например, наличие примесей в веществах) может быть очень громоздким. Он сильно затянет эксперимент, сделает его неоправданно дорогим. Наконец, многие фак­ торы (помехи) бывают настолько неожиданными, что их вообще нельзя учесть. Сюда же нужно отнести и те фак­ торы, о которых на данном этапе развития науки вообще ничего не известно.

Из сказанного выше можно сделать только один вывод: полное и точное описание какого-либо процесса возможно лишь в том случае, если известны все факторы, влияющие на этот процесс. Иными словами, такое описание вообще невозможно.

К счастью, оно и не нужно.

Большинство измеряемых на практике величин обладает свойством непрерывности, т. е. их значения сплошь запол­ няют некоторый числовой промежуток. Однако все приме­ няемые при этом измерительные приборы обладают некото­ рым пределом точности (разрешающей способностью) — минимальной разницей в значениях двух величин, которую они в состоянии обнаружить. Этот предел обычно указывает­ ся на приборах, изготовленных в заводских условиях. Нап­ ример, аналитические весы, взвешивающие с точностью до 0,1 мг, не смогут различить такие веса, как 12,52 и 12,54 мг, и в обоих случаях покажут 12,5 мг. В результате все даль­ нейшие вычисления, связанные с этими данными, также бу­ дут содержать некоторую неточность, даже если пользо­ ваться абсолютно точными и полными формулами, описы­ вающими исследуемый процесс.

С другой стороны, нужнр учесть, что полученные данные не всегда удается полностью использовать в дальнейшем — приходится округлять их, теряя добытую с таким трудом драгоценную точность. В этом отношении можно привести интересный пример. Некоторые математики XVIII—XIX ве­ ков увлекались вычислением числа л с высокой точностью. Математик Шенке в шестидесятых годах прошлого столетия вычислил л с точностью до 707-го знака после запятой, пот­ ратив на это всю свою жизнь*). Однако подобная точность

*) В настоящее время с помощью электронных вычислительных ма­ шин найдено более двух тысяч знаков числа л.

ВВЕДЕНИЕ

9

еще нигде не была использована. Так, например, чтобы вычислить с точностью до микрона длину окружности с цент­ ром на Земле и радиусом до ближайшей звезды, т. е. #= 4,5 световых лет, достаточно иметь число л с 25 знаками после запятой — даже в таком, заведомо бессмысленном вычисле­ нии 682 шенксовских знака остаются лишними!

Любое увеличение точности при измерениях сильно усложняет эксперимент. Кроме того, добавление каждого лишнего знака усложняет вычисления на 10—15%. По­ этому нужно всегда хорошо знать ту точность, которая пот­ ребуется от результата, не стремясь к излишней точности измерений и вычислений.

Итак, в наших наблюдениях всегда допускается некото­ рая «законная» неточность, величину которой можно рассчи­ тать заранее. Благодаря этому мы можем не учитывать те посторонние факторы, действие которых намного меньше этой неточности; например, изучая движение тел на Земле, можно не учитывать силы тяготения между этими телами или кривизну Земли при малых перемещениях и т. д.

Однако и здесь возникают свои трудности. Рассмотрим для примера такой вопрос: нужно ли, изучая движение авто­ мобиля, учитывать тепловое колебание молекул, из которых он состоит. Ответ напрашивается отрицательный. Но да­ вайте внимательней присмотримся к движению молекул внутри твердого тела. Молекулы колеблются вокруг поло­ жения равновесия с достаточно большими скоростями, од­ нако движение это хаотическое, так что молекулы, движу­ щиеся в одну сторону, уравновешиваются молекулами, движущимися в противоположную сторону. При этом можно представить такое случайное стечение обстоятельств, когда большинство молекул двинется в одну сторону, не уравно­ вешиваясь с другой стороны. Разумеется, в результате в эту же сторону резко переместится и сам автомобиль. Такая возможность вполне допустима теоретически. Как же быть: учитывать ее или нет?

Но ведь если такое стечение обстоятельств и возможно, то оно необычайно редко! — ответит читатель. Во всяком случае, оно ни разу не встречалось за всю автомобильную практику человечества.

Правильно! И в результате мы приходим к еще одному важному выводу: даже сильные отклонения не нужно

10 ВВЕДЕНИЕ

учитывать, если они достаточно редки. При этом, правда, мы рискуем однажды попасть именно на то самое несчастное стечение обстоятельств, однако риск здесь может быть не велик, а облегчение исследований будет достаточно большое.

По этой же причине удается избежать детального иссле­ дования многочисленных непредвиденных (случайных) по­ мех. Хотя действие каждой из них может оказаться вполне заметным, в общей массе они, как правило, уравновешивают друг друга, лишь изредка давая заметный суммарный эффект.

Естественно, пренебрегать можно лишь теми отклоне­ ниями, которые действительно редки — в противном случае риск будет слишком велик, равносилен беспечности. Зна­ чит, эту меру риска надо оценивать, устанавливая допусти­ мый предел для каждых конкретных обстоятельств. Иными словами, нужно научиться численно характеризовать, на­ сколько редко то или иное отклонение.

Для того чтобы выяснить, является ли какое-то событие редким и насколько, необходимо провести очень большее число наблюдений, ибо нужно иметь возможность сравни­ вать это событие с другими. Частота или редкость познаются только в сравнении. Это можно подтвердить следующей юмо­ ристической историей: некий путешествующий англичанин дважды проезжал Париж и оба раза попадал в дождь; после

этого

он записал в дневнике: «Париж — ужасный город,

здесь

всегда идет дождь!».

Чем больше проведено наблюдений, тем лучше можно оценить редкость интересующего нас события. Но и этот процесс не может продолжаться бесконечно. Следователь­ но, при определении редкости события мы опять вынуждены идти на риск (например, упомянутый выше англичанин мог прожить в Париже целый месяц, а этот месяц мог оказаться небывало дождливым для Парижа). Эту долю риска опять нужно оценивать и т. д.

Подобные рассуждения быстро завели бы нас в тупик, если бы каждое случайное событие нужно было изучать заново. Оказывается, однако, что случайные, непредвиден­ ные события в массе своей подчиняются некоторым общим неслучайным закономерностям.

Наука, изучающая закономерности массовых случай­ ных событий, называется теорией вероятностей. Приме­

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]