Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

[ММвЛХ] Методуказания_Матметоды_в_ЛХ

.pdf
Скачиваний:
51
Добавлен:
03.05.2015
Размер:
1.68 Mб
Скачать

Около 68 процентов всех вариант нормально распределенной случайной величины отклоняется от генеральной средней не более, чем на одно среднее квадратическое отклонение. Около 99,73% – не более, чем на утроенное среднее квадратическое отклонение.

На этой закономерности основано правило «трех сигм». (Для генеральной совокупности среднее квадратическое отклонение принято обозначать греческой буквой «сигма» - σ).

По этому правилу в предположении, что генеральная совокупность распределена нормально, варианты, которые отклоняются от среднего значения более чем на ± 3σ , из обработки исключаются как принадлежащие к другой генеральной совокупности.

Имеется и другое применение этого правила. Если распределение случайной величины не известно, но условие, указанное в правиле «трех сигм», выполняется, то можно предположить нормальное распределение случайной величины.

Коэффициентом изменчивости (вариации) называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней.

Он характеризует те же свойства совокупности, что и среднее квадратическое отклонение. Преимущество коэффициента изменчивости заключается в том, что он является безразмерной величиной и поэтому удобен для сравнения рассеяния признаков, имеющих разные единицы измерения.

Недостатком является невозможность нахождения V при х, равных нулю (или близких к нему).

На основании величины коэффициента изменчивости можно установить словесную характеристику изменчивости:

 

 

V

S 100 / X .

 

 

V

до 5%

6-10%

11-20%

21-50%

>51%

Изменчивость

слабая

умеренная значительная

большая

очень

большая

Показатели асимметрии и эксцесса

Нормированный 3-й центральный момент называется коэффициентом асимметрии и служит характеристикой асимметрии или скошен-

ности распределения:

А = μ3 /S3.

11

Если случайная величина распределена симметрично относительно своего математического ожидания (среднего значения), то А = 0. Если «хвост» справа – А > 0, «хвост» слева – А < 0 (рис. 3 ).

С 4-м центральным моментом связана величина, называемая коэф-

фициентом эксцесса:

Е = μ4 /S4 – 3.

Эксцесс характеризует островершинность или плосковершинность распределения. Для нормального закона распределения Е = 0. Кривые более островершинные, чем нормальная, – положительны; более плосковершинные – отрицательные (рис. 4).

а) б)

Рис. 3. Ассиметричная кривая: а) положительная асимметрия; б) отрицательная асимметрия

а)

б)

Рис.4. Виды кривых: а) крутовершинная – положительный эксцесс (1) в сравнении

снормальной кривой (2); б) плосковершинная – отрицательный эксцесс (1) в сравнении

снормальной кривой (2).

Содержание работы

1. Расчѐт статистик по таксационным показателям: A, H, D, P, M в программе Excel

В строке меню выберите Данные Анализ данных Описатель-

ная статистика → ОК.

12

В появившемся окне диалога нажмите кнопку в поле «Входной интервал» – выделите столбцы с данными A, H, D, P, M, затем снова нажмите на кнопку. В диалоговом окне «Описательная статистика» по-

ставьте «галочки» Метки в первой строке и Итоговая статистика

→ выделите «селекторную кнопку» Новый рабочий лист ОК. На новом рабочем листе появится таблица с основными статистиками для

A, H, D, P, M.

Переименуйте этот лист в «Основные статистики». Полученную таблицу скопируйте в файл отчета (MS Word).

2. Интервальная оценка среднего арифметического значения по таксационным показателям

Интервальная оценка среднего арифметического для генеральной совокупности с вероятностью 0,95 имеет вид неравенства:

X 2mx X X 2mx .

Пользуясь данными листа «Основные статистики», постройте интервалы для среднего значения по возрасту, высоте и диаметру. Для H и D результаты округлите до десятых долей, для А - до целого значения.

Файл сохраните, программу Excel закройте.

2. Расчѐт статистик по таксационным показателям: A, H, D, P, M в

программе Statistica

Откройте программу Statistica.

В строке меню выберите Анализ → Основные статистики и таблицы → Описательные статистики ОК. Введите переменные: A,

H, D, P, M Дополнительно → отметьте «галочкой» все статистики,

кроме Сумма и Границы процентелей ОК.

Полученную таблицу скопируйте вместе с заголовком в отчет (MS Word). Запишите интервальные оценки для таксационных показателей

A, H, D, P, M.

Файл сохраните, программу Statistica закройте.

13

ЛАБОРАТОРНАЯ РАБОТА № 3. ТЕОРЕТИЧЕСКИЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Цель работы: получить практические навыки по моделированию теоретических частот случайной величины, используя функцию нормального распределения в среде Excel и проверке статистических гипо-

тез в среде Excel и Statistica.

Краткие теоретические сведения

Исчерпывающим результатом изучения случайной величины является установление закона ее распределения.

К числу наиболее распространенных и важных относится нормальное распределение. Оно часто используется для приближенного описания многих случайных явлений, например, для случайного отступления фактического размера изделия от номинального, рассеяния снарядов при артиллеристской стрельбе, а также во многих других ситуациях, где на интересующий нас результат воздействует большое количество независимых случайных факторов, среди которых нет сильно выделяющихся.

Этот тип непрерывного распределения, открытый в 1733 году Абрахамом де Муавром, имеет плотность распределения:

 

 

 

 

 

 

 

 

)2

 

 

 

 

 

 

(x

 

x

 

 

1

 

 

i

 

 

 

 

f x

 

e

2

2

 

,

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

где -∞ < x < +∞.

Функция распределения равна:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

( x

 

x)

 

 

 

 

 

 

 

 

 

 

F x

1

 

e

2

2

 

dx ,

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

где x - среднее значение признака, σ – стандартное отклонение,

=3,142…,

е= 2,718…

14

1=0,
3=0,
4= σ4.
2= σ2,

Рис.5. Плотность нормального распределения со средним x и различными значениями дисперсии

Большинство методов прикладной статистики разрабатывается в предположении, что исследуемые случайные величины подчиняются нормальному распределению, однако это предположение всегда требует проверки, иначе можно получить неверные результаты оценивания.

Следует отметить, что f(x) стремится к 0 при x ∞ и x

-∞. График

 

 

 

 

 

 

 

 

f(x) симметричен относительно x . При этом в точке x

функция f(x)

достигает своего максимума.

 

max

1

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Параметр x характеризует положение графика на числовой оси (параметр положения). Параметр σ характеризует степень сжатия или растяжения графика плотности (параметр масштаба).

Можно выразить моменты нормального распределения через его параметры :

0=1,

Нулю равны все нечетные моменты, поэтому для нормального распределения: A=r3=0, E = r4=0, т.е. равенство нулю показателей скошенности и крутовершинности распределения является необходимым и достаточным условием, чтобы некоторое распределение можно было считать нормальным.

15

Непосредственное вычисление вероятностей по вышеприведенным

формулам достаточно трудоемко. Составить таблицу для всех x и σ практически невозможно. Поэтому табличные значения f(x) и F(x) составлены для так называемого нормированного распределения, в кото-

ром x =0 (перенос точки отсчета) и σ = 1(изменение масштаба) . Конкретное распределение «нормируют» путем замены переменных:

ti

(xi

 

x)

.

 

S

 

 

 

Плотность распределения и функция нормированного нормального распределения:

 

 

 

1

 

 

 

 

t 2

 

f (t )

 

 

 

 

e

2 ,

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

x

 

 

t 2

 

F (t )

 

 

 

 

 

e 2 dt.

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Нормированное распределение табулировано, и по значению величины t вычисляют значение функции вероятности и плотности вероятности. С помощью этих таблиц рассчитывают частоты при исследовании конкретных случайных величин.

Свойства нормального распределения

1.x =Mo=Me.

2.Для нормального распределения 68% случайных величин лежат в

пределах от x -S до x +S; 95% – от x -2S до x +2S; и 99,7% –

от x -3S до x +3S.

3.Кривая распределения ассимптотически приближается к оси абсцисс, продолжаясь в обе стороны до ∞.

4.Нормальная кривая имеет две точки перегиба x -S и x +S

5.При постоянной x (при увеличении и уменьшении S) кривая

расширяется и сужается, а при постоянной S (при изменении x кривая сдвигается не изменяя формы).

16

Содержание работы

1. Группировка первичных данных по классам (на примере значений диаметров) в программе Excel

Необходимые для расчетов данные (число наблюдений – «счет», минимальное и максимальное значения диаметра) находятся на листе

«Основные статистики».

Для определения оптимального числа классов воспользуйтесь правилом Стерджеса:

K = 1 + 3,32 lg n,

где n – число наблюдений (результат округлите до целого числа). Найдите классовый интервал dx = (Xmax – Xmin)/K, полученный ре-

зультат округлите до целого четного числа, затем найдите границы первого класса Xmin ± 0,5 dx. Последующие классы образуются путем прибавления к верхней границе предыдущего класса величины dx.

Откройте лист «Исходные данные», на свободном месте постройте таблицу:

Верхняя

Середина класса

Частота

Накопленная час-

граница класса

 

 

тота

 

 

 

 

Заполните первые две колонки, затем в столбце «Частота» выделите ячейку, на панели инструментов нажмите значок fx («Мастер функций»), в окне диалога выберите категорию Статистические, в списке функций – Частота ОК.

Впоявившемся окне диалога (рис. 6) нажмите кнопку в поле «Массив данных» → выделите столбец с данными по диаметру (только ячейки, содержащие числовые значения), затем снова нажмите на кнопку.

Вполе «Массив интервалов» аналогичным образом дайте ссылку на столбец «Верхняя граница класса» → ОК → растяните 1-ю ячейку, зацепив за крестик на имеющееся количество классов, нажмите клавишу F2, затем комбинацию клавиш Ctrl+Shift+Enter. Сумма полученных значений должна равняться числу наблюдений.

Для расчета накопленных частот в соответствующем столбике в первую ячейку введите частоту 1-го класса, во второй ячейке введите формулу: = U2+T3 нажмите Enter, затем выделите ячейку с полученным значением и растяните, зацепив за крестик, на необходимое число классов (рис. 7). Накопленная частота в последнем классе равна числу наблюдений.

17

Рис.6. Группировка данных по классам

Рис.7. Расчет накопленных частот

2. Графическое представление рядов распределения С помощью «Мастера диаграмм» постройте гистограмму, в поле

Диапазон дайте ссылку на частоту, присвойте название оси Y – частоты, оси X – середины классов, поместите гистограмму на отдельном листе, который назовите «Гистограмма».

Файл сохраните. В отчете представьте частотную таблицу и график. На новом листе постройте таблицу (см. табл. 2). Лист назовите

«Теоретические законы».

18

Таблица 2. Пример расчета теоретических частот и критерия согласия

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее

Стандартное

Нормиро-

 

Эмпири-

 

Объем

 

Теоре-

 

Критерий

Середина

Плотность

ческие

 

Величина

 

значение

отклонение

ванное

 

выборки

тические

 

согласия

класса

вероятности

частоты

 

класса

 

 

 

 

S

значение

 

N

частоты

 

χ2

хi

 

x

 

 

 

 

z

f(z)

Ni

 

 

dx

Ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

3

4

5

6

 

7

8

9

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

0

28,10

 

7,10

-3,96

0,00

2

 

222

6

0,03

 

130,69

 

 

 

 

 

 

 

 

 

 

 

 

 

6

28,10

 

7,10

-3,11

0,00

0

 

222

6

0,59

 

0,59

 

 

 

 

 

 

 

 

 

 

 

 

 

12

28,10

 

7,10

-2,27

0,03

11

 

222

6

5,72

 

4,87

 

 

 

 

 

 

 

 

 

 

 

 

 

18

28,10

 

7,10

-1,42

0,15

18

 

222

6

27,21

 

3,12

 

 

 

 

 

 

 

 

 

 

 

 

 

24

28,10

 

7,10

-0,58

0,34

42

 

222

6

63,35

 

7,20

 

 

 

 

 

 

 

 

 

 

 

 

 

30

28,10

 

7,10

0,27

0,38

111

 

222

6

72,21

 

20,84

 

 

 

 

 

 

 

 

 

 

 

 

 

36

28,10

 

7,10

1,11

0,21

24

 

222

6

40,30

 

6,59

 

 

 

 

 

 

 

 

 

 

 

 

 

42

28,10

 

7,10

1,96

0,06

13

 

222

6

11,01

 

0,36

 

 

 

 

 

 

 

 

 

 

 

 

 

48

28,10

 

7,10

2,80

0,01

1

 

222

6

1,47

 

0,15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

= 174,40

 

 

 

 

 

 

 

 

 

 

 

факт

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

Заполнение таблицы:

1)Скопируйте первый столбец «Середина класса» у выше построенной таблицы частот.

2)Введите во все строки данного столбца среднее по диаметру из таблицы, представленной на листе «Основные статистики» (округлите до десятых).

3)Введите во все строки данного столбца стандартное отклонение по диаметру из таблицы, представленной на листе «Основные статистики» (округлите до десятых).

 

 

 

 

 

4) Вычислите по формуле z

(Xi X )

.

 

 

S

5)Выделите первую ячейку столбца f(z) → нажмите на панели инст-

рументов значок fx → выберите категорию Статистические → выберите функцию НормРасп ОК → в появившемся окне заполните поля следующим образом:

x - выделите все значения столбца «z»;

среднее: 0; стандартное отклонение: 1 интегральное: 0 → ОК.

6)Все числа из столбца «частота» таблицы частот скопируйте как ссылку или введите с клавиатуры (копировать столбцом нельзя).

7)Введите во все строки данного столбца значение «счѐт» из таблицы, представленной на листе «Основные статистики»к.

8)Введите значение величины класса dx во все строки данного столбца (оно было вычислено выше для заполнения таблицы частот).

9) Теоретические частоты вычислите по формуле

Ni'

N * Dx* f (z)

.

 

 

 

 

 

 

S

 

2

(Ni Ni' ) 2

 

 

 

10) Вычислите по формуле

 

 

,

затем

подсчитайте

Ni'

сумму этого столбца. Это будет фактическое значение критерия согла-

сия 2 (Хи-квадрат).

факт

 

2

 

2

2

Сравните

факт

с

теор . Теоретическое значение

теор . определи-

те по числу степеней свободы, приведенных в прил. 1. Сделайте соот-

ветствующий вывод. Если

2

2

факт >

теор , то гипотезу о соответствии

распределения диаметра по нормальному закону отвергаем. Другими словами, эмпирические и теоретические частоты различаются значимо.

20