Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
эмм2.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
18.56 Mб
Скачать

Описательная статистика.

Входной диапазон - диапазон, содержащий анализируемые данные, это может быть одна или несколько строк (столбцов);

Группирование - по столбцам или по строкам – необходимо указать дополнительно;

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона.

Новый рабочий лист – можно задать произвольное имя нового листа.

Если необходимо получить дополнительную информацию Итоговой статистики, Уровня надежности, k – го наибольшего и наименьшего значений, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК.

Рис.189. Результат применения инструмента

Описательная статистика Контрольное задание 1.

Парная регрессия и корреляция в эконометрических исследованиях.

Задача.

Приведены данные по регионам за 2008 год зависимости заработной платы от прожиточного минимума (в у.е.):

Таблица 95.

Номер региона

Прожиточный минимум.

х

Заработная плата.

у

1

78

133

2

82

148

3

87

134

4

79

154

5

89

162

6

106

195

7

67

139

8

88

158

9

73

152

10

87

162

11

76

159

12

115

173

  1. Построить линейное уравнение парной регрессии у от х.

  2. При помощи ППП exсel рассчитать линейный коэффициент парной корреляции и коэффициент детерминации.

  3. При помощи ППП exсel вычислить коэффициент регрессии, факторную и остаточную дисперсию, на основе распределения Фишера сделать вывод о статистической значимости полученных результатов.

  4. С помощью распределения Стьюдента определить доверительные интервалы вычисленных значений коэффициентов линейной регрессии.

Задание 2. Разработка и анализ эконометрической модели

В таблице 1 представлены статистические данные о расходах на питание различных групп населения в зависимости от уровня их суммарных доходов в месяц (числа относительные).

Требуется:

  1. Построить линейную однофакторную модель зависимости между доходами семьи и расходами на продукты питания при помощи Мастера функций.

  2. Оценить тесноту связи между доходами семьи и расходами на продукты питания при помощи Мастера функций.

  3. Рассчитать коэффициенты детерминации и эластичности пояснить их экономический смысл, оценить точность модели при помощи Мастера функций.

  4. Рассчитать показатели при помощи надстройки Анализ данных - Регрессия.

Таблица 96

Вариант 1

Доходы семьи (х)

2.4

3.2

3.4

3.6

4.5

5.1

5.6

5.8

6.4

7

Расходы на продукты питания (y)

1.2

1.3

1.4

1.45

1.7

1.8

2.1

2.2

3

3.1

Вариант 2

Доходы семьи (х)

2.2

2.4

2.8

3.4

3.6

4.1

4.6

4.8

5.4

6.5

Расходы на продукты питания (y)

1.4

1.5

1.55

1.6

1.7

1.8

2.1

2.2

3

3.4

Вариант 3

Доходы семьи (х)

1.5

1.8

1.9

2.4

2.8

3.1

3.9

4.1

4.8

5

Расходы на продукты питания (y)

0.8

0.9

1.2

1.5

1.8

1.9

2.2

2.5

2.8

3.4

Вариант 4

Доходы семьи (х)

2.0

3.2

3.4

3.6

4.5

5.1

5.6

5.8

6.4

7.5

Расходы на продукты питания (y)

1.1

1.3

1.4

1.45

1.7

1.8

2.1

2.2

3

3.4

Вариант 5

Доходы семьи (х)

1.6

1.8

2

2.4

2.8

3.1

3.5

4.1

4.8

5

Расходы на продукты питания (y)

0.8

0.9

1.2

1.5

1.8

1.9

2.1

2.5

2.8

3.7

Вариант 6

Доходы семьи (х)

2.4

3.2

3.4

3.6

4.5

5.1

5.6

5.8

6.4

7

Расходы на продукты питания (y)

1.15

1.3

1.4

1.45

1.7

1.77

2.1

2.2

3

3.8

Вариант 7

Доходы семьи (х)

1.4

1.8

2

2.4

2.8

3.1

3.5

4.1

4.8

5

Расходы на продукты питания (y)

0.8

0.9

1.2

1.5

1.6

1.9

2.1

2.5

2.8

3.2

Вариант 8

Доходы семьи (х)

1.9

3.2

3.4

3.6

4.5

5.1

5.6

5.8

6.4

6.7

Расходы на продукты питания (y)

1.2

1.3

1.4

1.45

1.7

1.8

2.1

2.2

3

3.4

Вариант 9

Доходы семьи (х)

2.8

3.2

3.4

3.6

4.5

5.1

5.6

5.8

6.4

7

Расходы на продукты питания (y)

1.7

1.6

1.8

1.95

2.1

2.3

2.6

2.8

3

3.5

Вариант 10

Доходы семьи (х)

2.4

3.2

3.4

3.6

4.5

5.1

5.6

5.8

6.4

6.8

Расходы на продукты питания (y)

0.8

1.2

1.25

1.3

1.45

1.4

1.5

2

2.2

2.4

Вариант 11

Доходы семьи (х)

2.3

3.2

3.4

3.6

4.5

5

5.6

5.8

6.4

7

Расходы на продукты питания (y)

1.2

1.3

1.4

1.45

1.7

1.75

2.1

2.2

3

3.4

Вариант 12

Доходы семьи (х)

2.1

3.2

3.4

3.6

4.2

5.1

5.6

5.8

6.4

6.6

Расходы на продукты питания (y)

1.05

1.3

1.4

1.45

1.7

1.8

2.1

2.2

3

3.4

Вариант 13

Доходы семьи (х)

1.6

1.7

2

2.4

2.8

3.1

3.5

4.1

4.8

5

Расходы на продукты питания (y)

0.56

0.66

1.2

1.5

1.8

1.9

2.1

2.5

2.8

3.3

Вариант 14

Доходы семьи (х)

2.15

3.15

3.4

3.9

4.5

5.1

5.6

5.8

6.4

6.8

Расходы на продукты питания (y)

1.2

1.3

1.4

1.45

1.7

1.8

2.1

2.2

3

3.1

Вариант 15

Доходы семьи (х)

1.6

1.8

2

2.4

2.8

3.1

3.5

4.1

4.8

5.2

Расходы на продукты питания (y)

0.5

0.9

1.25

1.5

1.8

1.9

2.1

2.5

2.8

3.8

Вариант 16

Доходы семьи (х)

2.1

3.2

3.4

3.6

4.5

5.1

5.6

5.8

6.4

7

Расходы на продукты питания (y)

1.2

1.3

1.4

1.45

1.7

1.8

2.1

2.2

3

3.1

Вариант 17

Доходы семьи (х)

1.5

1.8

2

2.4

2.8

3.1

3.5

4.1

5

6

Расходы на продукты питания (y)

0.62

0.9

1.2

1.6

1.8

1.9

2.1

2.5

2.8

3.7

Вариант 18

Доходы семьи (х)

2.3

3.2

3.3

3.6

4.5

5.1

5.6

5.8

6.4

6.6

Расходы на продукты питания (y)

1.2

1.25

1.4

1.5

1.7

1.8

2.1

2.2

3

3.4

Вариант 19

Доходы семьи (х)

2

3.25

3.4

3.6

4.5

5.1

5.6

5.8

6.4

6.5

Расходы на продукты питания (y)

1.12

1.35

1.4

1.45

1.7

1.8

2.1

2.22

3

3.3

Вариант 20

Доходы семьи (х)

0.87

1.64

2

2.4

2.8

3.1

3.5

4.1

4.8

5

Расходы на продукты питания (y)

0.75

0.9

1.2

1.5

1.8

1.9

2.1

2.5

2.8

3.4

Простейший примеры использования метода Монте-Карло

П редположим, что нам нужно определить площадь плоской фигуры, расположенной внутри единичного квадрата, т.е. квадрата, сторона которого равна единице (рис. 190). Выберем внутри квадрата наугад N точек. Обозначим через M количество точек, попавших при этом внутрь фигуры. Тогда площадь фигуры приближенно равна отношению . Отсюда, чем больше N, тем больше точность такой оценки.13

Рисунок 190. Площадь фигуры приближенно равна, отношению числа точек попавших в фигуру ко всему числу точек.

Вычисление числа Пи методом Монте-Карло

Попробуем построить метод Монте-Карло для решения задачи о вычислении числа Пи. Для этого рассмотрим четверть круга единичного радиуса (рис. 2). Площадь круга равна . (356)

очевидно, площадь четверти круга равна:

. (357)

Зная, что радиус круга равен 1, получим:

Y1

(358)

A

B

C

1

O

X

Рисунок 192. Нахождение числа Пи методом Монте-Карло.

Площадь же всего единичного квадрата OABC равна 1. Будем случайным образом выбирать точки внутри квадрата OABC. Координаты точек должны быть, и . Теперь подсчитаем количество точек таких, что , т.е. те точки, которые попадают внутрь круга.

Пусть всего было испытано N точек, и из них M попало в круг. Рассмотрим отношение количества точек, попавших в круг, к общему количеству точек (M/N). Очевидно, что чем больше случайных точек мы испытаем, тем это отношение будет ближе к отношению площадей четверти круга и квадрата. Таким образом, имеем, что, для достаточно больших N, верно равенство:

. (358)

Из полученного равенства:

. (359)

Итак, мы построили метод Монте-Карло для вычисления числа Пи. Опять перед нами стоит вопрос о том, какое именно количество точек N нужно испытать для того, чтобы получить Пи с предсказуемой точностью? Вопрос о точности вычислений с помощью методов Монте-Карло рассматривается в традиционных курсах теории вероятностей, и мы не будем останавливаться на нем подробно. Можно отметить лишь, что точность вычислений очень сильно зависит от качества используемого генератора псевдослучайных чисел. Другими словами, точность тем выше, чем более равномерно случайные точки распределяются по единичному квадрату.14

Постановка задачи для нахождения числа Пи методом Монте-Карло

Для проверки формулы, я решил написать программу в среде программирования Турбо Паскаль. В программе нужно ввести число K – количество испытаний и число N – количество испытываемых точек. Для координат точек (X, Y) используется генератор случайных чисел. Результаты всех испытаний усредняются.

Исходник программы для нахождения числа Пи методом Монте-Карло

VAR

K, {количество испытаний}

N, {количество точек}

i, j: word; {для циклов}

s, {сумма всех Пи}

P: real; {среднеарифметическое значение Пи}

{функция возвращает число Пи}

FUNCTION raschet: real;

VAR

x, y: word; {координаты точек}

M: word; {число точек попавших в окружность}

BEGIN

M:=0;

for i:=1 to N do

begin

x:=random(2); {x, y – случайные числа}

y:=random(2);

if sqr(x)+sqr(y)<=1 then inc(M); {точка с координатами x, y попала в круг}

end;

raschet:=4*M/N; {из формулы [1]}

END;

BEGIN

write('Введите количество испытаний: ');

readln(K);

write('Введите количество испытываемых точек: ');

readln(N);

randomize;

s:=0;

for j:=1 to K do s:=s+raschet;

P:=s/K;

writeln('Число Пи, рассчитанное методом Монте-Карло равно:');

writeln(P:1:6);

writeln;

writeln('Точное число Пи равно:');

writeln(Pi:1:6);

END.

Итак, с помощью этой программы я проверил верность формулы [1]. Я получил число Пи равное: 3.000808, при количестве испытаний 500 раз с количеством точек 5000. Точное число Пи равно: 3.141593.

Как и говорилось выше более точный ответ можно получить при очень большом количестве проведенных опытов, при испытании большего количества точек и при использовании качественного генератора псевдослучайных чисел.15

Решение задачи аналитически и методом Монте-Карло

Рассмотрим задачу:

Система контроля качества продукции состоит из трех приборов. Вероятность безотказной работы каждого из них в течение времени Т равна 5/6. Приборы выходят из строя независимо друг от друга. При отказе хотя бы одного прибора вся система перестает работать. Найти вероятность того, что система откажет за время Т.

Аналитическое решение.

Событие А – выход из строя хотя бы одного из трех приборов за время Т и событие – ни один из трех приборов не выйдет из строя за время Т, противоположные. Вероятность – искомая вероятность. Отсюда:

(359)

Теперь решим задачу методом Монте-Карло.

Напомним, что при использовании данного метода возможны два подхода: либо непосредственно проводят эксперименты, либо имитируют их другими экспериментами, имеющими с исходными одинаковую вероятностную структуру. В условиях данной задачи «натуральный» эксперимент – наблюдение за работой системы в течение времени Т. Многократное повторение этого эксперимента может оказаться трудноосуществимым или просто невозможным. Заменим этот эксперимент другим.

Для определения того, выйдет или не выйдет из строя за время Т отдельный прибор, будем подбрасывать игральную кость. Если выпадет одно очко, то будем считать, что прибор вышел из строя; если два, три, четыре, пять, шесть очков, то будем считать, что прибор работал безотказно. Вероятность того, что выпадет одно очко, так же как и вероятность выхода прибора из строя, равна 1/6, а вероятность того, что выпадет любое другое число очков, как и вероятность безотказной работы прибора, равна 5/6.

Чтобы определить, откажет или нет вся система за время Т, будем подбрасывать три игральные кости. Если хотя бы на одной из трех костей выпадет одно очко, то это будет означать, что система отказала.

Повторим испытание, состоящее в подбрасывании трех игральных костей, много раз подряд и найдем отношение числа M – отказов системы к общему числу N – проведенных испытаний. Вероятность отказа будет равна:16

. (360)

Постановка задачи

Для проверки формулы, которая основана на методе Монте-Карло, я решил написать программу в среде программирования Турбо Паскаль. Дело в том, что если бы вероятность безотказной работы приборов была не , а например , имитировать другими экспериментами, имеющими с исходными одинаковую вероятностную структуру, без использования ЭВМ было бы затруднительно.

Данная программа рассчитана на любые подобные задачи. В конце расчетов программа выдает два ответа. Первый – полученный методом Монте-Карло. Второй – полученный аналитическим методом по формуле.

В программе нужно ввести: B – количество приборов; вероятность в виде дроби; N – количество проведенных опытов.

Исходник программы

VAR

B, {количество приборов}

S, D: byte; {вероятность P(A)=S/D}

N, {количество опытов}

i, j, {для циклов}

summa: word; {суммарное число отказов}

P_M, P_A: real; {полученная вероятность}

{функция возвращает количество отказов за одно испытание}

FUNCTION otkaz: word;

VAR

o:word;

R:byte;

BEGIN

o:=0;

for i:=1 to B do

begin

R:=random(D+1)+1; {случайное число >=1 и <=D}

if R<=D-S then inc(o); {выпал "отказ"}

end;

otkaz:=o;

END;

BEGIN

write('Введите количество приборов: ');

readln(B);

writeln('Введите вероятность безотказной работы (в виде дроби):');

write(' числитель – ');

readln(S);

write(' знаменатель – ');

readln(D); {т.е. P=S/D}

write('Введите количество опытов: ');

readln(N);

{расчет методом Монте-Карло}

summa:=0;

for j:=1 to N do summa:=summa+otkaz;

P_M:=summa/N;

{расчет аналитическим методом}

P_A:=S/D;

for i:=1 to B-1 do P_A:=P_A*S/D; {возведение в степень}

P_A:=1-P_A;

writeln;

writeln('* * * Ответ * * *');

writeln('Методом Монте-Карло: ', P_M:1:6);

writeln('Аналитическим методом: ', P_A:1:6);

writeln;

writeln('(С)

END.

Итак, проверив формулу с помощью своей программы со значениями: количество приборов – 3; вероятность безотказной работы ; количество опытов – 50000, я получил два ответа. Решение задачи методом Монте-Карло – 0.429420. Решение задачи аналитическим методом – 0.421296. Отсюда вывод – вероятность, полученная разными методами сходна.17

Генерация случайных чисел

В строго детерминированном мире процессорных кодов внесение в программу элемента случайности – не такая простая задача, как может показаться на первый взгляд. В этом я убедился, получив значение числа Пи из своей программы. Наиболее часто встречающиеся приложения, в которых необходимо использование случайных чисел – это численное моделирование методом Монте-Карло и создание компьютерных игр.

Получение случайных чисел – важная стадия компьютерного эксперимента, которой не всегда уделяется должное внимание. Используемые на практике численные алгоритмы приводят к получению псевдослучайных чисел, особенностями которых являются ограниченность и воспроизводимость последовательности.

Итак, дадим определение этих чисел. Обозначим через R непрерывную случайную величину, распределенную равномерно в интервале (0, 1).

Случайными числами называют возможные значения rj непрерывной случайной величины R, распределенной равномерно в интервале (0, 1).

В действительности пользуются не равномерно распределенной случайной величиной R, возможные значения которой имеют бесконечное число десятичных знаков, а квазиравномерной случайной величиной R’, возможные значения которой имеют конечное число знаков. В результате замены R на R разыгрываемая величина имеет не точно, а приближенно заданное распределение.

Случайная величина R’ обладает свойством: вероятность попадания ее в любой интервал, принадлежащий интервалу (0; 1) равна длине этого интервала.

Получение случайных чисел – важная стадия компьютерного эксперимента, которой не всегда уделяется должное внимание. Используемые на практике численные алгоритмы приводят к получению псевдослучайных чисел, особенностями которых являются ограниченность и воспроизводимость последовательности.

Исчерпание этой последовательности при большом числе циклов Монте-Карло или размере системы снижает ее фактический размер до:

где (361)

N – размер системы (количество частиц);

P период последовательности псевдослучайных чисел;

k – количество случайных чисел, используемых для определения состояния одной частицы;

n – суммарное количество циклов Монте-Карло, необходимое для стабилизации (термализации) системы и расчета ее характеристик.

Например, при моделировании системы Изинга, состоящей из 2000 частиц требуется, как правило, не менее 500 циклов МК, т.е. необходимо не менее 105 случайных чисел. Если используемый генератор является 16-ти разрядным и не может произвести последовательность, состоящую из более чем 216 (65536) псевдослучайных чисел, то фактический размер системы будет порядка 1000 частиц.

С играми ситуация еще более трагическая: например, колода из 52 карт может быть упорядочена 52! способами. Это примерно 8e67 или 2226. Значит для того, чтобы в процессе игры мог возникнуть любой расклад, создателю полноценной карточной игры типа «21» необходим 256 разрядный генератор случайных чисел. Если колода состоит из 36 карт, то соответствующие числа равны 4e41 и 2138, т.е. без суперкомпьютера опять не обойдешься. В карточной игре «преферанс» количество вариантов раздач равно 32!/10! или 296, что тоже не мало. Несмотря на несравнимость этих чисел с реальными возможностями 32-х разрядного процессора, необходимо, конечно, использовать его возможности максимально, ведь только так можно приблизиться к разнообразию реальности.

Тестовая база

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]