Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Анализ СД на ПК

.pdf
Скачиваний:
28
Добавлен:
22.02.2016
Размер:
1.18 Mб
Скачать

20,00

15,00

10,00

5,00

0,00

-5,00

0,0

1,0

2,0

3,0

4,0

5,0

6,0

Рисунок 6 – Диаграмма рассеяния случайных величин X и Y

Характер расположения точек на диаграмме рассеяния позволяет сделать предположение о логарифмической регрессионной зависимости вида

 

(x) = β0 + β1 ln x .

(19)

y

Оценки параметров β0 и β1 найдём методом наименьших квадратов. Для этого составим функцию S (см. (3)), которая в случае логарифмической регрессии примет вид

n

n

n

 

S(β0 ,β1) = (yi

 

(xi ))2

= ei2

= [yi (β0 + β1 ln xi )]2 .

(20)

y

i=1

i=1

i=1

 

Для отыскания оценок параметров β0 и β1, минимизирующих функцию S(β0 , β1), составим и решим систему нормальных уравнений:

 

S(β0,β1)

 

 

 

n

 

n

= 0;

2[yi

(β0 + β1 ln xi )] = 0;

[yi (β0 + β1 ln xi )] = 0;

 

∂β0

 

 

 

 

 

i=1

 

i=1

 

S(β β )

 

 

 

n

 

n

 

0,

1`

= 0,

2[yi

(β0 + β1 ln xi )]ln xi

= 0, [yi (β0 + β1 ln xi )]ln xi = 0,

 

∂β

 

 

1

 

 

 

i=1

 

i=1

 

 

 

 

 

 

 

 

 

 

n

n

 

 

 

 

 

 

yi −β0n −β1ln xi = 0;

 

 

 

 

 

i=1

i=1

(21)

 

 

 

 

 

n

n

 

 

 

 

 

 

n

 

 

 

 

 

yi ln xi −β0 ln xi −β1ln2 xi = 0.

 

 

 

 

 

 

 

i=1

i=1

 

 

 

 

 

i=1

Результаты вычислений сведём в таблицу 5.

60

Таблица 5 – Результаты промежуточных вычислений

N

xi

yi

lnxi

ln2xi

yi lnxi

 

y

(xi) = β0 +β1 ln xi

1

1,0

7,34

0,0000

0,0000

0,000

 

6,383

2

1,5

11,46

0,4055

0,1644

4,648

 

9,148

3

4,0

15,35

1,3863

1,9218

21,286

 

15,835

4

2,5

16,02

0,9163

0,8396

14,678

 

12,631

5

1,0

3,50

0,0000

0,0000

0,000

 

6,383

6

0,5

4,95

–0,6931

0,4805

–3,433

 

1,657

7

3,0

13,43

1,0986

1,2069

14,749

 

13,874

8

2,0

7,31

0,6931

0,4805

5,065

 

11,109

9

0,5

–0,87

–0,6931

0,4805

0,600

 

1,657

10

5,0

17,54

1,6094

2,5903

28,224

 

17,357

 

 

 

 

 

 

 

 

 

Σ

 

96,04

4,7230

8,1644

85,815

 

 

 

 

 

После подстановки значений система уравнений (21) примет вид:

 

 

96,04 − β0

10 − β1

4,723 = 0;

 

10β0 + 4,723β1 = 96,04;

 

 

 

− β

0 4,723−β1 8,1644 = 0,

 

+ 8,1644β1 = 85,815.

 

 

85,815

 

4,723β0

 

 

Выразив β0 из первого уравнения и подставив во второе, получим:

β

0

= 96,04 4,723β1 = 9,604 0,4723β ;

 

 

48,8688

 

 

 

10

 

 

1

откуда

β1 =

 

= 6,8183 ;

 

 

 

 

 

 

5,9337

4,723(9,604 0,4723β ) + 8,1644β = 85,815,

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

β0 = 9,604 0,4723 6,8183 = 6,3833 .

 

 

 

 

Таким образом, оценки параметров уравнения регрессии

ˆ

 

 

β0 = 6,3833 ;

ˆ1 6,8183 .

β =

На рисунке 7 представлена диаграмма рассеяния значений случайных величин X и Y с нанесённой линией регрессии.

20,00

 

 

 

 

 

 

15,00

 

 

 

 

 

 

10,00

 

 

 

 

 

 

5,00

 

 

 

 

 

 

0,00

 

 

 

 

 

 

-5,00

 

 

 

 

 

 

0,0

1,0

2,0

3,0

4,0

5,0

6,0

Рисунок 7 – Диаграмма рассеяния случайных

величин X и Y с нанесённой линией регрессии

61

Оценим качество описания зависимости между величиной инвестиций Х и прибыли Y полученным уравнением регрессии с помощью коэффициента детерминации (10),

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

(xi )

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ2

 

y

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

i=1

,

 

 

 

 

 

 

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(yi

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

где

 

 

(xi ) = β0 + β1 ln xi

– значение величины

прибыли, предсказываемое

y

 

 

 

 

 

 

 

 

 

уравнением регрессии, соответствующее значе-

 

 

 

 

 

 

 

 

 

нию xi инвестиции (см. таблицу 5);

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

yi

– среднее значение величины прибыли;

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ 2

=

 

(6,3839,604)2 + (9,148 9,604)2 +L+ (17,357 9,604)

2

=

275,8568

=

R

 

 

 

 

 

(7,34 9,604)2 + (11,46 9,604)2 +L+ (17,54 9,604)2

 

334,081

 

 

 

 

 

 

 

 

 

 

 

= 0,8257.

 

 

 

 

 

 

 

 

Расчётное значение коэффициента детерминации Rˆ 2 = 0,8257 указывает на удовлетворительность описания зависимости между величиной инвестиций Х и прибыли Y, выбранным уравнением регрессии. Проверим, однако, значимость оценки коэффициента детерминации с помощью статистики Фишера

ˆ

 

10 2

 

F = 0,8257

 

= 37,9 .

 

(2 1)(10,8257)

 

Критическое значение

статистики

Фишера для

степеней свободы

ν1 = 2 – 1= 1 и ν2 = 10 – 2 = 8

и уровня

значимости

α = 0,05 составляет

F0,05;1;8 = 5,317 . Поскольку расчётное значение статистики Фишера больше

критического ( Fˆ = 37,9 > 5,317 = F0,05;1;8 ), то вычисленный коэффициент детерминации значимо отличается от нуля, и выбранное уравнение регрессионной зависимости между величинами инвестиций и прибыли может быть использовано в экономических исследованиях (в частности, для предсказания величины прибыли).

62

ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ

1 Изучить теоретические сведения.

2 Получить у преподавателя выборки значений двух исследуемых случайных величин.

3 Создать в ППП STATGRAPHICS файл с выборками исследуемых случайных величин (см. приложение А, п. 2).

4 По заданной двумерной выборке построить диаграмму рассеяния с помощью ППП STATGRAPHICS (приложение А, п. 10).

5 По виду корреляционного поля сделать предположение о форме регрессионной зависимости между исследуемыми случайными величинами.

6 Найти параметры предполагаемого уравнения регрессии вручную методом наименьших квадратов.

7 Оценить качество описания зависимости между исследуемыми случайными величинами и выбранным уравнением регрессии с помощью коэффициента корреляции (в случае линейной зависимости), или с помощью коэффициента детерминации (в случае нелинейной зависимости).

8 Выполнить регрессионный и корреляционный анализ в ППП

STATGRAPHICS с помощью процедуры «Multiple Regression» (см. приложение А, п. 8). Сделать распечатку результатов анализа и уравнения регрессии (приложение А, п. 5).

9 Сравнить результаты ручного расчета и компьютерного анализа.

10 Проверить значимость полученного значения коэффициента корреляции (или детерминации) для ручного и компьютерного расчета.

11 Сформулировать общие выводы о зависимости между исследуемыми случайными величинами.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1 Какая зависимость называется функциональной? Какая зависимость называется статистической? Привести примеры.

2 Какие случайные величины называются независимыми? Привести примеры.

3 Для чего необходим анализ зависимостей между случайными величинами?

4 Что изучает регрессионный и корреляционный анализ?

5 Какая зависимость называется регрессионной?

6 Для чего применяется метод наименьших квадратов?

7 Сформулируйте идею аппроксимации опытных точек на диаграмме рассеяния методом наименьших квадратов.

8 Что характеризует коэффициент корреляции? На что указывают его возможные значения?

9 Что характеризует коэффициент детерминации? На что указывают его возможные значения?

10 Укажите назначение проверки значимости оценки коэффициента корреляции (детерминации).

63

ПРИЛОЖЕНИЕ А (справочное)

Работа с пакетом STATGRAPHICS Plus for Windows

1 Запуск пакета STATGRAPHICS Plus

1.1Нажать кнопку «Start» («Пуск»).

1.2В разделе «Программы» выбрать «STATGRAPHICS Plus».

1.3. В разделе «STATGRAPHICS Plus» выбрать «Sgwin». Откроется рабочее окно пакета STATGRAPHICS (рисунок А.1).

Главное меню Основная панель элементов

Окно исходных данных

Окно статистического отчета

Рисунок А.1 – Рабочее окно пакета STATGRAPHICS

2 Создание файла выборок значений исследуемых величин

2.1Для ввода значений элементов выборок развернуть окно исходных данных «untitled» (см. рисунок А.1).

2.2В столбцах открывшегося окна (рисунок А.2) ввести значения элементов одной или нескольких выборок.

2.3Для изменения имени и формата значений элементов выборки, принятых по умолчанию, выделить столбец-выборку нажатием левой клавиши мыши на заголовке колонки. Затем нажать правую клавишу мыши и в появившемся всплывающем меню выбрать пункт «Modify Column». В появившемся окне «Modify Column» (см. рисунок А.2) задать новые желаемые значения.

64

Новое имя выборки

Тип

элементов

выборки

Рисунок А.2 – Ввод исходных данных

2.4 Для записи файла данных на диск, в главном меню выбрать пункт «File»«Save As…»«Save Data File As…». В стандартном диалоговом окне Windows указать каталог и имя создаваемого файла данных. Созданный файл данных получит расширение «sf3» или «sf».

2.5 Пакет STATGRAPHICS позволяет наряду с файлом данных сохранять настройки и результаты анализа данных в файле проекта исследования. Для этого необходимо выбрать в главном меню пункт «File»«Save As…»«Save StatFolio As…». В стандартном диалоговом окне Windows указать каталог и имя создаваемого файла проекта. Созданный файл будет иметь расширение «sfp».

3 Использование существующего файла данных

3.1Для открытия и использования существующего файла данных в главном меню выбрать раздел «File»«Open»«Open Data File…».

3.2В стандартном диалоговом окне Windows указать каталог и имя существующего файла данных. При этом данные автоматически будут помещены в окно исходных данных (см. рисунок А.1).

3.3Если наряду с исходными данными был сохранен файл проекта статистического исследования (файл «sfp»), то вместо пункта

«File»«Open»«Open Data File…» следует выбрать пункт «File»

65

«Open»«Open StatFolio…». Файл исходных данных будет открыт при этом автоматически.

4 Вычисление оценок числовых характеристик и построение гистограммы (столбцовой диаграммы) исследуемой случайной величины

4.1Создать новый или открыть существующий файл исходных данных (элементов выборки исследуемой величины).

4.2В главном меню выбрать раздел «Describe»«Numeric Data»«OneVariable Analysis» (одномерный анализ).

4.3В появившемся окне «One-Variable Analysis» (рисунок А.3) выбрать (из списка) для исследования одну из доступных выборок, указав ее имя в поле «Data». Нажать кнопку «OK».

Список

Имя исследуемой

выборки

доступных

 

выборок

 

Рисунок А.3 – Окно указания исследуемой выборки (выбора переменной)

4.4В появившемся окне результатов одномерного анализа (рисунок А.4) нажать кнопку выбора таблиц. В появившемся окне «Tabular Options» выбрать пункт «Summary Statistics» (основные статистики), выделение других пунктов отменить. Нажать кнопку «OK».

4.5В окне результатов одномерного анализа (см. рисунок А.4) нажать кнопку выбора графиков. В появившемся окне «Graphical Options» выбрать пункт «Frequency Histogram» (частотная гистограмма/столбцовая диаграмма), выделение других пунктов отменить. Нажать кнопку «OK». Окно результатов одномерного анализа примет вид, соответствующий рисунку А.5.

4.6Для определения оценок числовых характеристик следует на панели «Summary Statistics» нажать правую кнопку мыши и во всплывающем меню выбрать пункт «Pane Options».

4.7В появившемся окне (рисунок А.6) следует указать интересующие исследователя числовые характеристики. Для оценки всех основных числовых характеристик нажать кнопку «All». Выбор завершить нажатием кнопки «OK», после чего на панели «Summary Statistics» окна результатов одномерного анализа (см. рисунок А.5) «One-Variable Analysis» появятся значения

66

оценок указанных числовых характеристик. Перевод англоязычных статистических терминов представлен в таблице А.1.

Выбор Выбор графиков таблиц

Выбор

переменной

Панель

«Summary

Statistics»

Рисунок А.4 – Одномерный анализ данных

Панель

«Histogram»

Панель

«Summary

Statistics»

Рисунок А.5 – Окно результатов одномерного анализа

67

Рисунок А.6 – Окно выбора оцениваемых числовых характеристик

Таблица А.1 – Перевод англоязычных терминов одномерного статистического анализа

Count

Объем выборки

Average

Математическое ожидание

Median

Медиана

Mode

Мода

Geometric mean

Геометрическое среднее

Variance

Дисперсия

Std. Deviation

Среднеквадратическое (стандартное) отклонение

 

 

Std. Error

Стандартная ошибка

Minimum

Минимальное значение выборки

Maximum

Максимальное значение выборки

Range

Размах выборки

Lower quartile

Нижний квартиль

Upper quartile

Верхний квартиль

Interquar. range

Межквартильный размах выборки

Skewness

Коэффициент асимметрии

Std. skewness

Стандартизованный коэффициент асимметрии

Kurtosis

Коэффициент эксцесса

Std. kurtosis

Стандартизованный коэффициент эксцесса

Coeff. of Variation

Коэффициент вариации

Sum

Сумма элементов выборки

4.8 Для изменения параметров частотной гистограммы (столбцовой диаграммы) на панели «Histogram» окна «One-Variable Analysis» следует нажать правую кнопку мыши и во всплывающем меню выбрать пункт «Pane Options». В появившемся окне параметров гистограммы «Frequency Plot Options» (рисунок А.7) следует указать необходимое количество интервалов/столбцов (в поле «Number of Classes»), левую границу первого интервала (в поле «Lower Limit») и правую границу последнего интервала (в поле

68

«Upper Limit»). Выбор завершить нажатием кнопки «OK», после чего на панели «Histogram» окна результатов одномерного анализа (см. рисунок А.5) появится обновленная гистограмма (столбцовая диаграмма).

Рисунок А.7 – Окно выбора параметров гистограммы (столбцовой диаграммы)

5 Печать результатов статистического анализа

5.1Для установки принтера следует выбрать в главном меню STATGRAPHICS пункт «File»«Print Setup…» и подключить желаемый принтер.

5.2Для распечатки результатов анализа необходимо нажать правую кнопку мыши на соответствующей панели или окне статистического анализа

иво всплывающем меню выбрать пункт «Print».

5.3В появившемся диалоговом окне следует убедиться в успешном подключении нужного принтера и нажать кнопку «OK».

6 Определение доверительного интервала для математического ожидания и среднеквадратического отклонения случайной величины

6.1Для определения доверительного интервала (интервальной оценки) для математического ожидания и среднеквадратического отклонения исследуемой случайной величины необходимо выполнить действия из подп. 4.1–

4.3приложения А.

6.2В появившемся окне результатов одномерного анализа «OneVariable Analysis» (см. рисунок А.4) нажать кнопку выбора таблиц. В появившемся окне «Tabular Options» выбрать пункт «Confidence Intervals» (доверительные интервалы), выделение других пунктов отменить. Нажать кнопку «OK».

6.3В окне результатов одномерного анализа «One-Variable Analysis» (см. рисунок А.4) нажать кнопку выбора графиков. В появившемся окне «Graphical Options» отменить все выделения. Нажать кнопку «OK». Окно

69