Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Binder1

.pdf
Скачиваний:
30
Добавлен:
30.03.2015
Размер:
2.59 Mб
Скачать

Имеются повторная выборка из n парных наблюдений: X1, , X n и Y1, ,Yn из непрерывных ГС. Сформируем вспомогательные случайные величины: Zi Xi Yi , i 1, n.

Тогда, если положить p P Zi 0 , то проверка однородности этих двух выборок будет равносильна проверке параметрической гипотезы.

H0 : p 0,5H1 : p 0,5.

8. Проверка гипотезы о виде распределения

Постановка задачи. Имеются независимая повторная выборка: X1, , X n из ГС X FX x . Необходимо проверить гипотезу

H0 : FX x F x, ,

где F x, - известная функция распределения, параметр 1, , r либо известен, либо неизвестен.

8.1.Проверка гипотезы о виде распределения

спомощью критерия хи-квадрат

Наиболее универсальным критерием, используемым для проверки статистической гипотезы о виде распределения, является критерий 2 Пирсона. Этот критерий может использоваться вне зависимости от того, какой является случайная величина X : одномерной или многомерной, непрерывного или дискретного типа.

Статистика критерия:

 

k

(n npo )2

 

2

 

i

 

i

.

(16)

 

npo

 

 

i 1

 

i

 

 

 

В своем первоначальном виде критерий 2 был предназначен для проверки гипотезы о значении параметра полиномиального распределения. Пусть проводится n независимых испытаний с k исходами A1, , Ak , образующими полную группу событий; ni число

появлений события Ai

в n испытаниях; P Ai pi , i

1, k

. Сформулируем гипотезу.

H

 

:

p po , i

 

.

 

 

 

0

1, k

 

 

 

 

 

i

i

 

n в условиях справедливости H0 имеет место сходимость по

Теорема

1. При

 

распределению:

2

d

2

 

 

 

Y k 1.

Примечание. H0 принимается, если значение статистики критерия достаточно мало:

2

x

 

2

.

(17)

выч

 

1

k 1

 

Позже путем небольшой

модификации критерий 2

удалось приспособить к проверке

гипотезы о виде распределения.

Случай 1

(параметр 1, , r известен, гипотетическое распределение известно

полностью).

 

 

 

 

 

 

 

 

 

 

 

 

 

Rm разбиваем на

 

 

 

Пусть X -

m мерная случайная величина. Пространство

 

k областей:

E1 , ,E k .

В

 

одномерном

случае

областями

 

являются

интервалы

вида:

E1 , z1 ,E 2 z1 , z2 , ,E k -1 zk 2 , zk 1 ,E k zk 1, .

 

 

 

 

 

 

Известно два способа разбиения пространства на области.

 

 

 

 

 

 

 

 

 

1) Вероятности

попадания

случайной

величины

X

 

в области

разбиения

равны:

P X E i | H0

1

, i

 

. В

одномерном случае это

означает, что

границы

интервалов

1, k

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

удовлетворяют соотношениям:

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

F z ,

F z

2

, F

z , F (z

k

, ) F (z

k

1

, ) 1 F (z

k

, )

,

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т.е. zi xi / k [F ], i 1, k 1.

2) Области строим таким образом, чтобы в каждую из них попало примерно одинаковое количество результатов наблюдений. При этом k выбирается таким образом, чтобы в каждую из областей попало хотя бы 5 результатов наблюдений. Если в какую-либо из областей попало мало наблюдений, то ее присоединяют к соседней.

Далее вычисляются вероятности pi0 P X E i | H0 . При использовании 1-го способа разбиения pi0 1k . При использовании 2-го способа разбиения в одномерном случае

вычисления производятся по формулам:

p1o F z1, ; pio F zi , F zi 1, , i 2, k 1; pko 1 F zk 1, .

Затем подсчитываются частоты ni , i 1, k попадания исходных данных в области разбиения

E i , i 1, k. Все найденные значения подставляются в формулу (16), решение принимается с помощью неравенства (17).

Случай 2 (параметр 1, , r неизвестен, гипотетическое распределение известно с

точностью до параметра).

Последовательность действий, описанная в случае 1, не осуществима до тех пор, пока не

получена оценка неизвестного параметра . Напротив, после того, как найдена оценка

параметра , последующие действия, связанные с вычислением значения статистики 2

реализуются по схеме, описанной в случае 1. При этом полагают .

Как построить оценку параметра, и каким образом распределение статистики 2 зависит от метода оценивания параметра?

 

 

состоятельная оценка

со скоростью сходимости

выше, чем

Если используется

O n 0,5 , то заменив

 

 

далее можно

действовать также, как и в

случае 1.

на

Распределение статистики 2 в этом случае то же, что и в теореме 1.

Если скорость сходимости состоятельной оценки O n 0,5 , то предельное поведение

статистики зависит от того, по каким данным производилось оценивание: интервальным или первичным (индивидуальным).

Теорема 2. Если - либо оценка по критерию минимума хи-квадрат

 

k

ni npio 2

 

2

 

 

 

min,

o

 

 

i 1

npi

 

 

 

 

 

либо ОМП, полученная как точка максимума функции правдоподобия, построенной по интервальным данным

 

 

 

 

 

n!

k

 

 

 

 

 

 

L( , X )

 

[ pio ( )]ni ,

 

 

 

 

 

 

n1

! nk !

 

 

 

 

 

d

 

i 1

 

 

 

то

2

2

 

 

 

 

 

 

 

k r 1.

 

 

 

 

 

Примечание. В условиях теоремы 2 нулевая гипотеза принимается, если 2

x

[ 2

] .

 

 

 

 

 

 

выч

1

k r 1

 

ЗАМЕЧАНИЕ. В действительности, при проверке гипотезы чаще используются состоятельные оценки по первичным данным. Оказывается, что в этом случае теорема 2 не верна. Однако, если нулевая гипотеза принимается, следуя примечанию к теореме 2, то оказывается, что уровень значимости, с которым это происходит в действительности больше, чем заданный .

Проверка гипотезы о нормальном законе распределения с помощью критерия хи-квадрат

Постановка задачи. Имеются результаты независимых наблюдений x1, , xn некоторого

показателя X. Требуется выяснить с уровнем значимости , можно ли эти данные описать с помощью нормального распределения. Формальная решаемая задача записывается следующим образом.

H

 

:

F

x

x a

,

a, неизвестные параметры нормального распределения.

0

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

Считая, что объем выборки достаточно велик, воспользуемся критерием хи-квадрат Пирсона. В этом случае разбиение на интервалы обычно получают с помощью интервалов, соответствующих построенной гистограмме. Левая граница 1-го интервала гистограммы заменяется на , а правая граница последнего интервала гистограммы заменяется на . Интервалы, содержащие небольшое количество элементов исследуемой выборки (меньше

пяти), целесообразно объединить с соседними. Тогда k – итоговое количество интервалов. Вероятности pi0 вычисляются

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p0

 

пр.граница интервала X

 

 

 

 

лев.граница интервала X

.

(18)

 

 

 

 

 

 

 

 

 

i

 

 

 

SX

 

 

 

 

SX

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В формуле (18)

 

 

и SX - оценки (ОМП, ОММ) неизвестных параметров a, по исходной

X

выборке.

Гипотеза о нормальном распределении принимается, если выполняется неравенство:

2

x

 

2

k 3 .

выч

1

 

 

Числовой пример 1. Имеются сведения о производительности труда (в штуках) 10 работников: 8, 4, 9, 10, 10, 6, 6, 8, 5, Проверить гипотезу о нормальном законе распределения производительности труда с уровнем значимости 0,05.

Решение. Объем выборки n = 10. Строим вариационный ряд, располагая исходные данные в порядке возрастания: 4, 4, 5, 6, 6, 8, 8, 9, 10, 10.

Найдем значения выборочных характеристик:

X 101 8 4 9 10 10 6 6 8 5 4 1070 7,

SX2 101 8 7 2 8 7 2 8 7 2 8 7 2 8 7 2 8 7 2 8 7 2

8 7 2 8 7 2 8 7 2 4,8

SX 4,8 2,19

Разбиение на интервалы получим, используя описание гистограмму.

Номер интервала

Интервал

Частота попадания в интервал

1

[4; 5,5)

3

2

[5,5; 7)

2

3

[7; 8,5)

2

4

[8,5; 10]

3

Результаты вспомогательных вычислений, связанных с проверкой гипотезы о виде распределения, приведены в следующей таблице.

Номер интервала

Интервал

i

p0

np0

 

 

 

i

i

1

(- ; 5,5)

3

0,2483

2,483

2

[5,5; 7)

2

0,2517

2,517

3

[7; 8,5)

2

0,2517

2,517

4

[8,5; )

3

0,2483

2,483

Первые три столбца этой таблицы получены на основе таблицы, которая была получена в процессе решения задачи построения гистограммы:

Для нахождения оценок вероятностей p0 использовались характеристики выборки X

7 и

SX

2,19 .

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

Пользуясь формулой (18) , последовательно найдем:

p0

 

5, 5 7

 

0, 68 0 1 0, 7517 0, 2483

 

 

 

 

1

 

2,19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p0

 

 

7 7

 

5, 5 7

 

0 0, 68 0, 2517

 

 

 

 

2

 

 

 

 

 

 

2,19

 

 

 

 

 

2,19

 

 

 

 

 

p0

 

8, 5 7

 

 

7 7

 

0, 68 0 0, 2517

 

 

 

 

 

 

 

 

3

 

2,19

 

 

 

 

 

 

 

 

 

 

2,19

 

 

 

p0

 

7

 

8,5 7

 

0, 68 1 0, 7517 0, 2483

 

 

 

 

 

 

4

 

2,19

 

2,19

 

 

 

 

 

 

 

 

 

Вычисляем значение статистики критерия хи-квадрат по формуле (4.16):

выч2

 

3 2, 483 2

 

2 2,517

2

 

2 2,517

2

 

3 2, 483 2

2, 483

2,517

 

2,517

 

0, 43

 

 

 

 

 

 

 

2, 483

При 0, 05

и числе степеней свободы k r 1 4 2 1 1 ( в данном случае r = 2 –

число неизвестных параметров гипотетического нормального распределения, которые были

заменены их

статистическими оценками) определяем критическое значение статистики

критерия хи-квадрат: x

 

2

 

x

 

2

1

3,841 . Поскольку

2

< x

 

2

 

, то

1

 

 

1 0,05

 

 

 

 

выч

1

 

 

 

принимаем нулевую гипотезу, т.е. можно считать, что имеющиеся данные могли быть получены в результате наблюдений случайной величины, имеющей нормальное распределение.

Числовой пример 2. Имеются сведения о числе аварий в течение 20 суток:

1, 3, 6, 1, 3, 3, 6, 3, 4, 4, 4, 3, 4, 1, 7, 2, 6, 2, 4, 2.

Проверить гипотезу о распределении Пуассона с уровнем значимости 0,05. Решение. В данном случае проверяется гипотеза

H0 : P X m

m

e ,

неизвестно.

 

 

 

m!

 

 

 

 

Строим вариационный ряд: 1, 1, 1,

2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 6, 6, 6, 7. Объем выборки n

= 10, xmin 1, xmax 7. Построим промежуточную таблицу с шагом 1,5:

 

 

 

 

 

 

Номер интервала

Интервал

Частота попадания в интервал

 

 

1

 

 

[1; 2,5)

6

 

 

2

 

 

[2,5; 4)

5

 

 

3

 

 

[4; 5,5)

5

 

 

4

 

 

[5,5; 7]

4

 

Заменяя граничные значения 1 и 7 на 0

(отрицательные значения не наблюдаемы) и ,

составим следующую таблицу

 

 

 

 

 

Номер интервала

Интервал

Частота попадания в интервал

 

 

1

 

 

[0; 2]

6

 

 

2

 

 

[3; 3]

5

 

 

3

 

 

[4; 5]

5

 

 

4

 

 

[6; )

4

 

Для нахождения оценок вероятностей

p0

 

 

3, 45 , которое является оценкой

вычислим X

 

 

 

i

 

 

 

а вычисление оценок

максимального правдоподобия параметра .

В данном случае 3, 45 ,

вероятностей

p0

(с учетом вида

гипотетического распределения)

осуществляется по

формулам:

i

 

 

 

 

 

 

 

 

 

 

 

 

 

пр.граница

 

 

m

 

пр.граница

 

m

 

 

 

 

 

3, 45

 

pi0

 

 

 

 

e

 

 

 

e 3,45.

(15)

 

 

 

m!

 

m лев.граница

 

m!

 

m лев.граница

 

 

 

Пользуясь формулой (15) , последовательно найдем:

 

2

3, 45

m

 

 

 

 

 

 

 

 

 

 

p10

 

e 3,45

0,33.

 

 

 

 

 

 

m!

 

 

 

 

 

 

 

m 0

 

 

 

 

 

 

 

 

 

 

 

 

3

3, 45

m

 

 

 

p20

 

 

e 3,45

0, 22.

 

 

 

 

 

 

 

m 3

m!

 

 

 

 

 

 

 

5

 

3, 45

m

 

 

 

p30

 

 

e 3,45

0,32,

 

 

m!

 

 

 

 

m 4

 

 

 

 

 

 

p0 1 0,33 0, 22 0,32 0,13.

 

 

4

 

 

 

 

 

 

 

 

 

Вычисляем значение статистики критерия хи-квадрат по формуле (16):

выч2

1, 20.

При 0, 05

и числе степеней свободы k r 1 4 1 1 2 ( в данном случае r = 1

число неизвестных параметров гипотетического пуассоновского распределения, которые были заменены их статистическими оценками) определяем критическое значение статистики

критерия хи-квадрат: x

 

 

2

 

x

 

2

2

5, 99 .

 

 

1

 

 

 

1 0,05

 

 

 

 

Поскольку

2

< x

 

2

 

 

,

то принимаем нулевую гипотезу, т.е. можно считать при

 

выч

1

 

 

 

 

 

 

 

 

 

 

заданном уровне значимости, что исходные данные могут быть описаны с помощью пуассоновского распределения.

9. Проверка независимости двух переменных с помощью таблицы сопряженности

Постановка задачи. Пусть X, Y – две случайные номинальные переменные; A1, , Ak - значения (уровни) переменной X, B1, , Bl - значения (уровни) переменной Y. Обозначим через

nij - количество наблюдений, в которых появилась пара Ai , B j ,

k

l

n nij . Множество

 

i 1

j 1

значений переменных и их частот, представленных в виде таблице, часто называют таблицей сопряженности k l . Необходимо с уровнем значимости выяснить, существует ли связь между переменными X и Y?

Для проверки гипотезы обычно используется статистика хи-квадрат вида

 

2

k

l

nij nij 2

 

a

 

bj

 

ai bj

 

 

 

, где nij n

i

 

 

 

 

.

 

n

n

n

n

 

 

i 1

j 1

ij

 

 

 

 

 

 

 

l

Здесь ai nij - сумма элементов i-й строки матрицы наблюдений nij ,

j 1

k

bj nij - сумма элементов j-й строки матрицы наблюдений nij .

i 1

Гипотеза независимости принимается, если выполняется неравенство

2

x

 

2

 

,

k 1 l 1 .

выч

1

 

 

 

 

(19)

(20)

Примечание. Если используется таблица сопряженности 2 2 , т.е. каждая из переменных принимает по 2 значения, то значение статистики хи-квадрат можно найти по более простой формуле

 

 

n n n

n n

2

 

2

 

11 22

12 21

 

,

(21)

a1 a2 b1 b2

 

 

 

 

 

 

которая имеет при n распределение хи-квадрат с одной степенью свободы, т.е. 1 .

Пример 2. Изучалось влияние на производительность труда двух видов мероприятий. Оказалось, что применение мероприятия А привело к увеличению производительности труда у 15 человек, при этом у 35 человек производительность труда уменьшилась. Реализация мероприятия В привела к увеличению производительности труда у 45 человек, при этом у 5 человек производительность труда уменьшилась. Можно ли с уровнем значимости 0,1 считать, что проведение этих мероприятий влияет на производительность труда?

Решение. Составляем по исходным данным таблицу сопряженности

Производительность

 

Мероприятия

 

Сумма по строке

 

труда

 

А

 

В

 

ai

 

увеличилась

15

45

 

 

60

 

уменьшилась

35

5

 

40

 

Сумма по столбцу bj

 

50

 

50

 

 

100

 

 

 

 

 

Последняя строка и последний столбец таблицы, выделенные серым цветом, содержат результаты вспомогательных вычислений. Воспользовавшись формулой (12), вычислим значение статистики критерия:

 

выч2

100 15 5 35 45 2

 

 

 

 

 

 

 

37, 5 .

 

60 40

50 50

 

 

 

 

 

 

При 0,1

и 1 определяем

значение

x

2

2, 706. Поскольку 37,5 > 2,706,

 

 

 

 

1

 

 

 

согласно (11) нулевая гипотеза отклоняется. С уровнем значимости 0,1 можно считать, что проведение мероприятий А и В влияет на производительность труда.

Элементы корреляционного и регрессионного анализа

1. Корреляционная зависимость. Коэффициенты корреляции Пирсона и Спирмена.

Опр. Переменные X и Y связаны корреляционной зависимостью, если значение одной из них зависит не только от значений второй, но и от значений других переменных.

Измерение силы линейной корреляционной зависимости между количественными переменными осуществляется обычно с помощью выборочного коэффициента корреляции Пирсона.

Опр. Пусть x1, y1 , , xn , yn - результаты наблюдений случайных переменных X и

Y , Тогда коэффициент корреляции Пирсона между переменными X и Y определяется выражением

(1)

r ( X ,Y )

K* ( X ,Y )

 

K

* ( X ,Y )

,

 

 

 

 

 

 

 

*

 

 

SX SY

 

 

S 2

S 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

Y

где

 

1

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

K*

( X ,Y )

X i X

Yi Y

 

 

 

 

n i 1

 

 

 

 

 

 

 

X Y X Y .

Коэффициент корреляции Пирсона обладает следующими свойствами:

1)он принимает значения от –1 до +1;

2)если r* ( X ,Y ) 1, то корреляционное поле наблюдений представляет собой

совокупность точек, которые можно расположить на одной прямой; знак «+» свидетельствует о прямой линейной зависимости между переменными X и Y , а знак «-» об обратной линейной зависимости;

3) при r* X ,Y

0 линия регрессии параллельна оси OX .

Замечание. Если

 

r* X ,Y

 

0.7 ,

 

то линейная связь

между переменными X и Y

 

 

 

считается сильной

, при

 

r*

 

X ,Y

 

0.3 – линейная

связь слабая. При r* X ,Y 0

 

 

 

линейная корреляционная связь отсутствует

 

Измерение силы корреляционной зависимости между порядковыми переменными осуществляется обычно с помощью выборочного рангового коэффициента корреляции Спирмена.

Опр. Пусть x1, y1 , , xn , yn

– результаты наблюдений переменных X

и Y . Тогда

коэффициент корреляции Спирмена между переменными X и Y определяется выражением

 

 

 

6

 

n

 

 

2 ,

 

(2)

r 1

 

 

R x R y

 

 

2

 

 

 

S

n n

1

 

i

i

 

 

 

 

 

i 1

 

 

 

 

где R xi - ранг значения

xi в выборке

x1, x2 , , xn ; R yi - ранг значения

yi в выборке

y1, y2 , , yn .

Имея коэффициент Пирсона (Спирмена) в случае совместного нормального распределения X и Y можно проверить гипотезу о независимости случайных величин X и Y . Если объем выборки достаточно велик, то гипотезу о независимости этих величин принимают, если выполняются неравенства:

(3)r* ( X ,Y )n x1 / 2 N ,

(4)rS n 1 x1 / 2 N ,

правые части которых определяются по заданному уровню значимости . При этом соответствующие теоретические коэффициенты корреляции признаются незначимыми.

Пример 1. Распределение 5 предприятий по фондовооруженности и энерговооруженности (в у.е.) представлено в таблице.

№ предприятия

1

2

3

4

5

Энерговооруженность (X)

3,5

2,1

0,7

4,9

6,3

Фондовооруженность (Y)

0 – 4,5

4,5 - 9,0

9,0 - 13,5

13,5 – 18,0

18,5 – 22,5

Вычислить ранговый коэффициент корреляции между фондовооруженностью и энерговооруженностью. Проверить значимость теоретического коэффициента корреляции Спирмена с уровнем значимости 0,1.

Решение. Поскольку значения переменной Y упорядочены по возрастанию, то вариационный ряд составляем только для переменной X: 0,7, 2,1, 3,5, 4,9 6,3. Заменяем исходную таблицу значений переменных X и Y таблицей значений их рангов.

№ предприятия

1

2

3

4

5

R(X)

3

2

1

4

5

R(Y)

1

2

3

4

5

По формуле (2) вычисляем ранговый коэффициент Спирмена

 

 

 

6

 

 

 

1

2

 

 

 

 

 

2

 

 

 

 

 

S 1 5

 

52

1 3

 

0

(1

3)

 

0

0

 

0,6.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rS

 

 

0,6

 

 

1, 2 .

Учитывая, что x0,95 N 1,645

при 0,1,

Вычислим

 

n 1

5 1

убеждаемся, что неравенство (4) выполняется. Поэтому гипотеза о незначимости теоретического коэффициента Спирмена принимается. Таким образом, имеются основания считать, что фондовооруженность и энерговооруженность не связаны между собой.

2.Парная линейная регрессионная модель. Выбор модели

Вмодели парной линейной регрессии зависимость между переменными Y и X представляется в виде

(5) Y a bX ,

где – случайная ошибка модели (error, или disturbance). Постоянные a, b - неизвестные

параметры модели. Наличие случайного члена связано с воздействием на зависимую случайную переменную Y других факторов, неучтенных в функции регрессии, с возможной нелинейностью модели и ошибками измерения. В данной модели функция регрессии является линейной функцией: YX a bX .

Опр. Функцией регрессии (уравнением регрессии) называют функцию, выражающую зависимость среднего значения одной из переменных от значений другой переменной (других переменных). Соотношение, связывающее значение зависимой переменной со значением функции регрессии и случайной ошибкой, называют регрессионной моделью.

Выбор линейной модели обычно обуславливается либо содержательными, либо геометрическими соображениями. Использование геометрических соображений

заключается в том, что результаты n наблюдений x1, y1 , , xn , yn переменных X и

Y изображаются в виде точек в декартовой системе координат. Получаемое таким образом изображение получило название диаграммы рассеяния или корреляционного поля наблюдений. Пример такого изображения можно найти на рис.1.

18

17

16

15

14

Y 13

12

11

10

9

8 10 12 14 16 18 20 22 24

X

Рис. 1

По расположению точек на рис.1 можно предположить наличие линейной регрессионной зависимости между признаками X и Y .

Пример 2. Сделать вывод о характере зависимости между Y - средней ежегодной прибылью (в %) портфеля ценных бумаг и его риском, измеряемым с помощью

среднеквадратичного

отклонения прибыли

X (в %)

по отчетам о деятельности 30

инвестиционных фондов

США за период с 1954 по 1963 гг. Необходимые сведения о

деятельности фондов приведены в следующей таблице

 

 

 

 

i

 

yi

 

xi

i

yi

xi

 

 

1

 

14,6

 

16,3

16

15,1

19,1

 

 

2

 

10

 

9,2

17

11,4

14,1

 

 

3

 

10,5

 

13,5

18

17,4

21,8

 

 

4

 

12,0

 

16,3

19

11,3

12,5

 

 

5

 

11,9

 

15,6

20

10,0

10,4

 

 

6

 

12,4

 

12,1

21

16,2

20,8

 

 

7

 

14,8

 

16,8

22

17,6

22,7

 

 

8

 

15,7

 

19,3

23

14,4

17,8

 

 

9

 

10,9

 

13,7

24

10,4

10,2

 

 

10

 

14,4

 

15,9

25

13,1

16,0

 

 

11

 

11,0

 

11,9

26

10,7

13,3

 

 

12

 

15,2

 

19,2

27

14,4

19,4

 

 

13

 

14,6

 

18,7

28

16,1

20,9

 

 

14

 

16,4

 

21,5

29

11,3

12,0

 

 

15

 

16,0

 

21,7

30

13,8

16,9

 

Анализ данных. Корреляционное поле наблюдений, соответствующее приведенным в таблице данным, приведено на рис 1. Как можно судить по графику, все точки расположены вблизи некоторой мыслимой прямой, что дает основание предположить линейный характер регрессионной зависимости между переменными. Это предположение соответствует одному из положений модели оценки финансовых активов САРМ о линейном характере зависимости между средней ежегодной прибылью портфеля ценных бумаг и ее среднеквадратичным отклонением. Учитывая также, что амплитуда колебаний прибыли Y практически не меняется при ее росте, имеются веские основания описать зависимость между переменными X и Y с помощью модели (5).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]