Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4561

.pdf
Скачиваний:
11
Добавлен:
13.11.2022
Размер:
644.6 Кб
Скачать

11

Выборочным среднеквадратическим отклонением (стандартом)

называется число σВ, определяемое равенством

 

 

 

(6)

B DB ,

а число S, определяемое равенством

 

 

 

 

 

n

 

 

S

S 2

 

B ,

(7)

 

 

 

n

1

 

 

 

 

 

 

называется исправленным стандартом.

Пример 1. При изучении производительности труда Х на одного работника было обследовано 10 предприятий и получены следующие значения (тыс. руб.): 4,2; 4,8; 4,7; 5,0; 4,9; 4,3; 3,9; 4,1; 4,3; 4,8. Определить выборочную среднюю, выборочную дисперсию, исправленное среднее квадратическое отклонение.

Решение. По данной выборке объёма n=10 составим статистический

ряд:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

3,9

 

 

4,1

 

4,2

4,3

 

 

 

4,7

4,8

4,9

5,0

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

1

 

 

1

 

 

 

1

2

 

 

 

1

 

2

1

1

 

 

 

 

 

 

 

 

 

По формуле (2) найдется выборочная средняя:

 

 

 

 

 

 

 

 

3,9

4,1

4,2

4,3

2

4,7

4,8

2

4,9

5

 

 

 

45

 

 

(тыс. руб.).

 

 

 

 

 

 

 

 

 

 

 

 

 

xB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4,5

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По формуле (4) найдем выборочную дисперсию. Для этого вычислим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

)2 и x 2 по формуле (5):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

)2

(4,5)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xB

 

 

 

20,25;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3,9)2

(4,1)2

(4,2)2

(4,3)2

2

(4,7)

2

 

(4,8)2

2

(4,9)2

(5)

2

 

 

 

 

 

 

 

x2

 

20,382

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда DB=20,382–20,25=0,132. Согласно (7) S≈0,383.

Смысл полученных результатов заключается в следующем. Средняя производительность труда на одного работника для изученных

предприятий составила

 

=4,5 тыс. руб. Исправленное

среднее

xв

квадратическое отклонение

S описывает абсолютный разброс

значений

показателя Х и в данном случае составляет S=0,383 тыс. руб.

Если дано интервальное распределение, то для вычисления числовых характеристик надо перейти к дискретному, взяв за значения вариант середины частичных интервалов.

Выборочные оценки являются приближёнными. Чтобы с помощью статистических данных можно было сделать правильные выводы, нужно знать точность и надёжность этих оценок.

Пусть * — статистическая оценка неизвестной величины .

Надёжностью (доверительной вероятностью) называют вероятность , с

которой осуществляется неравенство | - *| < или *- < < *+ .

12

Обычно надёжность оценки задаётся наперёд, причём в качестве берут число, близкое к единице. По надежности ищут такое число , чтобы

Р( *- < < *+ )≡Р(| - *|< )= .

Число называют точностью оценки (предельной ошибкой). Интервал ( *- , *+ ) называется доверительным интервалом; он

является симметричной интервальной оценкой неизвестной величины . Интервальной оценкой с надёжностью математического ожидания

М(Х)=q нормально распределённого признака X генеральной

совокупности при

известном

среднем

 

 

квадратическом

 

отклонении

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(X) этого признака служит доверительный интервал

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

t

,

 

 

 

 

 

 

 

 

 

 

 

xв

 

a

xв

 

(8)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где n —

объём выборки,

 

x в

выборочная

средняя, t

— значение

аргумента

функции

Лапласа Ф(t),

при

котором Ф(t)=

 

,

 

 

t

 

 

 

 

 

2

 

 

 

 

 

 

n

точность оценки.

Пример 2. В ходе обследования банковских счетов была проведена случайная выборка записей по вкладам. Из выборки n=100 оказалось, что средний размер вклада составляет 1 837 д.е.; генеральное среднее квадратическое отклонение размера вклада равно 280 д.е. Найти с надёжностью =0,95 доверительный интервал для среднего размера а вкладов по всем счетам, если известно, что размер вкладов распределён по нормальному закону.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. По условию x в =1837; n=100;

=280;

 

=0,95. По таблице

 

 

 

 

 

 

 

 

1

 

 

t

z2

 

 

 

 

 

 

 

 

 

значений

функции

 

 

 

 

 

2

 

находим

 

t

из

условия

(t)

 

 

0e

dz

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2n

 

 

 

 

 

 

 

 

 

 

Ф(t)=

 

 

0,95

0,475 ,

получаем t=1,96.

По формуле

(8)

находим

 

 

 

2

2

доверительный интервал:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1837

1,96

280

a 1837

1,96

280

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

100

 

 

 

 

1837 54,88 a 1837 54,88,

1782,12 a 1891,88.

Это означает, что с вероятностью, равной 0,95, можно утверждать, что средний размер вклада в генеральной совокупности находится в пределах от 1 782,12 д.е. до 1 891,88 д.е. Интервал ±54,88 составляет примерно ±3% среднего размера вклада в выборке (1 837). Это не очень большое отклонение, поэтому среднее значение выборки можно считать надёжной оценкой среднего значения генеральной совокупности.

13

Тема 3. Элементы теории корреляции

Различные экономические показатели не являются независимыми, а связаны между собой; например, цена какого-либо товара и величина спроса на этот товар, объём производства и прибыль фирмы, располагаемый доход и объём личного потребления, инфляция и безработица. Взаимосвязи показателей в экономике редко имеют простой функциональный вид, поскольку на интересующий нас показатель, кроме явно учитываемых факторов, влияет ещё множество других, которые являются случайными. Поэтому одной из основных задач в экономических исследованиях является анализ зависимостей между переменными.

Пусть требуется оценить связь между переменными X и Y. Возникает два вопроса: 1) связаны ли между собой эти переменные; 2) какова теснота этой связи?

В качестве характеристики тесноты линейной связи между количественными признаками в выборке используется выборочный

коэффициент корреляции rВ по формуле

 

 

 

 

 

 

 

 

 

 

r

 

xy

 

x y

.

(9)

 

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

x

 

y

 

Свойства выборочного коэффициента корреляции:

1)значения rВ заключены на отрезке от –1 до +1.

2)если rВ = 0, то между Х и У отсутствует линейная корреляционная связь, но возможно наличие между ними другого типа связи.

3)если rВ > 0, то увеличение признака Х в среднем приводит к увеличению признака У. Если rВ < 0, то с увеличением Х в среднем признак У уменьшается.

4)если rВ 1, то между Х и У существует линейная

функциональная зависимость, не искажаемая действием случайных факторов.

Для качественной оценки тесноты корреляционной связи между X и Y можно воспользоваться таблицей Чеддока (табл.1):

 

 

 

 

 

 

Таблица 1

Диапазон

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

 

изменения | rB |

 

 

 

 

 

 

Характер

слабая

умеренная

заметная

высокая

весьма

тесноты связи

 

 

 

 

высокая

 

 

 

 

 

 

 

 

14

Пример. Выборочно обследовано 100 снабженческо-сбытовых предприятий некоторого региона по количеству работников X и объёмам складской реализации Y (д.е.). Результаты представлены в корреляционной таблице;

X

5

15

25

35

45

ny

У

 

 

 

 

 

 

130

7

1

 

 

 

8

132

2

7

1

 

 

10

134

1

5

4

1

 

11

136

 

1

15

10

8

34

138

 

 

3

12

15

30

140

 

 

 

1

6

7

nх

10

14

23

24

29

n=100

По данным исследования требуется:

1)в прямоугольной системе координат построить эмпирические ломаные регрессии Y на X и X на Y, сделать предположение в виде корреляционной связи;

2)оценить тесноту линейной корреляционной связи;

3)проверить гипотезу о значимости выборочного коэффициента корреляции, при уровне значимости α=0,05;

4)составить линейные уравнения регрессии У на X и X на У, построить их графики в одной системе координат;

5)используя полученные уравнения регрессии, оценить ожидаемое среднее значение признака Y при х=40 чел.; дать экономическую интерпретацию полученных результатов.

Решение.

1. Для построения эмпирических ломаных регрессии вычислим

условные средние

 

 

 

 

и

 

 

 

 

 

 

Вычисляем

 

 

 

 

. Так как при х=5 признак Y

 

y x

 

 

x y

y x

имеет распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

130

132

134

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

7

 

 

 

2

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

130

 

7

132

 

2

134 1

 

 

 

 

то условное среднее yx

5

130,8 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При х=15 признак Y имеет распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

130

 

132

134

 

136

 

 

 

 

 

 

 

 

 

 

 

ni

 

1

 

7

 

 

5

 

 

1

 

 

 

130 1

132

7

134

5

 

136 1

 

 

 

 

 

 

 

 

 

 

 

тогда yx 15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

132,86 .

 

 

 

 

 

 

 

 

 

 

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

Аналогично вычисляются все y X и xY . Получим таблицы, выражающие корреляционную зависимость Y от X (табл.2) и X от Y (табл.3).

Таблица 2

x

 

5

15

25

35

 

45

 

 

 

 

 

130,8

132,86

135,74 137,08

137,86

 

 

y X

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3

y

 

130

132

134

136

138

140

 

 

 

 

 

6,25

14

19,54

32,35

39

43,57

 

 

xY

 

 

В прямоугольной системе координат построим точки Аii, y Xi ), соединив их отрезками, получим эмпирическую линию регрессии Y на X. Аналогично строятся точки В j( xY j ,yj) и эмпирическая линия регрессии X

на Y (см. рис.).

y х ( y)

В6

140

А

А5

 

А В5

В4

А

В3

А В2

130

В1

x(xУ )

Построенные эмпирические ломаные регрессии Y на X и X на Y свидетельствуют о том, что между количеством работающих (X) и объёмом складских реализаций (Y) существует линейная зависимость. Из

графика видно, что с увеличением X величина Y X также увеличивается, поэтому можно выдвинуть гипотезу о прямой линейной корреляционной зависимости между количеством работающих и объёмом складских реализаций.

16

2. Оценим тесноту связи. Вычислим выборочный коэффициент корреляции по формуле (9), предварительно вычислив характеристики по формулам

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi nx

,

 

 

 

 

 

 

 

y j n y

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y 2j nx

 

 

 

 

 

 

 

 

 

 

 

 

 

xi y jnij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

y 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

x

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

xy

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

x

 

y

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5 10

 

14 14

 

 

25

23

35

 

24

 

 

45

 

29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

29,8 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

130

 

8

132 10

 

 

134 11

136

34

 

 

 

138

30

 

140

7

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

135,78 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

52

 

10

142

 

14

 

 

252

 

23

352

 

 

 

24

 

 

452

29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 2

 

 

 

 

 

 

 

 

 

 

 

 

1059;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1302

8

1322

 

 

10

 

1342

 

 

11

 

 

1362

 

 

34

 

1382

 

 

30

1402

7

 

 

 

y 2

 

 

 

 

 

 

 

 

 

 

 

 

18443,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xy

 

 

 

130

5

7

 

130 15 1

 

 

 

 

132

52

 

132 15

7

 

 

 

 

132

25 1

134

5 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

134 15

5

134

25

 

4

 

134

 

 

 

35 1

136 15 1

 

 

136

 

25 15

 

136

35 10

136

45

8

138

25

 

3

 

138

 

 

 

35 12

 

 

138

 

45 15

 

 

140

 

 

35 1

 

 

 

 

140

45

6)

4075,55

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

1059

(29,8)2

 

 

 

13,08;

 

 

 

 

 

y

 

 

18443,4

 

 

(135,78)2

 

2,68 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rв

4075,55

29,8

135,78

 

 

0,84 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13,08

2,68

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Это значение rB

говорит о том,

что линейная связь между количеством

работников и объемом складских реализаций высокая. Этот вывод подтверждает первоначальное предположение, сделанное исходя из графика.

3. Запишем теоретические уравнения линейной регрессии:

y

Yx y rв

x

 

 

) ,

 

 

 

 

 

x

( y

 

) .

(10)

(x

x

X

y

 

x r

y

 

 

 

 

 

 

 

 

в

 

 

 

 

 

y

Подставляя в эти уравнения найденные величины, получаем искомые уравнения регрессии:

1) уравнение регрессии Y на X:

 

 

 

 

 

 

 

 

 

17

 

 

 

 

 

 

 

 

 

 

 

2,68

 

29,8) , или

 

 

 

 

130,71;

Yx

135,78

0,84

 

(x

Yx

0,17x

13,08

 

 

 

 

 

 

 

 

 

 

 

 

2) уравнение регрессии X на Y:

 

 

 

 

 

 

13,08

 

135,78) , или

 

 

526,9 .

 

X y

29,8

0,84

( y

X y

4,1y

 

2,68

 

 

 

 

 

 

 

 

 

 

 

 

 

Построим графики найденных уравнений регрессии. Зададим координаты двух точек, удовлетворяющих уравнению

Yx 0,17x 130,71.

 

Пусть х = 10, тогда

 

 

132,41 , А1(10; 132,41),

Yx

 

Если х = 40, тогда

 

 

137,51 , А2(40; 137,51)

Yx

 

Аналогично находим точки, удовлетворяющие уравнению

 

4,1y 526,9 , В1(10,2; 131),

В2(43; 139)

Х y

Графики прямых линий регрессии изображены ниже на рисунке.

140

 

В2

А

С

А

130 В1

x( X y )

Контроль: точка пересечения прямых линий регрессии имеет координаты

x; y . В нашем примере: С(29,8; 135,78).

4. Найдём среднее значение Y при х=40 чел., используя уравнение регрессии Y на X. Подставим в это уравнение х=40, получим

Yx 0,17 40 130,71 137,51.

Ожидаемое в генеральной совокупности среднее значение объёма складских реализаций при заданном количестве работников (х=40) составляет 137,51 д.е.

18

Замечание 1. Если в корреляционной таблице даны интервальные распределения, то за значения вариант надо брать середины частичных интервалов.

Замечание 2. Если данные наблюдений над признаками X и Y заданы в виде корреляционной таблицы с равноотстоящими вариантами, то целесообразно перейти к условным вариантам:

 

 

x

C

 

y j

C2

 

U

i

i

1

, V

 

 

,

 

 

 

 

 

 

h1

j

h2

 

 

 

 

 

 

 

где h1 – шаг, т.е. разность между двумя соседними вариантами xi; С1 – «ложный нуль» вариант xi (в качестве «ложного нуля» удобно принять варианту, которая расположена примерно в середине ряда); h2 – шаг вариант Y; С2 – «ложный нуль» вариант Y.

В этом случае выборочный коэффициент корреляции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

U

 

V

 

U

 

V

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

u

 

v

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

i

n

x

 

 

 

 

 

 

 

V j n y

 

 

 

 

 

 

 

 

 

U iV j nij

 

 

 

 

 

 

 

 

 

 

 

где U

 

 

 

, V

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

UV

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U 2

 

 

 

 

 

 

V 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

 

 

 

 

 

U

v

 

 

V

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зная эти величины, находят

 

,

 

 

 

, σх, σу по формулам

 

 

 

x

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x Uh1

C1 , y Vh2

C2 ,

 

x

 

 

 

 

u h1,

y

v h2 .

 

Найденные величины подставляем в уравнения (10).

 

 

 

Так в данном примере С1 =25, h1=10, С2=136, h2=2; Ui

xi

25

,

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Vj

 

y j 136

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Корреляционная таблица в условных вариантах имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

-2

 

-1

 

 

 

 

 

 

 

0

 

 

 

 

 

1

 

 

 

2

 

 

ny

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-3

 

 

 

 

 

 

7

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

-2

 

 

 

 

 

 

2

 

 

7

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

-1

 

 

 

 

 

 

1

 

 

5

 

 

 

 

 

 

 

 

4

 

 

 

 

 

1

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

15

 

 

 

 

10

 

 

8

 

 

34

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

12

 

 

15

 

 

30

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

6

 

 

7

 

 

 

 

 

 

 

 

 

 

 

nx

 

 

 

 

 

 

10

 

14

 

 

 

 

 

 

23

 

 

 

 

24

 

 

29

 

 

n=100

По этой таблице и приведённым выше формулам находим характеристики:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

10

1 14

0

 

23

 

1

24

 

 

2

29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

0,48 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

8

 

2

10

1 11

 

0

 

34

1

 

30

2

7

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

0,11;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

10

1 14

0

 

23

 

1

24

 

 

4

29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U 2

 

 

 

1,94 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

8

4

10

1 11

0

 

34

1

30

4

7

 

 

 

 

 

 

 

 

 

 

 

V 2

 

1,81;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U V

 

 

 

(

 

3)

 

(

 

2)

7

 

( 3) (

1)

1

(

 

2)

(

2)

2

 

 

(

2) (

1)

7

 

 

 

 

 

 

 

 

 

 

100

 

 

 

( 1)

( 2)

1

(

1) 1 1

 

1 1 12

1

 

2

15

 

 

 

2 1 1

2

2

6)

1,4

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

;

 

 

 

 

 

 

 

 

1,34 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,94

0,2304

1,308

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

V

 

1,81

0,012

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rв

1,4

0,48

(

0,11)

 

 

0,84 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,308

1,34

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

29,8 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

Uh1

C1

0,48 10 25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

Vh2

C2

 

0,11

2

 

136

 

 

135,78;

 

 

 

 

 

 

 

 

 

 

x

 

 

 

u h1

1,308 10

 

13,08;

 

y

 

 

v h2

1,34

2

 

 

2,68 .

 

 

В результате получаем те же уравнения линейной регрессии:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,17x 130,71;

 

 

 

 

526,9 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yx

 

 

 

 

X y

 

4,1y

 

 

 

 

 

 

 

 

Тема 4. Статистическая проверка гипотез. Критерий согласия Пирсона

В исследованиях часто возникает необходимость знать закон распределения изучаемого признака генеральной совокупности. С этой целью производят наблюдения и получают опытное (или эмпирическое) распределение случайной величины в виде вариационного ряда. Поставленная задача сводится к оценке закона распределения признака в генеральной совокупности на основе выборочных данных.

Для точной формулировки проблемы дадим основные определения. Определение 1. Распределение признака в выборке называется

эмпирическим распределением.

Определение 2. Распределение признака в генеральной совокупности называется теоретическим распределением.

Определение 3. Статистической называют гипотезу о виде неизвестного распределение или о параметрах известных распределений.

20

Определение 4. Нулевой (основной) называют выдвинутую гипотезу

Н0.

Определение 5. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит основной.

В результате проверки гипотезы могут быть допущены ошибки двух родов.

Определение 6. Ошибка 1 рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Вероятность ошибки 1 рода называется

уровнем значимости и обозначается α.

Определение 7. Ошибка 2 рода состоит в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки 2 рода обозначается

β.

Определение 8. Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Это численная мера расхождения между эмпирическим и теоретическим распределением.

Основная задача. Дано эмпирическое распределение (выборка). Сделать предположение (выдвинуть гипотезу) о виде теоретического распределения и проверить выдвинутую гипотезу на заданном уровне значимости α.

Решение основной задачи состоит из двух частей:

1.Выдвижение гипотезы.

2.Проверка гипотезы на заданном уровне значимости. Рассмотрим подробно эти части.

1.Выбор гипотезы о виде теоретического распределения удобно

делать с помощью полигонов или гистограмм частот. Сравнивают эмпирический полигон (или гистограмму) с известными законами распределения и выбирают наиболее подходящий.

Приведём графики важнейших законов распределения:

f(x)

 

 

f(x)

 

 

f(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

Х

 

 

 

 

а

b

Х

 

 

 

Х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Нормальное

 

 

 

 

 

 

 

 

 

 

 

 

 

Равномерное

Распределение

распределение N(a,σ)

 

 

 

 

 

 

Пуассона

 

 

 

распределение [a,b]

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pk

 

e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k!

Примеры эмпирических законов распределения приведены на рисунках:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]