Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 283

.pdf
Скачиваний:
6
Добавлен:
30.04.2022
Размер:
360.06 Кб
Скачать

4.1. Отыскание параметров выборочного уравнения прямой линии регрессии по несгруппированным данным

Пусть

 

количественные

признакиX

и

Y

 

 

связаны

линейной

 

корреляционной

таблицей

и

 

 

в

результа

независимых испытаний получены n пар чисел:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

x1

 

 

 

 

 

 

x2

 

 

 

 

 

 

xn

 

yi

 

 

y1

 

 

 

 

 

y2

 

 

 

 

 

 

yn

 

Выборочное уравнение прямой линии регрессии Y

на X

 

выбираем в виде:

 

 

 

y = p y x × x + B .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Параметры

p y x

и В,

которые определяются

методом

наименьших квадратов, имеют вид:

 

 

 

 

 

 

 

 

 

 

 

n

n

 

n

 

 

 

 

 

n

n

 

n

 

n

 

 

 

 

n å xi yi - åxi ×å yi

 

 

nåxi2 - å yi - åxi × å xiyi

 

pyx =

 

i, j =1

i=1

j =1

 

; B =

i=1

j=1

 

i=1

 

i , j =1

 

.

 

 

 

n

æ

n

ö

2

 

 

n

 

æ

n

ö

2

 

 

 

 

nåxi 2

- ç

åxi ÷

 

 

 

 

 

 

nåxi 2

- çåxi ÷

 

 

 

 

 

 

 

i=1

è i =1

ø

 

 

 

 

 

 

i =1

 

è

i=1

ø

 

 

 

 

Величина

rB = p y x ×

s x

называется

 

 

выборочным

 

 

 

 

s y

 

 

коэффициентом корреляции. Она служит для оценки тесноты линейной корреляционной зависимости.

Абсолютная величина выборочного коэффициента корреляции не превосходит единицы, т.е. -1 £ rB £1.

С

возрастанием

rB

линейная

корреляционная

зависимость становится более тесной и при rB =1 переходит в функциональную.

29

и yB - выборочные средние s y - выборочные средние - выборочный коэффициент

4.2. Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным

При большом числе испытаний одно и то же значениеX может встретиться nx раз, одно и то ж значениеY может

встретиться n

y

раз,

 

 

(

)

может

 

одна и та же пара чиселx; y

 

встретиться nx y

раз,

причем обычно ånx = åny = ånxy = n -

объем выборки.

Поэтому

данные

наблюдений группируют,

т.е. подсчитывают nx , n y ,

nx y . Все сгруппированные данные

записывают

 

в

виде

,таблицыкоторую

 

называют

корреляционной.

 

 

 

 

 

Если обе линии регрессии Y

на X и X наY -

прямые,

то корреляция является линейной.

Выборочное уравнение прямой линии регрессии Y на X имеет вид:

yx - yB = rB ×s y (x - xB ), s x

где yx - условная средняя; xB признаков X и Y ; s x и квадратичные отклонения; rB корреляции.

Выборочное уравнение прямой линии регрессии X на Y имеет вид:

xy - xB = rB ×s y (y - yB ). s x

Считаем, что данные наблюдений над признакамиX и Y заданы в виде корреляционной таблицы с равноотстоящими вариантами.

30

Тогда переходим к условным вариантам:

ui = xi -C1 ; vj = yi -C 2 , h1 h2

где C1 - варианта признака X , имеющая наибольшую частоту; C 2 - варианта признака Y , имеющая наибольшую частоту, h1 - шаг (разность между двумя соседними вариантами X ); h2 - шаг (разность между двумя соседними вариантами Y ).

Тогда выборочный коэффициент корреляции

 

 

 

 

 

 

 

 

 

 

 

 

ånu v ui v j -

u

 

v

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rB =

 

 

 

 

 

.

 

 

 

 

 

 

 

 

nsu sv

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Величины

 

 

,

 

 

 

, s u ,

s v могут

 

 

быть найдены методом

u

v

 

 

произведений либо непосредственно по формулам

 

 

 

ånu ×u

 

 

 

 

 

 

 

ånv ×v

; s u =

 

 

- (

 

 

 

2 ; s v =

 

- (

 

2 .

 

 

=

 

;

 

=

 

u2

 

v2

 

 

u

 

v

 

u)

v)

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зная эти

 

 

 

величины, найдем

параметры, входящие в

уравнения регрессии по формулам

x = h1 ×u + C1 ; y = h2 ×v + C2 ; s x = h1 su ; s y = h2 sv .

31

Вопросы для самопроверки

1. Что такое генеральная совокупность? Что такое выборка из генеральной совокупности? Какие требования к ней предъявляются? Что такое объем выборки? размах выборки?

2.Что собой представляет статистический ряд распределения случайной величины?

3.Что такое эмпирическая функция распределения? Каково ее значение для статистики?

4.Что представляет собой гистограмма? полигон частот? Статистическими аналогами какой функции они являются?

5.Что такое выборочное среднее? Что является оценкой математического ожидания генеральной совокупности?

6.Что такое выборочная дисперсия? Оценкой какого параметра

она является? Какие соотношения и в каких случаях можно использовать для оценки дисперсии?

7.Какими свойствами должны обладать оценки генеральной совокупности? Что такое несмещенность оценки? состоятельность? эффективность?

8.Что такое доверительный интервал? Как определяются доверительные интервалы изменения математического ожидания? дисперсии?

9. Что такое статистическая гипотеза? раметрическая гипотеза? гипотеза о виде распределения?

10.Что такое основная (H 0 ) и альтернативная (H 1) гипотезы?

11.Какую гипотезу проверяют статистические критерии?

12.В чем смысл ошибок первого и второго рода при проверке статистических гипотез?

13. Что такое критическая область критерия? критическая точка?

14.Что такое критерий согласия Пирсона? Как определить выборочную статистику c2 («хи-квадрат»)?

15.Как определяется число степеней свободы в критерии Пирсона? Как определяется уровень значимости критерия согласия?

32

Задание для типового расчета по математической

 

 

 

 

 

статистике

 

 

 

Выбрать

таблицу по порядковому

номеру студента

в

списке группы и составить на основе приведенной таблицы

 

новую

таблицу,

элементы

которой

определить

из

соотношения:

x ij = (1+ k )x0ij + k , где k = N / n (N — последняя

 

цифра номера учебной группы студента, n — две последние

 

цифры номера студенческого билета). Параметр k округлить

 

до 0,1.

 

 

 

 

 

 

 

Полученную

таблицу

считать

таблицей

исходных

статистических данных для случайной величиныX и

 

использовать значения X в нижеследующих пунктах.

 

 

Пусть

признак X представлен точечным (дискретным)

 

выборочным распределением в виде таблицы выборочных значений. Требуется:

1.Составить интервальное распределение выборки.

2.Построить гистограмму относительных частот.

3.Перейти от составленного интервального к точечному выборочному распределению, взяв при этом за значения признака середины частичных интервалов.

4.Построить полигон относительных частот.

5. Найти

эмпирическую

функцию

распределения

и

построить ее график.

 

 

 

 

 

 

 

 

6. Вычислить

все

точечные

статистические

x

оценки

числовых характеристик признака: выборочное среднее

в ;

 

выборочную

дисперсию sn2 и

исправленную

выборочную

 

дисперсию

s2 ;

выборочное

среднее

 

квадратическое

отклонение

sn

и

исправленное

выборочное

 

среднее

квадратическое отклонение s.

 

 

 

 

 

 

 

7. Считая

первый столбец таблицы выборкой значений

 

нормально

распределенного

 

признакаX,

построить

 

доверительные

интервалы, покрывающие

 

неизвестные

 

математическое ожидание и дисперсию этого признака с надежностью g = 0.95 .

33

8. Считая

первые

два

столбца

таблицы

выборками

значений

нормально

распределенных

признаковХ1 и Х2,

проверить

при

уровне

значимости a = 0.05 гипотезу H0:

D(X1) = D(X2).

9.Проверить при уровне значимости a = 0.05 с помощью критерия Пирсона гипотезу о нормальном распределении признака X.

10.Считая первый столбец таблицы выборкой значений

признака X, а второй - выборкой значений признакаY, оценить тесноту линейной корреляционной связи между

признаками

и

составить

выборочное

уравнение

прямой

регрессии Y на X.

 

 

 

 

 

 

 

 

 

 

 

 

 

Варианты № 1, 9, 17, 25

 

 

 

 

 

51.5

55.3

42.3

43.3

59.5

60.6

86.1

43.3

 

77.8

59.6

 

 

11.3

22.3

46.3

22.8

47.3

45.3

43.8

56.3

 

50.3

50.0

 

 

76.3

64.3

16.6

56.3

47.8

54.3

64.1

79.8

 

68.3

35.8

 

 

51.2

50.1

51.0

70.8

31.3

33.3

23.7

53.3

 

71.7

58.5

 

 

25.1

51.3

72.5

24.3

49.1

48.7

52.1

79.6

 

28.3

57.9

 

 

52.6

59.9

29.7

43.7

55.7

53.0

50.1

50.7

 

58.8

46.7

 

 

34.8

51.3

28.3

41.0

58.8

49.1

19.7

36.9

 

29.7

38.9

 

 

50.8

28.0

35.3

69.9

30.6

64.0

32.5

45.1

 

45.3

70.4

 

 

47.6

78.0

38.4

70.5

40.6

31.3

44.3

47.4

 

91.3

64.3

 

 

31.3

45.1

66.1

23.3

40.1

43.6

66.1

42.3

 

19.1

31.3

 

Варианты № 2, 10, 18, 26

66.7

70.5

57.5

58.5

74.7

75.8

99.9

58.5

93.0

74.8

26.7

37.5

61.5

38.0

62.5

60.5

59.0

71.5

65.5

65.2

91.5

79.5

31.8

71.5

63.0

69.5

79.3

95.0

83.5

51.0

66.4

65.3

66.2

85.5

46.5

48.5

36.9

68.5

86.9

73.7

40.3

66.5

87.7

39.5

64.3

63.9

67.3

94.8

43.5

73.1

67.8

75.1

44.9

58.9

70.9

68.2

65.3

65.9

74.0

63.9

50.0

66.5

43.5

56.2

74.0

64.3

34.9

52.1

44.9

54.1

66.0

43.2

70.5

85.1

45.8

79.2

47.7

60.3

60.5

85.6

62.8

93.2

53.6

85.7

55.8

46.5

59.5

62.6

92.8

79.5

46.5

60.3

81.3

38.5

55.3

58.8

81.3

57.5

34.3

46.5

34

Варианты № 3, 11, 19, 27

64.5

68.3

55.3

72.5

73.6

99.1

56.3

90.8

72.6

56.3

19.2

35.3

59.3

60.2

58.3

56.8

69.3

63.3

63.0

36.8

89.3

77.3

29.6

69.3

60.8

67.3

77.1

92.8

81.3

48.8

24.3

63.1

64.0

83.3

44.3

46.3

36.7

66.3

84.7

71.5

38.1

64.3

85.5

37.3

62.1

61.7

65.1

92.6

41.3

70.9

65.6

72.9

42.7

56.7

68.7

66.0

63.1

63.7

71.8

61.7

47.8

64.3

41.3

54.0

71.8

62.1

32.7

49.9

42.7

51.9

63.8

41.0

68.3

82.9

43.6

77.0

45.5

58.1

58.3

83.4

60.6

91.0

51.4

83.5

53.6

44.3

57.3

60.4

99.2

77.3

44.3

58.1

79.1

36.3

53.1

56.6

79.1

55.3

32.1

44.3

Варианты № 4, 12, 20, 28

54.2

58.0

45.0

46.0

62.2

63.3

88.8

46.0

80.5

62.3

14.0

25.0

49.0

25.5

50.0

48.0

46.5

59.0

53.0

52.7

79.0

67.0

19.3

59.0

50.5

57.0

66.8

82.5

71.0

38.5

53.9

52.8

53.7

73.0

34.0

36.0

26.4

56.0

74.4

61.2

27.8

54.0

75.2

27.0

51.8

51.4

54.8

82.3

31.0

60.6

55.3

62.6

32.4

46.4

58.4

55.7

52.8

53.4

61.5

51.4

37.5

54.0

31.0

43.7

61.5

51.8

22.4

39.6

32.4

41.6

53.5

30.7

58.0

72.6

33.3

66.7

35.2

47.8

48.0

73.1

50.3

80.7

41.1

73.2

43.3

34.0

47.0

50.1

94.0

67.0

34.0

47.8

68.8

26.0

42.8

46.3

68.8

45.0

21.8

34.7

Варианты № 5, 13, 21, 29

54.5

58.3

45.3

46.3

62.5

63.6

89.1

46.4

80.8

62.6

14.3

25.3

49.3

25.8

61.8

48.3

46.8

59.3

53.3

53.0

79.3

67.3

19.6

59.3

50.3

57.3

61.7

82.8

71.3

38.8

54.2

53.1

54.0

73.8

50.8

36.3

25.7

56.3

74.7

61.5

28.1

54.3

75.5

27.3

34.3

51.7

55.1

82.6

31.3

60.9

55.6

62.9

32.7

46.7

52.1

56.0

53.1

53.7

61.8

51.7

37.8

54.3

31.3

44.0

58.7

52.1

22.7

39.9

32.7

41.9

53.8

31.0

58.3

72.9

33.6

67.0

35.5

48.1

48.3

73.4

50.6

81.0

41.4

73.5

43.6

34.3

47.3

50.4

94.3

67.3

34.3

48.1

69.1

26.3

43.1

46.6

69.1

45.3

22.1

34.3

35

Варианты № 6, 14, 22, 30

42.8

46.6

33.6

34.6

50.8

51.9

77.4

34.6

69.1

50.9

2.6

13.6

37.6

14.1

38.6

36.6

35.1

47.6

41.6

41.3

67.6

55.6

7.9

47.6

39.1

45.6

55.4

71.1

59.6

27.1

42.5

41.4

42.3

61.6

22.6

24.6

15.0

44.6

63.0

49.8

16.4

42.6

63.8

15.6

40.4

40.0

43.4

70.9

19.6

49.2

43.9

51.2

21.0

35.0

47.0

44.3

41.4

42.0

50.1

40.2

26.1

42.6

19.6

32.3

50.1

40.4

11.0

28.2

21.0

30.2

42.1

19.3

46.6

61.2

21.9

55.3

23.8

36.4

36.6

61.7

38.9

69.3

29.7

61.8

81.9

22.6

35.6.

38.7

82.6

55.6

22.6

36.4

57.4

14.6

31.4

34.9

57.4

33.6

10.4

22.6

Варианты № 7, 15, 23, 31

56.7

60.5

47.5

48.5

64.7

65.8

91.3

48.5

83.0

64.8

16.5

27.5

51.5

28.0

52.5

50.5

49.0

61.5

55.5

55.2

81.5

69.5

21.8

61.5

53.0

59.5

69.3

85.0

73.5

41.0

56.4

55.3

56.2

75.5

36.5

38.5

26.9

58.5

76.9

63.7

30.3

56.5

77.7

29.5

54.3

53.9

57.3

84.8

33.5

63.1

57.8

65.1

34.9

60.9

58.2

55.3

55.9

64.0

53.9

48.9

40.0

56.5

33.5

46.2

64.0

54.3

24.9

42.1

44.9

44.1

56.0

33.2

60.5

75.1

35.8

69.2

37.7

50.3

50.5

75.6

52.8

83.2

43.6

75.7

45.8

36.5

49.5

52.6

96.5

69.5

36.5

50.3

71.3

28.5

45.3

48.8

71.3

47.5

24.3

36.5

Варианты № 8, 16, 24, 32

54.1

57.9

44.9

45.9

62.1

62.2

88.7

45.8

80.4

63.2

13.9

24.9

48.9

47.9

46.4

58.9

52.9

52.6

25.4

49.9

78.9

65.9

19.2

58.9

50.4

56.9

66.7

82.4

70.9

38.4

53.8

52.7

53.6

72.6

33.9

35.9

26.3

55.9

74.3

61.1

27.7

53.9

75.1

26.9

51.8

51.3

54.7

82.2

30.9

60.5

55.2

62.5

32.3

46.3

58.3

55.6

52.7

53.1

61.4

51.3

37.4

53.9

30.9

43.6

61.4

51.7

22.3

39.5

32.3

41.5

53.4

30.6

57.9

75.2

33.2

66.6

35.1

47.7

47.9

73.0

50.2

80.6

41.0

73.1

43.2

33.9

46.9

50.0

93.9

66.9

33.9

47.7

68.7

25.9

42.7

46.2

68.7

44.9

21.7

33.9

36

СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ Приложение 1. Таблица значений функции

x

F(x) = 1 òexp 2p 0

ì

-z

2 ü

ï

ï

í

 

 

ýdz

2

 

ï

ï

î

 

 

þ

x

Ф(x)

x

Ф(x)

x

Ф(x)

x

Ф(x)

x

Ф(x)

x

Ф(x)

0

0

0,47

0,1808

0,94

0,3264

1,41

0,4207

1,88

0,4699

3

0,4987

0,01

0,004

0,48

0,1844

0,95

0,3289

1,42

0,4222

1,9

0,4713

3,2

0,4993

0,02

0,008

0,49

0,1879

0,96

0,3315

1,43

0,4236

1,92

0,4726

3,4

0,4997

0,03

0,012

0,5

0,1915

0,97

0,334

1,44

0,4251

1,94

0,4738

3,6

0,4998

 

 

 

 

 

 

 

 

 

 

 

 

0,04

0,016

0,51

0,195

0,98

0,3365

1,45

0,4265

1,96

0,475

3,8

0,4999

0,05

0,0199

0,52

0,1985

0,99

0,3389

1,46

0,4279

1,98

0,4761

4

0,5

0,06

0,0239

0,53

0,2019

1

0,3413

1,47

0,4292

2

0,4772

0,5

0,07

0,0279

0,54

0,2054

1,01

0,3438

1,48

0,4306

2,02

0,4783

 

 

0,08

0,0319

0,55

0,2088

1,02

0,3461

1,49

0,4319

2,04

0,4793

 

 

0,09

0,0359

0,56

0,2123

1,03

0,3485

1,5

0,4332

2,06

0,4803

 

 

0,1

0,0398

0,57

0,2157

1,04

0,3508

1,51

0,4345

2,08

0,4812

 

 

0,11

0,0438

0,58

0,219

1,05

0,3531

1,52

0,4357

2,1

0,4821

 

 

0,12

0,0478

0,59

0,2224

1,06

0,3554

1,53

0,437

2,12

0,483

 

 

0,13

0,0517

0,6

0,2257

1,07

0,3577

1,54

0,4382

2,14

0,4838

 

 

0,14

0,0557

0,61

0,2291

1,08

0,3599

1,55

0,4394

2,16

0,4846

 

 

0,15

0,0596

0,62

0,2324

1,09

0,3621

1,56

0,4406

2,18

0,4854

 

 

0,16

0,0636

0,63

0,2357

1,1

0,3643

1,57

0,4418

2,2

0,4861

 

 

0,17

0,0675

0,64

0,2389

1,11

0,3665

1,58

0,4429

2,22

0,4868

 

 

0,18

0,0714

0,65

0,2422

1,12

0,3686

1,59

0,4441

2,24

0,4875

 

 

0,19

0,0753

0,66

0,2454

1,13

0,3708

1,6

0,4452

2,26

0,4881

 

 

0,2

0,0793

0,67

0,2486

1,14

0,3729

1,61

0,4463

2,28

0,4887

 

 

0,21

0,0832

0,68

0,2517

1,15

0,3749

1,62

0,4474

2,3

0,4893

 

 

0,22

0,0871

0,69

0,2549

1,16

0,377

1,63

0,4484

2,32

0,4898

 

 

0,23

0,091

0,7

0,258

1,17

0,379

1,64

0,4495

2,34

0,4904

 

 

0,24

0,0948

0,71

0,2611

1,18

0,381

1,65

0,4505

2,36

0,4909

 

 

0,25

0,0987

0,72

0,2642

1,19

0,383

1,66

0,4515

2,38

0,4913

 

 

0,26

0,1026

0,73

0,2673

1,2

0,3849

1,67

0,4525

2,4

0,4918

 

 

0,27

0,1064

0,74

0,2704

1,21

0,3869

1,68

0,4535

2,42

0,4922

 

 

0,28

0,1103

0,75

0,2734

1,22

0,3888

1,69

0,4545

2,44

0,4927

 

 

0,29

0,1141

0,76

0,2764

1,23

0,3907

1,7

0,4554

2,46

0,4931

 

 

0,3

0,1179

0,77

0,2794

1,24

0,3925

1,71

0,4564

2,48

0,4934

 

 

37

0,31

0,1217

0,78

0,2823

1,25

0,3944

1,72

0,4573

2,5

0,4938

 

 

0,32

0,1255

0,79

0,2852

1,26

0,3962

1,73

0,4582

2,52

0,4941

 

 

0,33

0,1293

0,8

0,2881

1,27

0,398

1,74

0,4591

2,54

0,4945

 

 

0,34

0,1331

0,81

0,291

1,28

0,3997

1,75

0,4599

2,56

0,4948

 

 

0,35

0,1368

0,82

0,2939

1,29

0,4015

1,76

0,4608

2,58

0,4951

 

 

0,36

0,1406

0,83

0,2967

1,3

0,4032

1,77

0,4616

2,6

0,4953

 

 

0,37

0,1443

0,84

0,2995

1,31

0,4049

1,78

0,4625

2,62

0,4956

 

 

0,38

0,148

0,85

0,3023

1,32

0,4066

1,79

0,4633

2,64

0,4959

 

 

0,39

0,1517

0,86

0,3051

1,33

0,4082

1,8

0,4641

2,66

0,4961

 

 

0,4

0,1554

0,87

0,3078

1,34

0,4099

1,81

0,4649

2,68

0,4963

 

 

0,41

0,1591

0,88

0,3106

1,35

0,4115

1,82

0,4656

2,7

0,4965

 

 

0,42

0,1628

0,89

0,3133

1,36

0,4131

1,83

0,4664

2,72

0,4967

 

 

0,43

0,1664

0,9

0,3159

1,37

0,4147

1,84

0,4671

2,74

0,4969

 

 

0,44

0,17

0,91

0,3186

1,38

0,4162

1,85

0,4678

2,76

0,4971

 

 

0,45

0,1736

0,92

0,3212

1,39

0,4177

1,86

0,4686

2,78

0,4973

 

 

0,46

0,1772

0,93

0,3238

1,4

0,4192

1,87

0,4693

2,8

0,4974

 

 

Приложение 2. Таблица наиболее распространенных значений Ud - критических точек стандартного нормального распределения при g = 1- 2d , a = 1- g .

g

0,9999

0,999

0,9973

0,99

0,98

0,95

0,9

0,8

a

0,0001

0,001

0,0027

0,01

0,02

0,05

0,1

0,2

d

0,00005

0,0005

0,0014

0,005

0,01

0,025

0,05

0,1

Ud

3,89069

3,29056

3

2,5758

2,3263

1,96

1,6449

1,2816

38