Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая статистика.doc
Скачиваний:
0
Добавлен:
06.12.2019
Размер:
1.72 Mб
Скачать

3. Методические указания к выполнению контрольной работы Типовой пример

Важным направлением развития межрегиональных сопоставлений выступает построение интегральных показателей уровня жизни населения. Программой развития ООН разработан интегральный показатель – Индекс развития Человеческого Потенциала (ИРЧП). Данный показатель включает три компоненты уровня жизни: долголетие, образование, доход.

В таблице 1 представлены статистические данные (N=100), характеризующие компоненты ИРЧП по областям и краям Российской Федерации. X – материальный доход за месяц в условных единицах, Y – продолжительность жизни.

Таблица 1

Статистические данные типового примера

N

1

2

3

4

5

6

7

8

9

10

11

12

X

220

240

240

230

240

230

225

240

240

230

235

240

Y

39

79

69

49

79

59

39

59

79

59

59

59

N

13

14

15

16

17

18

19

20

21

22

23

24

X

235

240

230

235

230

240

230

230

240

225

230

230

Y

59

79

59

59

69

59

59

59

59

49

59

59

N

25

26

27

28

29

30

31

32

33

34

35

36

X

240

225

230

240

230

240

235

225

235

230

230

235

Y

69

49

49

59

59

69

79

39

69

69

59

69

N

37

38

39

40

41

42

43

44

45

46

47

48

X

225

230

220

230

230

225

230

240

230

225

230

235

Y

49

59

39

49

59

39

49

59

69

49

59

69

N

49

50

51

52

53

54

55

56

57

58

59

60

X

235

230

230

230

230

235

240

230

240

230

235

230

Y

69

49

59

59

49

69

39

79

59

59

59

69

N

61

62

63

64

65

66

67

68

69

70

71

72

X

230

235

225

230

240

230

235

225

230

230

235

230

Y

59

69

49

49

59

59

69

49

59

59

69

49

N

73

74

75

76

77

78

79

80

81

82

83

84

X

225

235

230

230

240

230

230

240

230

230

230

230

Y

39

69

59

59

69

69

59

59

59

59

59

59

N

85

86

87

88

89

90

91

92

93

94

95

96

X

235

240

225

230

240

220

230

230

230

225

230

230

Y

69

69

49

59

59

39

59

49

59

49

59

49

N

97

98

99

100

X

235

220

230

225

Y

69

39

59

39

Сравнение индексов долголетия, образованности и уровня жизни на внутрироссийском уровне даёт возможность уточнить приоритетность соответствующих в стране программ человеческого развития, а также определить желательные масштабы их финансирования на национальном и региональном уровнях. Для этого требуется провести анализ данных Таблицы 1:

  1. Построить эмпирическую функцию распределения, полигон и гистограмму для случайной величины Х;

  2. Построить точечные и интервальные оценки для математического ожидания и дисперсии генеральной совокупности Х;

  3. Сделать статистическую проверку гипотезы о нормальном законе распределения случайной величины Х;

  4. Составить корреляционную таблицу по сгруппированным данным;

  5. Найти линейную корреляционную модель зависимости дохода (Х) от фактора долголетия (Y);

  6. Оценить тесноту корреляционной связи;

  7. Оценить степень близости модели к статистическим данным;

  8. Вычислить прогнозные значения фактора Х и точность прогноза для значений фактора, равных и .

Решение.

Составим ранжированный ряд для случайной величины Х.

Таблица 2

Ранжированный ряд случайной величины Х

N

1

2

3

4

5

6

7

8

9

10

11

12

X

220

220

220

220

225

225

225

225

225

225

225

225

Y

39

39

39

39

39

39

39

39

39

39

49

49

Продолжение таблицы 2

N

13

14

15

16

17

18

19

20

21

22

23

24

X

225

225

225

225

225

225

230

230

230

230

230

230

Y

49

49

49

49

49

49

49

49

49

49

49

49

N

25

26

27

28

29

30

31

32

33

34

35

36

X

230

230

230

230

230

230

230

230

230

230

230

230

Y

49

49

49

49

59

59

59

59

59

59

59

59

N

37

38

39

40

41

42

43

44

45

46

47

48

X

230

230

230

230

230

230

230

230

230

230

230

230

Y

59

59

59

59

59

59

59

59

59

59

59

59

N

49

50

51

52

53

54

55

56

57

58

59

60

X

230

230

230

230

230

230

230

230

230

230

230

230

Y

59

59

59

59

59

59

59

59

59

59

59

59

N

61

62

63

64

65

66

67

68

69

70

71

72

X

230

230

230

230

235

235

235

235

235

235

235

235

Y

69

69

69

69

59

59

59

69

69

69

69

69

N

73

74

75

76

77

78

79

80

81

82

83

84

X

235

235

235

235

235

235

235

235

240

240

240

240

Y

69

69

69

69

69

69

69

79

59

59

59

59

N

85

86

87

88

89

90

91

92

93

94

95

96

X

240

240

240

240

240

240

240

240

240

240

240

240

N

97

98

99

100

X

240

240

240

240

Y

79

79

79

79

Для удобства расчётов составим новую Таблицу 3, в которой отразим частоты появления случайных величин и относительные частоты .

Таблица 3

Дискретный вариационный ряд

1

2

3

4

5

220

225

230

235

240

4

14

46

16

20

В данном примере случайная величина Х распределена с шагом h=5.

Рассчитаем эмпирическую функцию распределения в виде «нарастающей относительной частоты» (Таблица 4).

Таблица 4

Расчёт эмпирической функции распределения

0

220

225<

+

230<

235<

Построим эмпирическую функцию распределения рис.1

Рис.1

Экспериментальные данные, представленные в виде вариационного ряда можно представить графически в виде ломаной линии (полигона), связывающей на плоскости точки с координатами ( ), где - относительная частота (рис. 2). На этом же рисунке отобразим пунктирной линией выравнивающие (теоретические частоты) частоты.

Рис.2

Предположим, что случайная величина Х распределена нормально, тогда выравнивающие частоты могут быть найдены по формуле:

, (57)

где n – число испытаний,

h – длина частичного интервала,

- выборочное среднее квадратическое отклонение,

( - середина -го частичного интервала),

. (58)

Результаты вычислений отобразим в Таблице 5.

Таблица 5

Расчёт выравнивающих частот

220

225

230

235

240

-11,7

-6,7

-1,7

3,3

8,3

-2,18

-1,25

-0,32

0,62

1,55

0,04

0,18

0,38

0,33

0,12

3,74

16,82

35,51

30,84

11,22

4

17

36

31

12

0,04

0,17

0,36

0,31

0,12

Сравнение графиков наглядно показывает близость выравнивающих частот к наблюдаемым и подтверждает правильность допущения о том, что обследуемый признак распределён нормально.

2) Найдём числовые характеристики вариационного ряда, используя Таблицу 3.

Средняя арифметическая (9):

Средняя гармоническая (10):

Средняя квадратическая (11):

Средняя геометрическая (12):

Сделаем проверку по формуле (13):

Выборочная дисперсия (14):

Среднее квадратическое отклонение (15):

Выборочная мода:

Выборочная медиана:

Коэффициент вариации (16):

Размах варьирования (17):

R=240-220=20

Среднее абсолютное отклонение (18):

«Исправленные» дисперсия и среднеквадратическое отклонение (19):

, .

Доверительный интервал для оценки математического ожидания с надёжностью 0,95 найдём по формуле (21). Из соотношения находим значение функции Лапласа: . По таблице значений функции Лапласа (Приложение 4) находим z=1,96. Таким образом,

230,65<a<232,75

Доверительный интервал для оценки среднего квадратического отклонения случайной величины находим по формуле (22). На основании данных значений и n=100 по таблице (Приложение 5) находим значение q=0,143. Таким образом,

4,71<

Моменты k-го порядка (23):

Асимметрия (24):

Оценка степени существенности (25):

отношение <3, значит асимметрия не существенна.

Эксцесс (26):

3)Проведём статистическую проверку гипотезы о нормальном распределении. Нормальный закон распределения имеет два параметра (r=2): математическое ожидание и среднее квадратическое отклонение.

Для расчёта теоретических частот воспользуемся табличными значениями функции Лапласа Алгоритм вычисления состоит в следующем:

- по нормированным значениям случайной величины Z находим значения , а затем :

=0,5+ .

Например,

; ; ;

;

  • находим ;

  • находим и если некоторое то соответствующие группы объединяются с соседними.

Результаты вычисления и приведены в таблице №6.

По формуле

(59)

можно сделать проверку расчётов.

По таблице Приложения 6 находим по схеме: для уровня значимости 0,05 и числа степеней свободы =6,0. Следовательно, критическая область – (6; ). Величина =44,21 входит в критическую область, поэтому гипотеза о том, что случайная величина Х подчинена нормальному закону распределения отвергается.

При =4,61. Критическая область – (4,61; ). Величина =44,21 также входит в критическую область и гипотеза о нормальном законе распределения величины Х отвергается.

При =9,2. Критическая область – (9,2; ).

Величина =44,21 также входит в критическую область и гипотеза о нормальном законе распределения величины Х отвергается.

Таблица 6

Определение

i

1

220

4

-0,485

0,015

0,106

0,091

9,1

2,86

2

225

14

-0,394

0,106

0,375

0,269

26,9

6,17

3

230

46

-0,126

0,375

0,729

0,355

35,5

3,13

4

235

16

0,229

0,729

0,938

0,209

20,9

1,15

5

240

20

0,438

0,938

1,0

0,062

6,2

30,9

Данные Таблицы 2 сгруппируем в корреляционную Таблицу 7.

Таблица 7

Корреляционная таблица

Y\X

220

225

230

235

240

39

4

6

-

-

-

10

49

-

8

10

-

-

18

59

-

-

32

3

9

44

69

-

-

4

12

6

22

79

-

-

-

1

5

6

4

14

46

16

20

100

Находим средние значения по формулам (36), (37), (38), (39):

Найденные результаты подставляем в (34) и (35):

Используя формулы (40), (41), получим:

Вычисляем выборочный коэффициент корреляции (42):

так как 0,7< <0,9, то корреляционная связь между X и Y высокая.

Находим уравнение регрессии Y на Х (43):

Находим уравнение регрессии X на Y (44):

Вычислим корреляционное отношение (45). Для этого сначала по корреляционной модели находим значение для исходных значений фактора .

Далее

Учитывая найденные значения, получим:

0,76<0,763

Вычисляем среднюю относительную ошибку аппроксимации (46):

1

39

|39-42,2|=3,2

0,082

2

49

|49-49,45|=0,45

0,009

3

59

|59-56,7|=2,3

0,04

4

69

|69-63,95|=5,05

0,073

5

79

|79-71,2|=7,8

0,099

Так как , то модель является достаточно адекватной реальной зависимости Y от X.

8) При уровне значимости по таблице критических значений статистики находим, что при k=n-2=100-2=98

Затем найдём среднее квадратическое отклонение результирующего признака от выровненных значений (48):

Теперь найдём прогнозное значение для Х=245 и Х=250

-прогнозные значения.

Оценим точность по формуле(56):

f(245)=78,45 ,

f(250)=85,7

Таким образом, Р(77,26<f(245)<79,64)=95%,

P(84,08<f(250)<87,32)=95%.

Правила выполнения работы

Выполнение контрольной работы является важным этапом подготовки к сдаче экзамена по дисциплине «Математика».

Студент должен выполнить контрольную работу по варианту, номер которого равен остатку от деления шифра (номера зачётной книжки) на 20. Так, например, если шифр 1417, то остаток от деления этого числа на 20 равен 17 и, значит, следует решать 17-й вариант; если шифр 806, то остаток равен 6, и следует решать 6-й вариант. Если остаток равен нулю, то нужно решать 20-й вариант.

Контрольная работа должна быть выполнена до наступления зачётно-экзаменационной сессии. Контрольная работа нужно сдать на кафедру высшей математики, расположенной по адресу: СПб, ул. Прилукская, д.3, ауд. 415, тел. 767-19-02.

На экзамене необходимо иметь зачтённую контрольную работу.