Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Отчет по практике - ИУ22 - Спиридонов Д.М

..doc
Скачиваний:
3
Добавлен:
28.09.2019
Размер:
449.02 Кб
Скачать

Как видно из вышеприведенной таблицы, в ней были рассмотрены 6 показателей из базы данных, а именно население (млн. чел.), численность мужчин (тыс. чел.), общая площадь жилых помещений, численность родившихся и умерших, а также численность безработных по стране. В таблице представлены следующие характеристики –  валидные – количество (правильных) ответов, N пропущенные – количество неправильных или пропущенных ответов на данный вопрос,  Среднее (арифметическое) – сумма всех значений деленное на их количество, Стд. ошибка среднего – характеристика точности, стабильности величины. Чем меньше значение стандартной ошибки, тем стабильнее величина, Медиана – среднее значение распределения,  Мода – наиболее часто встречаемое значение, Стд. отклонение (от среднего) – величина, характеризующая изменчивость (равняется квадратному корню из дисперсии),  Дисперсия – вспомогательная величина для стандартного отклонения,  Процентили – процент распределения значений. И, если посмотреть на данную таблицу, то можно сказать о том, что средняя численность населения в стране за весь рассмотренный период лет(1980 – 2011 гг.) составила 143,46 млн. чел., из них примерно 76, 44 мужчины. При этом, средняя численность родившихся в стране все же меньше средней численности умерших, а средняя численность безработных составила и 4679,40 человек. Самая большая стандартная ошибка среднего при этом составила 82995,92 по численности умерших, также велика она и в численности родившихся 78406,68. Мода, наиболее часто встречающиеся значение, оказалась самой высокой по показателю численности родившихся в стране, но при этом минимум также составил 1266800 чел. а вот максимум составил 2782353 чел. но этот показатель, как мы видим, встречается редко по моде. Медиана - значение, которое попадает в середину наблюдений, т.е. 50-й перцентиль при разбивке на квартили, самой наибольшей наоборот оказалась по численности умерших и составила 2005304 чел. за прошедший период времени при максимуме в 2365826 чел. и минимуме в 886090 чел.. Самая большая дисперсия, мера разброса вокруг среднего значения, составила 165319764771,326 по числу умерших в период рассмотренных лет а самая маленькая в 1,817 по численности мужского населения в стране. Размах, разность между наибольшим и наименьшим значениями числовой переменной; максимум минус минимум, больше всего оказался по численности родившихся, а меньше всего по численности мужчин в стране. Сумма или итог для всех значений по всем наблюдениям, имеющим непропущенные значения, самой высокой стала для числа умерших.

Далее перейдем к просмотру описательной статистики

Описательные

N

Минимум

Максимум

Сумма

Среднее

Стд. отклонение

Статистика

Статистика

Статистика

Статистика

Статистика

Стд. ошибка

Статистика

браки

24

897327,00

1795432,00

31279281,00

1303303,3750

53733,84189

263240,98911

разводы

24

30,54

69,19

1480,77

61,6988

2,07906

10,18528

числобольничныхучреждений

24

6,20

12,80

200,60

8,3583

,44668

2,18829

числообщеобразовательныхучреждений

24

48,76

103,80

1529,65

63,7354

2,83888

13,90759

численностьбезработных

24

1845,00

8643,00

112305,48

4679,3950

432,53796

2118,99457

N валидных (целиком)

24

По данным таблицы, наибольший минимум составляет по показателю число больничных учреждений 6,20 при максимуме 12,8, самый наибольший максимум по числу браков и составляет 1795432, при этом максимальное значение тут составило 897327, что тоже не очень мало. Если сравнить с показателем по разводам, то получится, что минимум и максимумы здесь не очень велики и составляют всего 30,54 и 69,19 соответственно. Что же касается числа безработных, то здесь сумма составила 112305,48 чел. при том что среднее составило 4679,3950, стандартная ошибка, мера того, как сильно может отличаться значение среднего от выборки к выборке, извлекаемое из одного и того же распределения; т.е. можно заключить, что два значения различаются, если отношение их разности к стандартному отклонению ( величине, характеризующей изменчивость (равняется квадратному корню из дисперсии)). меньше -2 или больше +2, составила 2118,99457.

Далее перейдем к графикам.

График №1

Изучим круговую диаграмму. На ней показано, что численность умерших и родившихся составляют приблизительно одинаковое соотношение между собой, но все же с перевесом в сторону умерших. Также видно, что число разводов по диаграмме составляет самую малую долю от всех остальных показателей и меньшую, чем число браков между людьми. При этом, как можно заметить из диаграммы, число прибывших в страну и выбывших из нее за рассмотренный период времени примерно равны, но с перевесом в сторону выбывших.

График №2

Следующий график представляет собой область, где по оси y расположена шкала населения РФ 0-150 млн. чел., а по оси x расположены 3 показателя, это общая численность населения и численность мужчин и женщин по стране (млн. чел.) за рассмотренный период времени (1980 – 2011 гг.), которые и представляют собой единую область. Как видно из графика, численность женщин превышает численность мужчин по стране. Таким образом, женщины составляют большую часть населения страны.

График №3

На следующем графике, представленном в виде линии, по оси x расположены показатели - число больничных учреждений и общая площадь жилых помещений, по оси y средние значения. Как показано на графике, линия представляет собой средние численности больничных учреждений, образовательных учреждений и площади жилых помещений по территории РФ за период 1980 – 2011 гг.

Рассмотрим одномерный дисперсионный анализ.

Одномерный дисперсионный анализ

Межгрупповые факторы

N

продолжительностьжизнилет

30,54

1

37,88

1

42,93

1

52,53

1

62,34

1

63,32

1

64,40

1

64,52

1

64,70

1

64,85

1

64,95

1

65,00

1

65,20

1

65,23

1

65,27

1

65,30

1

65,34

1

66,60

1

67,51

1

67,61

1

67,88

1

68,75

1

68,93

1

69,19

1

числобольничныхучрежденийтыс

6,20

2

6,30

1

6,50

3

6,70

1

6,80

2

7,10

1

7,20

2

7,30

1

7,40

1

7,50

1

9,50

1

9,80

1

10,10

1

10,30

1

10,60

1

10,70

1

12,10

1

12,50

1

12,80

1

числообщеобразовательныхучрежденийтыс

48,76

1

49,40

1

49,98

1

50,10

1

52,12

1

52,40

1

53,43

1

55,10

1

56,67

1

57,30

1

58,90

1

60,30

1

61,33

1

62,50

1

65,55

1

68,10

1

69,45

1

69,70

1

70,00

1

70,20

1

73,21

1

74,80

1

96,55

1

103,80

1

В таблице межгрупповые факторы - Метка значения обозначает показатели (продолжительность жизни, численность больничных и численность общеобразовательных учреждений), по которым будет проводиться дисперсионный анализ; а   N  количество респондентов.

Оценка эффектов межгрупповых факторов

Зависимая переменная: населениемлнчел

Иcточник

Сумма квадратов типа III

ст.св.

Средний квадрат

F

Знч.

Скорректированная модель

192,058a

23

8,350

.

.

Свободный член

489436,500

1

489436,500

.

.

продолжительностьжизнилет

,000

0

.

.

.

числобольничныхучрежденийтыс

,000

0

.

.

.

числообщеобразовательныхучрежденийтыс

,000

0

.

.

.

продолжительностьжизнилет * числобольничныхучрежденийтыс

,000

0

.

.

.

продолжительностьжизнилет * числообщеобразовательныхучрежденийтыс

,000

0

.

.

.

числобольничныхучрежденийтыс * числообщеобразовательныхучрежденийтыс

,000

0

.

.

.

продолжительностьжизнилет * числобольничныхучрежденийтыс * числообщеобразовательныхучрежденийтыс

,000

0

.

.

.

Ошибка

,000

0

.

Всего

494119,100

24

Скорректированный итог

192,058

23

a. R квадрат = 1,000 (Скорректированный R квадрат = .)

Посмотрим на таблицу оценка эффектов межгрупповых факторов Понятно, что зависимая переменная – население млн. чел. по территории РФ. По таблице можно увидеть, что 1) сумма квадратов типа III (Метод вычисления сумм квадратов сумма квадратов отклонений от среднего значений, равна 494119,100 при 0-ой ошибке и скорректированном итоге и модели (R квадрат = 1,000) равном 192,058; при этом, свободный член равен 489436,500 2) ст.св., число уровней фактора минус 1 (вспомогательная величина), равна 24, при скорректированном итоге и модели = 23 и 1-ом свободном члене, 3) Средний квадрат - отношение суммы квадратов к числу степеней свободы (вспомогательная величина) – по скорректированной модели равен 8,350 и свободный член равен 489436,500.

Теперь перейдем к графикам по одномерному дисперсионному анализу. Графики были построены по зависимой переменной общая численность населения млн. чел. и второстепенным переменным продолжительность жизни, число больничных и число общеобразовательных учреждений.

Графики профилей

График №1

По графику можно увидеть отношение среднего общей численности населения РФ (138 – 150 млн. чел.) к продолжительности жизни (30,54 – 69,19 лет). Можно сказать, что средний максимум находится в точке выше 148 млн. чел. и равен 64,85 – 64,95 лет, а средний минимум находится в точке 138 млн. чел. и составляет 30,54 лет. Самая высокая продолжительность жизни равна 69,19 при 145 млн. чел. в среднем, а самая низкая 30,54 при 138 млн. чел..

График №2

По графику можно увидеть отношение среднего общей численности населения РФ (138 – 150 млн. чел.) к числу больничных учреждений (6,20 – 12,80). Можно сказать, что средний максимум находится в точке выше 147 и равен 6,50, а средний минимум находится в точке 138 млн. чел. и составляет 12,50. Самое высокое среднее число больничных учреждений находится равно 12,80 при численности населения в 138 млн. чел., а самое низкое 6,20 при 145 млн. чел..

График №3

По графику можно увидеть отношение среднего общей численности населения РФ (138 – 150 млн. чел.) к числу общеобразовательных учреждений (48,76 – 103,80). Можно сказать, что средний максимум находится в точке выше 148 и равен 60,30 – 61,33, а средний минимум находится в точке 138 млн. чел. и составляет 103,80. Самое высокое среднее число больничных учреждений находится равно 103,80 при численности населения в 138 млн. чел., а самое низкое 48,76 при 143 млн. чел..

Рассмотрим Т – критерий

T-критерий

Статистики для одновыборочного t-критерия

N

Среднее

Стд. отклонение

Стд. ошибка среднего

числобольничныхучрежденийтыс

24

8,3583

2,18829

,44668

числообщеобразовательныхучрежденийтыс

24

63,7354

13,90759

2,83888

продолжительностьжизнилет

24

61,6987

10,18528

2,07906

По таблице можно сказать о том, что в ней рассмотрены 3 показателя, а конкретно продолжительность жизни, число больничных и общеобразовательных учреждений. N – число резидентов (всего 24). Среднее показывает среднее значение в каждом из показателей. Стандартное отклонение характеризует отклонение от среднего, стандартная ошибка среднего показывает меру того, как сильно может отличаться значение среднего от выборки к выборке.

Одновыборочный t-критерий

Проверяемое значение = 0

t

ст.св.

Значимость (2-сторонняя)

Разность средних

95% доверительный интервал разности средних

Нижняя граница

Верхняя граница

числобольничныхучрежденийтыс

18,712

23

,000

8,35833

7,4343

9,2824

числообщеобразовательныхучрежденийтыс

22,451

23

,000

63,73542

57,8628

69,6081

продолжительностьжизнилет

29,676

23

,000

61,69875

57,3979

65,9996

По данной таблице надо сказать, что переменная t представляет собой критерий различия средних (отличие критерия от 0 выражает различие среднего значения переменной с эталонной величиной),  ст.св. – вспомогательная величина, Значимость (2-сторонняя)– статистическая значимость (не больше 0,05 считается значимым),  95% доверительный интервал разности средних в случае t критерия относится к разности между средними значениями выборки.