Отчет по практике - ИУ22 - Спиридонов Д.М
..docКак видно из вышеприведенной таблицы, в ней были рассмотрены 6 показателей из базы данных, а именно население (млн. чел.), численность мужчин (тыс. чел.), общая площадь жилых помещений, численность родившихся и умерших, а также численность безработных по стране. В таблице представлены следующие характеристики – N валидные – количество (правильных) ответов, N пропущенные – количество неправильных или пропущенных ответов на данный вопрос, Среднее (арифметическое) – сумма всех значений деленное на их количество, Стд. ошибка среднего – характеристика точности, стабильности величины. Чем меньше значение стандартной ошибки, тем стабильнее величина, Медиана – среднее значение распределения, Мода – наиболее часто встречаемое значение, Стд. отклонение (от среднего) – величина, характеризующая изменчивость (равняется квадратному корню из дисперсии), Дисперсия – вспомогательная величина для стандартного отклонения, Процентили – процент распределения значений. И, если посмотреть на данную таблицу, то можно сказать о том, что средняя численность населения в стране за весь рассмотренный период лет(1980 – 2011 гг.) составила 143,46 млн. чел., из них примерно 76, 44 мужчины. При этом, средняя численность родившихся в стране все же меньше средней численности умерших, а средняя численность безработных составила и 4679,40 человек. Самая большая стандартная ошибка среднего при этом составила 82995,92 по численности умерших, также велика она и в численности родившихся 78406,68. Мода, наиболее часто встречающиеся значение, оказалась самой высокой по показателю численности родившихся в стране, но при этом минимум также составил 1266800 чел. а вот максимум составил 2782353 чел. но этот показатель, как мы видим, встречается редко по моде. Медиана - значение, которое попадает в середину наблюдений, т.е. 50-й перцентиль при разбивке на квартили, самой наибольшей наоборот оказалась по численности умерших и составила 2005304 чел. за прошедший период времени при максимуме в 2365826 чел. и минимуме в 886090 чел.. Самая большая дисперсия, мера разброса вокруг среднего значения, составила 165319764771,326 по числу умерших в период рассмотренных лет а самая маленькая в 1,817 по численности мужского населения в стране. Размах, разность между наибольшим и наименьшим значениями числовой переменной; максимум минус минимум, больше всего оказался по численности родившихся, а меньше всего по численности мужчин в стране. Сумма или итог для всех значений по всем наблюдениям, имеющим непропущенные значения, самой высокой стала для числа умерших.
Далее перейдем к просмотру описательной статистики
Описательные
|
N |
Минимум |
Максимум |
Сумма |
Среднее |
Стд. отклонение |
|
Статистика |
Статистика |
Статистика |
Статистика |
Статистика |
Стд. ошибка |
Статистика |
|
браки |
24 |
897327,00 |
1795432,00 |
31279281,00 |
1303303,3750 |
53733,84189 |
263240,98911 |
разводы |
24 |
30,54 |
69,19 |
1480,77 |
61,6988 |
2,07906 |
10,18528 |
числобольничныхучреждений |
24 |
6,20 |
12,80 |
200,60 |
8,3583 |
,44668 |
2,18829 |
числообщеобразовательныхучреждений |
24 |
48,76 |
103,80 |
1529,65 |
63,7354 |
2,83888 |
13,90759 |
численностьбезработных |
24 |
1845,00 |
8643,00 |
112305,48 |
4679,3950 |
432,53796 |
2118,99457 |
N валидных (целиком) |
24 |
|
|
|
|
|
|
По данным таблицы, наибольший минимум составляет по показателю число больничных учреждений 6,20 при максимуме 12,8, самый наибольший максимум по числу браков и составляет 1795432, при этом максимальное значение тут составило 897327, что тоже не очень мало. Если сравнить с показателем по разводам, то получится, что минимум и максимумы здесь не очень велики и составляют всего 30,54 и 69,19 соответственно. Что же касается числа безработных, то здесь сумма составила 112305,48 чел. при том что среднее составило 4679,3950, стандартная ошибка, мера того, как сильно может отличаться значение среднего от выборки к выборке, извлекаемое из одного и того же распределения; т.е. можно заключить, что два значения различаются, если отношение их разности к стандартному отклонению ( величине, характеризующей изменчивость (равняется квадратному корню из дисперсии)). меньше -2 или больше +2, составила 2118,99457.
Далее перейдем к графикам.
График №1
Изучим круговую диаграмму. На ней показано, что численность умерших и родившихся составляют приблизительно одинаковое соотношение между собой, но все же с перевесом в сторону умерших. Также видно, что число разводов по диаграмме составляет самую малую долю от всех остальных показателей и меньшую, чем число браков между людьми. При этом, как можно заметить из диаграммы, число прибывших в страну и выбывших из нее за рассмотренный период времени примерно равны, но с перевесом в сторону выбывших.
График №2
Следующий график представляет собой область, где по оси y расположена шкала населения РФ 0-150 млн. чел., а по оси x расположены 3 показателя, это общая численность населения и численность мужчин и женщин по стране (млн. чел.) за рассмотренный период времени (1980 – 2011 гг.), которые и представляют собой единую область. Как видно из графика, численность женщин превышает численность мужчин по стране. Таким образом, женщины составляют большую часть населения страны.
График №3
На следующем графике, представленном в виде линии, по оси x расположены показатели - число больничных учреждений и общая площадь жилых помещений, по оси y средние значения. Как показано на графике, линия представляет собой средние численности больничных учреждений, образовательных учреждений и площади жилых помещений по территории РФ за период 1980 – 2011 гг.
Рассмотрим одномерный дисперсионный анализ.
Одномерный дисперсионный анализ
Межгрупповые факторы |
||
|
N |
|
продолжительностьжизнилет |
30,54 |
1 |
37,88 |
1 |
|
42,93 |
1 |
|
52,53 |
1 |
|
62,34 |
1 |
|
63,32 |
1 |
|
64,40 |
1 |
|
64,52 |
1 |
|
64,70 |
1 |
|
64,85 |
1 |
|
64,95 |
1 |
|
65,00 |
1 |
|
65,20 |
1 |
|
65,23 |
1 |
|
65,27 |
1 |
|
65,30 |
1 |
|
65,34 |
1 |
|
66,60 |
1 |
|
67,51 |
1 |
|
67,61 |
1 |
|
67,88 |
1 |
|
68,75 |
1 |
|
68,93 |
1 |
|
69,19 |
1 |
|
числобольничныхучрежденийтыс |
6,20 |
2 |
6,30 |
1 |
|
6,50 |
3 |
|
6,70 |
1 |
|
6,80 |
2 |
|
7,10 |
1 |
|
7,20 |
2 |
|
7,30 |
1 |
|
7,40 |
1 |
|
7,50 |
1 |
|
9,50 |
1 |
|
9,80 |
1 |
|
10,10 |
1 |
|
10,30 |
1 |
|
10,60 |
1 |
|
10,70 |
1 |
|
12,10 |
1 |
|
12,50 |
1 |
|
12,80 |
1 |
|
числообщеобразовательныхучрежденийтыс |
48,76 |
1 |
49,40 |
1 |
|
49,98 |
1 |
|
50,10 |
1 |
|
52,12 |
1 |
|
52,40 |
1 |
|
53,43 |
1 |
|
55,10 |
1 |
|
56,67 |
1 |
|
57,30 |
1 |
|
58,90 |
1 |
|
60,30 |
1 |
|
61,33 |
1 |
|
62,50 |
1 |
|
65,55 |
1 |
|
68,10 |
1 |
|
69,45 |
1 |
|
69,70 |
1 |
|
70,00 |
1 |
|
70,20 |
1 |
|
73,21 |
1 |
|
74,80 |
1 |
|
96,55 |
1 |
|
103,80 |
1 |
В таблице межгрупповые факторы - Метка значения обозначает показатели (продолжительность жизни, численность больничных и численность общеобразовательных учреждений), по которым будет проводиться дисперсионный анализ; а N – количество респондентов.
Оценка эффектов межгрупповых факторов |
|||||
Зависимая переменная: населениемлнчел |
|||||
Иcточник |
Сумма квадратов типа III |
ст.св. |
Средний квадрат |
F |
Знч. |
Скорректированная модель |
192,058a |
23 |
8,350 |
. |
. |
Свободный член |
489436,500 |
1 |
489436,500 |
. |
. |
продолжительностьжизнилет |
,000 |
0 |
. |
. |
. |
числобольничныхучрежденийтыс |
,000 |
0 |
. |
. |
. |
числообщеобразовательныхучрежденийтыс |
,000 |
0 |
. |
. |
. |
продолжительностьжизнилет * числобольничныхучрежденийтыс |
,000 |
0 |
. |
. |
. |
продолжительностьжизнилет * числообщеобразовательныхучрежденийтыс |
,000 |
0 |
. |
. |
. |
числобольничныхучрежденийтыс * числообщеобразовательныхучрежденийтыс |
,000 |
0 |
. |
. |
. |
продолжительностьжизнилет * числобольничныхучрежденийтыс * числообщеобразовательныхучрежденийтыс |
,000 |
0 |
. |
. |
. |
Ошибка |
,000 |
0 |
. |
|
|
Всего |
494119,100 |
24 |
|
|
|
Скорректированный итог |
192,058 |
23 |
|
|
|
a. R квадрат = 1,000 (Скорректированный R квадрат = .) |
Посмотрим на таблицу оценка эффектов межгрупповых факторов Понятно, что зависимая переменная – население млн. чел. по территории РФ. По таблице можно увидеть, что 1) сумма квадратов типа III (Метод вычисления сумм квадратов сумма квадратов отклонений от среднего значений, равна 494119,100 при 0-ой ошибке и скорректированном итоге и модели (R квадрат = 1,000) равном 192,058; при этом, свободный член равен 489436,500 2) ст.св., число уровней фактора минус 1 (вспомогательная величина), равна 24, при скорректированном итоге и модели = 23 и 1-ом свободном члене, 3) Средний квадрат - отношение суммы квадратов к числу степеней свободы (вспомогательная величина) – по скорректированной модели равен 8,350 и свободный член равен 489436,500.
Теперь перейдем к графикам по одномерному дисперсионному анализу. Графики были построены по зависимой переменной общая численность населения млн. чел. и второстепенным переменным продолжительность жизни, число больничных и число общеобразовательных учреждений.
Графики профилей
График №1
По графику можно увидеть отношение среднего общей численности населения РФ (138 – 150 млн. чел.) к продолжительности жизни (30,54 – 69,19 лет). Можно сказать, что средний максимум находится в точке выше 148 млн. чел. и равен 64,85 – 64,95 лет, а средний минимум находится в точке 138 млн. чел. и составляет 30,54 лет. Самая высокая продолжительность жизни равна 69,19 при 145 млн. чел. в среднем, а самая низкая 30,54 при 138 млн. чел..
График №2
По графику можно увидеть отношение среднего общей численности населения РФ (138 – 150 млн. чел.) к числу больничных учреждений (6,20 – 12,80). Можно сказать, что средний максимум находится в точке выше 147 и равен 6,50, а средний минимум находится в точке 138 млн. чел. и составляет 12,50. Самое высокое среднее число больничных учреждений находится равно 12,80 при численности населения в 138 млн. чел., а самое низкое 6,20 при 145 млн. чел..
График №3
По графику можно увидеть отношение среднего общей численности населения РФ (138 – 150 млн. чел.) к числу общеобразовательных учреждений (48,76 – 103,80). Можно сказать, что средний максимум находится в точке выше 148 и равен 60,30 – 61,33, а средний минимум находится в точке 138 млн. чел. и составляет 103,80. Самое высокое среднее число больничных учреждений находится равно 103,80 при численности населения в 138 млн. чел., а самое низкое 48,76 при 143 млн. чел..
Рассмотрим Т – критерий
T-критерий
Статистики для одновыборочного t-критерия |
||||
|
N |
Среднее |
Стд. отклонение |
Стд. ошибка среднего |
числобольничныхучрежденийтыс |
24 |
8,3583 |
2,18829 |
,44668 |
числообщеобразовательныхучрежденийтыс |
24 |
63,7354 |
13,90759 |
2,83888 |
продолжительностьжизнилет |
24 |
61,6987 |
10,18528 |
2,07906 |
По таблице можно сказать о том, что в ней рассмотрены 3 показателя, а конкретно продолжительность жизни, число больничных и общеобразовательных учреждений. N – число резидентов (всего 24). Среднее показывает среднее значение в каждом из показателей. Стандартное отклонение характеризует отклонение от среднего, стандартная ошибка среднего показывает меру того, как сильно может отличаться значение среднего от выборки к выборке.
Одновыборочный t-критерий |
||||||
|
Проверяемое значение = 0 |
|||||
t |
ст.св. |
Значимость (2-сторонняя) |
Разность средних |
95% доверительный интервал разности средних |
||
Нижняя граница |
Верхняя граница |
|||||
числобольничныхучрежденийтыс |
18,712 |
23 |
,000 |
8,35833 |
7,4343 |
9,2824 |
числообщеобразовательныхучрежденийтыс |
22,451 |
23 |
,000 |
63,73542 |
57,8628 |
69,6081 |
продолжительностьжизнилет |
29,676 |
23 |
,000 |
61,69875 |
57,3979 |
65,9996 |
По данной таблице надо сказать, что переменная t представляет собой критерий различия средних (отличие критерия от 0 выражает различие среднего значения переменной с эталонной величиной), ст.св. – вспомогательная величина, Значимость (2-сторонняя)– статистическая значимость (не больше 0,05 считается значимым), 95% доверительный интервал разности средних – в случае t критерия относится к разности между средними значениями выборки.