Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
РетингУправДанными.docx
Скачиваний:
7
Добавлен:
02.06.2015
Размер:
873.45 Кб
Скачать

Анализ данных Гипотеза 1 «Факторы, влияющие на рождаемость».

Для проверки данной гипотезы необходимо воспользоваться корреляционным анализом.

Рисунок 4 Корреляционный анализ рождаемости в Пермском Крае

Результат: на основании корреляционного анализа для Пермского Края, можно сделать вывод о том, что на уровень рождаемости в большей степени влияет количество браков, причем связь прямая, коэффициент корреляции равен 0,747. Это означает, что с увеличением количества браков растет и уровень рождаемости, с уменьшением количества браков, уровень рождаемости будет падать. Вывод является вполне логичным, так как традиционно люди, вступающие в брак, заводят детей. Также значимым фактором является уровень безработицы, коэффициент корреляции равен 0.621, связь также прямая. На самом деле, такой вывод неоднозначен, так как логичнее всего, что люди, лишившиеся работы не стремятся заводить детей. Коэффициент корреляции в случае с количеством разводов равен -0,110, это означает противоположную связь между количеством разводов и уровнем рождаемости. Также необходимо отметить слабую взаимосвязь между показателями, так как коэффициент по модулю меньше 0,3. Получается, что разводы отрицательно сказываются на рождаемости. Остальные факторы имеют промежуточные значения коэффициентов корреляции, значит, между ними все-таки существует определенная связь.

Вывод: гипотеза частично подтвердилась, а именно была доказана взаимосвязь между уровнем рождаемости и количеством браков и разводов. Относительно уровня доходов и безработицы гипотеза не подтвердилась, так как были получены коэффициенты, отражающие слабую зависимость на уровень рождаемости.

Гипотеза 2 «Факторы, влияющие на эмиграцию»

Проверим данную гипотезу на примере Республики Татарстан, используя корреляционный анализ.

Рисунок 5 Корреляционный анализ уровня эмиграции в Республике Татарстан

Результат: видим, что коэффициент корреляции между уровнем дохода и уровнем безработицы составляет 0,922, это значит сильную взаимосвязь между рассматриваемыми факторами. Это означает прямую зависимость, то есть при повышении доходов люди покидают республику. Коэффициент корреляции между количеством браков и уровнем эмиграции составляет 0,710, это означает, что при увеличении количества браков, увеличивается уровень эмиграции. Отрицательный коэффициент корреляции между количеством разводов, безработных и количеством эмигрирующих показывает противоположную, но сильную связь, так как по модулю коэффициент превосходит 0,6.

Вывод: сформулированная гипотеза, того что снижение доходов граждан и повышение уровня безработицы ведет к увеличению эмиграции не подтвердилась. В результате получилось, что при увеличении уровня доход, граждане наоборот покидают республику, а при увеличении уровня безработицы, граждане не стремятся ее покидать.

Гипотеза 3 «Прогноз уровня рождаемости и смертности»

Спрогнозируем уровень рождаемости Республики Татарстан. Для реализации этой задачи будем использовать инструменты скользящего окна, нейронной сети и прогнозирования.

Прежде чем прогнозировать с помощью нейронной сети, необходимо ее обучить с помощью скользящего окна. Зададим глубину погружения 3, а также горизонт прогноза 0. Перед этим приведем дату к такому формату, чтобы отражался только год.

Рисунок 6 Преобразование даты

Рисунок 7 Граф нейросети

Рисунок 8 Разброс значений относительно эталона

Судя по диаграмме, разброс между эталонными значениями выходного поля и значениями, рассчитанными моделью, невелик. Из этого можно сделать следующий вывод. Временной ряд хорошо укладывается в линейную модель и, следовательно, на основании этой модели нежелательно строить прогноз на будущие периоды времени.

Теперь необходимо задать период прогнозирования, допустим, он равен трем, тогда имеем следующий результат.

Рисунок 9 Результат прогноза

Результат: система спрогнозировала спад рождаемости на протяжении трех последующих лет, на 2 и 3 год прогноза ситуация резко не меняется, уровень рождаемости стабилен.

Вывод: гипотеза подтвердилась, так как по результатам прогноза виден спад рождаемости, как и предполагалось.

Спрогнозируем уровень смертности и прироста/убыли для Пермского Края, проделав аналогичные действия. Получим следующие диаграммы прогноза.

Рисунок 10 Прогноз уровня смертности и естественного прироста/убыли

Результат: Уровень смертности по прогнозу не меняется, точно также как и естественная убыль населения. Разброс значений невелик, так что прогноз можно брать во внимание.

Вывод: гипотеза не подтвердилась, так как считалось, что уровень смертности будет расти, а судя по прогнозу, он не изменится, так как и уровень естественной убыли населения.