Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Уровень убийств в ЮАР (Дорханов).docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
749.26 Кб
Скачать

Simple Hypothesis Test по математическому ожиданию

Далее я решил проверить гипотезу о равенстве математического ожидания распределения уровня убийств 30 с помощью Simple Hypothesis. Я получил следующие результаты проверки гипотезы:

Рис. 23 – результаты проверки гипотезы о значении математического ожидания

Т.к. наблюдаемый уровень значимости равен 0,0000<0,05, то гипотеза о равенстве математического ожидания 30 отвергается.

Кумулятивная функция распределения

Далее я построил кумулятивную функцию распределения. В результате были получены следующие функции.

Рис. 24 – график кумулятивной функции распределения уровня убийств в 1994-2013 гг.

Рис. 25 – график кумулятивной функции распределения уровня национального дохода на душу населения в 1994-2013 гг.

Рис. 26 – график кумулятивной функции распределения заболеваемости туберкулёзом в 1994-2013 гг.

Рис. 27 – график кумулятивной функции распределения уровня безработицы в 1994-2013 гг.

В принципе, результаты по вероятностям дают примерно те же данные о переменных, которые давали гистограммы частот этих переменных.

Вариационный ряд

Далее я построил вариационные ряды для каждой переменной. По умолчанию значения объединялись в 2-5 групп, в каждой не менее 2 значений. В итоге были получены следующие вариационные ряды.

Рис. 28 – вариационный ряд для переменной уровня убийств в 1994-2013 гг.

Как мы можем видеть, две группы больших значений в сумме составляют лишь чуть больше четверти (30% выборки). Большая часть значений относится к двум группам меньшего уровня убийств. Таким образом, уровень убийств был высоким лишь довольно недолгое время – чуть больше четверти всего периода (примерно 6 лет, если смотреть по графикам).

Рис. 29 – вариационный ряд для переменной национального дохода на душу населения в 1994-2013 гг.

Здесь большую часть выборки (80%) составляют малые и средние значения НД на душу населения, в то время как особо крупные составляют лишь одну пятую часть. Это говорит о том, что высокие показатели НД держатся пока сравнительно недолгое время.

Рис. 30 – вариационный ряд для переменной заболеваемости туберкулёзом в 1994-2013 гг.

Здесь две самые большие группы – это малые (в сумме 35%) и большие (в сумме 55%) значения заболеваемости, средние же составляют всего 10%, что говорит о быстром росте заболеваемости в середине рассматриваемого периода.

Рис. 31 – вариационный ряд для переменной уровня безработицы в 1994-2013 гг.

Бросается в глаза преобладание средних значений безработицы – они составляют 60% выборки. Впрочем, высокие значения тоже составляют значительную долю (35%), в то время как ниже 20% безработица держалась всего один год из двадцати исследуемых.

Тест Вальда

Данный тест проверяет гипотезу о равенстве коэффициентов регрессии. Я проверил гипотезы о равенстве каждого из коэффициентов двум другим. Результаты таковы:

Рис. 32 – результаты теста Вальда для коэффициентов при переменных gni_per_capita и tuber

Рис. 33 – результаты теста Вальда для коэффициентов при переменных tuber и unemployment

Рис. 34 – результаты теста Вальда для переменных gni_per_capita и unemployment

Как видно, во всех трёх случаях значимость нулевой гипотезы близка к нулю, поэтому я отвергаю каждую из них и принимаю альтернативные гипотезы о неравенстве трёх коэффициентов регрессии между собой.