Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный минерально-сырьевой университет «Горный»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Метод. лаб. раб.2012 (2)(1).doc

Скачиваний:

Добавлен:

02.04.2015

Размер:

601.09 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 145 6 7 8 9 10 11 12 13 14 > Следующая >>>

Варианты заданий

№	Столбцы	Строки	№	Столбцы	Строки
1	1,2,3,4,6,7,10	1-80	8	1,2,3,4,6,7,10	21-100
2	1,2,4,6,7,10,11	11-90	9	1,2,4,6,7,10,11	31-110
3	1,2,3,6,7,10,12	21-100	10	1,2,6,7,10,11,12	41-120
4	1,2,4,6,7,10,13	31-110	11	1,2,6,7,10,11,13	1-80
5	1,2,4,6,7,10,14	41-120	12	1,2,4,6,10,11,14	11-90
6	1,2,3,6,7,10,15	1-80	13	1,2,3,6,10,11,15	21-100
7	1,2,3,4,6,10,16	11-90	14	1,2,3,6,10,11,16	31-110
			15	1,2,6,7,10,12,13	41-120

Все основные теоретические сведения по построению и использованию уравнения множественной регрессии приведены в [2]. Главные отличия данной работы – это построение нелинейной модели методом включения и построение интервального прогноза.

Множественная регрессия – уравнение связи зависимой переменной с независимыми переменными:

(6)

В зависимости от вида различают линейные и нелинейные уравнения.

Линейное уравнение множественной регрессии имеет вид:

(7)

где: - параметры уравнения

Частным видом нелинейного уравнения множественной регрессии является уравнение вида:

(8)

(9)

где: - коэффициенты регрессии.

Таким образом, в аддитивную модель входят или сами факторы или их логарифмы. Использование логарифма фактора , если факторкачественный, не имеет смысла. В качествеиспользуем единичный вектор, содержащийn единиц, где n - количество наблюдений, тогда смысл - свободный член в уравнении регрессии.

Пусть исходные данные приведены в виде таблицы содержащей данные по 114 участкам. Фрагмент таблицы приведен на рис. 1.

Уравнения множественной регрессии могут включать в качестве независимых переменных фиктивные переменные, которые используются для обозначения качественные признаков (наличие электричества, воды, канализации, и др.). Чтобы ввести такие переменные в регрессионную модель присвоим им значения «1» - если данный фактор присутствует, «0» - в противоположном случае.

Рис.1. Исходные данные

Для выявления связей между факторами и откликом проведем предварительный анализ, используя инструмент «Анализ данных» Корреляция. Результат приведен на рис.2.

Рис.2. Исходные данные

Анализ коэффициентов парной корреляции показывает, что отклик (цена) заметно коррелирует с факторами «наличие электричества», «наличие воды» и «расстояние до административного центра» (коэффициенты парной корреляции по модулю выше 0.4). Судя по вычисленному коэффициенту корреляции между ценой и фактором «наличие газа» (он практически равен нулю), связь между ними отсутствует. Фактор «наличие средств связи» заметно коррелирован с факторами «наличие электричества» и «наличие воды», что служит доводом в пользу наличия мультиколлинеарности между факторами.

Для построения модели будем использовать пошаговый метод включения, который позволяет избежать включения в уравнение малоинформативных факторов и мультиколлинеарности между ними.

Суть метода включения — в последовательном включении переменных в модель до тех пор, пока качество регрессионной модели будет повышаться. Первыми включаются в регрессионное уравнение факторы, имеющие относительно исследуемого показателя большее значение коэффициента корреляции.

Схема применения этого метода включения для линейной модели подробно описана в [2]. В отличие от чисто линейной модели на каждом шаге необходимо пытаться включить в уравнение не только сам фактор, но и его логарифм (для факторов, не являющихся качественными переменными).

Пусть k – номер шага. На k-м шаге (k=1) с помощью табличной функции ЛИНЕЙН( ) найдем наиболее информативную переменную среди и . Методом перебора устанавливаем, что это (рис. 3).

Рис. 3.

2-й шаг (k=2). Среди всевозможных пар (,), и (,) выбирается наиболее информативная пара, путем последовательного применения табличной функции ЛИНЕЙН к различным парам.

Анализируя R², приходим к выводу, что наиболее информативной парой является пара (,) (рис. 4).

Рис. 4

С включением коэффициент детерминации существенно вырос, следовательно, это правильное решение.

3-й шаг (k=3). Среди всевозможных троек (,,), и (,,), выбирается наиболее информативная (в смыслеR²) тройка. Последовательно применяя табличную функцию ЛИНЕЙН к различным тройкам, приходим к выводу, что наиболее информативной тройкой является (,,) (рис.5).

С включением x₂коэффициент детерминации существенно вырос, следовательно, его включение оправдано без анализа R²_adj.

4-й шаг (k=4). Среди всевозможных четвёрок (,,,) и (,,,), ищется наиболее информативная, путем последовательного применения табличной функции ЛИНЕЙН к различным четвёркам.

Наиболее информативной четвёркой является (,,,)(рис. 6-7).

Рис. 5

Рис. 6

С включением ln(x₁₀)коэффициент детерминации R²существенно вырос, с 0,717 до 0,73, следовательно, его включение оправдано без анализа R²_adj.

5-й шаг (k=5). При добавлении пятой переменной в уравнение регрессии среди всевозможных комбинаций (х₁, ln(x₆), х₂, ln(x₁₀), x_j) и (х₁, ln(x₆), х₂, ln(x₁₀), ln(x_j)), не удалось найти такую, которая существенно улучшает модель.

Поэтому, более подробно исследуем уравнение, полученное после 4-х шагов.

, (10)

_.Рис. 7

(11)

Для исследования этой модели, применив инструмент “Регрессия” надстройки «Пакет Анализа» MS Excel (рис. 8). Коэффициент детерминации R²равен 0,732. Это значение показывает, что 73,2% вариации цены объясняется этим уравнением. Высокое качество уравнения, также подтверждается значимостью уравнения в целом (значимость F существенно ниже уровня значимости в 5%). На рис. 8-9 представлен фрагмент отчёта регрессии по четырем указанным факторам.

В уравнении (11) все коэффициенты значимы, на уровне значимости 5%. Необходимо заметить, что коэффициент при x₁₀ наименее значим (р-значение равно 1,7%).

Проверка качества уравнения

Для проверки адекватности уравнения необходимо проверить выполнение условий Гаусса-Маркова.

Проверим однородность (гомоскедастичность) остатков с помощью метода Гольдфельда-Квандта (Goldfeld-Quandt).

Основная идея теста Гольдфельда-Квандта состоит в следующем:

упорядочение n наблюдений по возрастанию фактора;
исключение из рассмотрения C центральных наблюдений; при этом , где– число оцениваемых параметров, для нашей моделиравно 4;
разделение совокупности из (n-C) наблюдений на две группы (соответственно с малыми и большими значениями Х) и определение по каждой группе уравнений регрессии;
определение остаточной суммы квадратов для первой (S₁) и второй (S₂) групп и их отношения F=S₁/S₂, если S₁>S₂ или

F= S₂/ S₁, если S₁<S₂.

Рис. 8. Фрагмент отчёта MS Excel “Регрессия”. Начало

Рис. 9. Фрагмент отчёта MS Excel “Регрессия”. Окончание

При выполнении нулевой гипотезы о гомоскедастичности отношение F будет удовлетворять F-критерию со степенями свободы для каждой остаточной суммы квадратов.

Эту операцию необходимо проверить по каждому из факторов. Выполним это для фактора . Для этого скопируем на другой лист данные, содержащие факторы, входящие в уравнение и столбец, содержащий остатки, вместе с заголовками столбцов. После этого, упорядочиваем данные по величине. В качестве величины С возьмем 35 (приблизительно 30% от общего числа наблюдений), т.е. исключим 35 центральных наблюдений (рис.10). Далее первые = 40 остатков считаем первой выборкой (диапазон F2:F41), последние= 40 остатков (диапазон F76:F115), считаем второй выборкой.

Для проверки однородности остатков воспользуемся критерием Фишера для проверки равенства дисперсий рис. 11 . Результаты приведены на рис. 12. Поскольку наблюдаемое F (1,32) меньше F критического (1,70), то гипотеза о равенстве дисперсий подтверждается, таким образом, однородность остатков (гомоске-дастичности) по фактору наблюдается.

Аналогичную проверку необходимо провести для каждого из факторов!

Рис. 10. Фрагмент отчёта MS Excel . Проверка гомоскедастичности остатков по фактору . Упорядоченный массив данных по

Рис. 11. Фрагмент отчёта MS Excel. Проверка гомоскедастичности остатков по фактору . Диалоговое окно критерияF-теста

Рис. 12. Фрагмент отчёта MS Excel. Проверка гомоскедастичности остатков по фактору . Применение критерия Фишера.

<<< < Предыдущая 1 2 3 45 / 145 6 7 8 9 10 11 12 13 14 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.11.20193.57 Mб10Мет.для заочн-экон.РИО.doc
#
02.04.2015240.64 Кб27Мет.Курсовая работа.doc
#
09.12.2018172.54 Кб9метаморфические ГП.doc
#
02.04.2015107.6 Кб269Метафизические размышления (Рене Декарт).docx
#
25.08.2019803.33 Кб3метод указания по выполнению курсовой по инф.doc
#
02.04.2015601.09 Кб70Метод. лаб. раб.2012 (2)(1).doc
#
02.04.2015500.22 Кб8Метод. Менеджмент и маркетинг. Невская1.doc
#
17.09.20193.39 Mб30Метод.ВАП.Т1.doc
#
07.09.20191.1 Mб177Метод.ВАП.Т2..doc
#
02.04.2015468.99 Кб37Метод.ук.Курс.Пр. Орг.РМ, МГП, ЭГР-12.doc
#
27.09.2019531.97 Кб9Метод.ук.Курс.Пр. Орг.ЭГР-12.doc