- •Содержание
- •Введение
- •РазделI. Статистические методы обработки данных
- •Глава 1. Вариационные ряды и их характеристики
- •1.1. Первичная обработка результатов наблюдений
- •1.2. Графическое представление статистических данных
- •1.3. Расчет выборочных характеристик статистического распределения
- •1.4. Интервальные (доверительные) оценки параметров распределения
- •Контрольные вопросы
- •Глава 2. Проверка статистических гипотез
- •2.1. Построение кривой нормального распределения
- •2.2. Классический метод проверки гипотез
- •2.3. Проверка гипотез о законе распределения
- •Критерий Пирсона
- •Критерий Колмогорова
- •Контрольные вопросы
- •Глава 3. Парная регрессия и корреляция
- •3.1. Понятие функциональной, статистической и корреляционной зависимости
- •3.2. Линейная модель парной регрессии и корреляции
- •3.3. Нелинейные модели парной регрессии и корреляции
- •Контрольные вопросы
- •Глава 4. Множественная регрессия и корреляция
- •4.1.Спецификация модели. Отбор факторов при построении уравнения множественной регрессии
- •4.2. Метод наименьших квадратов (мнк). Свойства оценок на основе мнк
- •4.3. Проверка существенности факторов и показатели качества регрессии
- •Контрольные вопросы
- •Раздел II. Лабораторный практикум
- •Выполнение работы
- •Лабораторная работа № 2. Построение модели линейной регрессии (случай несгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 3. Построение уравнения модели линейной регрессии (случай сгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 4. Изучение модели нелинейной регрессии
- •Выполнение работы
- •Лабораторная работа № 5. Построение модели множественной регрессии
- •Выполнение работы
- •Лабораторная работа № 6. Прогнозирование. Анализ аддитивной модели
- •Выполнение работы
- •Варианты индивидуальных заданий Варианты заданий к лабораторной работе № 1.
- •Варианты заданий к лабораторной работе № 2.
- •Варианты заданий по лабораторной работе № 3
- •Варианты заданий по лабораторной работе № 4
- •Варианты заданий к лабораторной работе № 5.
- •Варианты заданий к лабораторной работе № 6.
- •Тестовые задания
- •Список литературы
- •Приложения
- •Статистические методы обработки данных
- •Библиотечно-издательский комплекс
- •625000, Тюмень, ул. Володарского, 38. Типография библиотечно-издательского комплекса.
- •625039, Тюмень, ул. Киевская, 52.
Лабораторная работа № 5. Построение модели множественной регрессии
Цель работы: овладеть способами построения модели множественной линейной регрессии и выработать умения и навыки нахождения параметров уравнения, оценки надежности уравнения регрессии и его параметров, проведения экономической интерпретации полученных результатов.
Содержание работы: на основании опытных данных требуется
Рассмотреть результативные и факторные признаки и определить форму связи между ними. Построить все корреляционные поля (попарно). И на основании этого записать уравнение множественной регрессии.
Исключить лишние факторы, обосновав математически данный выбор.
Измерить тесноту связи между факторами.
Используя метод наименьших квадратов оценить уравнение регрессии.
Проверить на адекватность уравнение регрессии используя следующие способы:
– используя критерий Фишера;
– с помощью коэффициента детерминации;
– используя среднюю ошибку аппроксимации.
Дать экономическую интерпретацию найденных оценок уравнения регрессии.
Задача.
Исходные данные для признаков
,
,
,
– для различных нефтегазодобывающих
управлений — приведены в табл. 2. 21.
Таблица 2.21
Признаки |
Значение признаков на различных НГДУ |
|||||||||
|
0,92 |
0,93 |
0,89 |
0,90 |
0,90 |
0,89 |
0,92 |
0,91 |
0,93 |
0,89 |
|
45 |
47 |
42 |
46 |
43 |
45 |
48 |
46 |
48 |
44 |
|
69 |
71 |
64 |
66 |
65 |
63 |
68 |
66 |
69 |
65 |
|
35 |
36 |
31 |
33 |
34 |
32 |
38 |
34 |
37 |
33 |
В таблице обозначено: – коэффициент эксплуатации скважин; – дебит скважин (тн/сут.); – уровень автоматизации труда (%); – производительность труда (тн/чел.).
Выполнение работы
Определим форму связи. Для чего строим корреляционные поля, по которым можно предположить, что зависимость между факторными признаками , , и результативным признаком может носить линейный характер. Решим вопрос о включении факторных признаков , , в уравнение линейной регрессии. Найдем коэффициенты парной корреляции. Предварительно составим расчетную табл. 2.22. Пользуясь табл. 2.22 и формулами находим:
,
.
,
.
,
.
,
.
.
Т
аблица
2.22
Коэффициенты парной корреляции равны соответственно:
,
.
По
найденным коэффициентам парной корреляции
видно, что сильно коррелируют между
собой факторы
или
.
Для решения вопроса о том, какой из
факторов
или
следует исключить из модели множественной
линейной регрессии, вычислим коэффициенты
парной корреляции
и
:
,
.
Так
как
,то
между признаками
и
связь сильнее, чем между
и
.
Этот факт подтверждается путем вычисления
коэффициентов частной корреляции
и
:
,
.
Поэтому из модели множественной линейной регрессии исключаем фактор . Тогда в модель будут включены факторы и и уравнение регрессии запишется в виде:
.
Включение
фактора
в модель обосновано значимостью
коэффициента парной корреляции
:
.
Для выяснения вопроса о силе линейной связи между факторами, включенными в модель, вычисляем множественный коэффициент корреляции R:
.
Так как в нашем примере объем выборки небольшой ( ), то произведем корректировку R:
.
Проверяем
значимость
по критерию Стьюдента. Вычисляем
среднеквадратическую ошибку
:
,
Вычисляем статистику (ф.1.102):
По
таблице критических точек распределения
Стьюдента при уровне значимости
с числом степеней свободы
находим
(приложение 5). Так как
,
то делаем вывод, что
значим.
Для
нахождения оценок
,
,
уравнения регрессии
решаем систему нормальных уравнений:
Решив
эту систему, получаем
,
,
.
Тогда уравнение регрессии, устанавливающее
зависимость производительности труда
от коэффициента эксплуатации
и дебита скважин
запишется в виде
.
Проверяем
адекватность уравнения регрессии.
Используем коэффициент детерминации
,
полагая
.
Для полученной модели
.
Это означает, что полученная модель
приблизительно на 66% объясняет изменение
производительности труда в зависимости
от изменения включенных в модель факторов
и
,
что является не плохим показателем.
Проведем
проверку модели на адекватность по
критерию Фишера – Снедекора. Найдем
статистику
по формуле (ф.1.78), полагая в ней
:
.
По
таблице критических точек распределения
Фишера — Снедекора при уровне значимости
и числах степеней свободы
,
(p — число факторов
,
включенных в модель, n
— объем выборки) находим
.
Так как
,
то найденное уравнение регрессии,
устанавливающее зависимость
производительности труда на десяти
нефтегазодобывающих управлениях (НГДУ)
от коэффициента эксплуатации скважин
и дебита скважин
,
значимо описывает опытные данные и
может быть принято для руководства.
Оценим
адекватность уравнения регрессии по
средней ошибке аппроксимации
,
которую вычислим по формуле (ф.1.63):
.
Для нахождения суммы составляем расчетную табл. 2.23.
Таблица 2.23
|
|||
Y |
|
|
|
35 |
35,2 |
0,2 |
0,000114 |
36 |
36,8 |
0,8 |
0,017778 |
31 |
31,5 |
0,5 |
0,005952 |
33 |
33,8 |
0,8 |
0,019394 |
34 |
32,7 |
1,3 |
0,049706 |
32 |
32,6 |
0,6 |
0,008 |
38 |
36,3 |
1,7 |
0,076053 |
34 |
34,7 |
0,7 |
0,014412 |
37 |
37,1 |
0,1 |
0,00027 |
33 |
32,2 |
0,8 |
0,019394 |
|
|
|
0,211073 |
По данной таблице находим:
.
Среднеквадратическая ошибка небольшая, что дает основание считать, что построенная модель адекватно описывает опытные данные.
Итак, все три метода проверки модели на адекватность подтвердили гипотезу о том, что уравнение регрессии в целом статистически значимо и хорошо соответствует данным наблюдений.
Дадим экономическую интерпретацию найденных коэффициентов уравнения регрессии. Значение свободного члена характеризует влияние неучтенных в модели факторов, в частности фактора (уровень автоматизации труда). Знак минус говорит о том, что отсутствие этого фактора в модели отрицательно сказывается на повышении производительности труда. Величина коэффициента показывает, что при увеличении коэффициента эксплуатации на 0,01 производительность труда увеличивается в среднем на 86,3271 тн/чел. Коэффициент показывает, что при увеличении дебита скважин на одну тонну производительность труда увеличивается в среднем на 0,360611 тн/чел.
