- •Содержание
- •Введение
- •РазделI. Статистические методы обработки данных
- •Глава 1. Вариационные ряды и их характеристики
- •1.1. Первичная обработка результатов наблюдений
- •1.2. Графическое представление статистических данных
- •1.3. Расчет выборочных характеристик статистического распределения
- •1.4. Интервальные (доверительные) оценки параметров распределения
- •Контрольные вопросы
- •Глава 2. Проверка статистических гипотез
- •2.1. Построение кривой нормального распределения
- •2.2. Классический метод проверки гипотез
- •2.3. Проверка гипотез о законе распределения
- •Критерий Пирсона
- •Критерий Колмогорова
- •Контрольные вопросы
- •Глава 3. Парная регрессия и корреляция
- •3.1. Понятие функциональной, статистической и корреляционной зависимости
- •3.2. Линейная модель парной регрессии и корреляции
- •3.3. Нелинейные модели парной регрессии и корреляции
- •Контрольные вопросы
- •Глава 4. Множественная регрессия и корреляция
- •4.1.Спецификация модели. Отбор факторов при построении уравнения множественной регрессии
- •4.2. Метод наименьших квадратов (мнк). Свойства оценок на основе мнк
- •4.3. Проверка существенности факторов и показатели качества регрессии
- •Контрольные вопросы
- •Раздел II. Лабораторный практикум
- •Выполнение работы
- •Лабораторная работа № 2. Построение модели линейной регрессии (случай несгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 3. Построение уравнения модели линейной регрессии (случай сгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 4. Изучение модели нелинейной регрессии
- •Выполнение работы
- •Лабораторная работа № 5. Построение модели множественной регрессии
- •Выполнение работы
- •Лабораторная работа № 6. Прогнозирование. Анализ аддитивной модели
- •Выполнение работы
- •Варианты индивидуальных заданий Варианты заданий к лабораторной работе № 1.
- •Варианты заданий к лабораторной работе № 2.
- •Варианты заданий по лабораторной работе № 3
- •Варианты заданий по лабораторной работе № 4
- •Варианты заданий к лабораторной работе № 5.
- •Варианты заданий к лабораторной работе № 6.
- •Тестовые задания
- •Список литературы
- •Приложения
- •Статистические методы обработки данных
- •Библиотечно-издательский комплекс
- •625000, Тюмень, ул. Володарского, 38. Типография библиотечно-издательского комплекса.
- •625039, Тюмень, ул. Киевская, 52.
Выполнение работы
Пусть признак X характеризует изменение забойного давления, а признак Yизменение объема притока нефти. Используя данные таблицы, строим корреляционное поле.
Рис. 2.6. Корреляционное поле
Проведя линию тренда (черная линия), видим, что число точек, расположенных над и под ней, практически одинаково, причем расстояния этих точек до линии тренда одинаковые. Это дает основание предположить наличие линейной зависимости между признаками Xи Y. Для подтверждения этой гипотезы перейдем от данного распределения к новому, найдя для каждого значения признак X условное среднее признака Y по формуле:
.
При
,
.
При
,
.
При
,
При
,
При
,
При
,
При
,
При
,
.
При
,
.
На
корреляционном поле строим точки с
координатами
(рис. 2.7.).
Рис. 2.7. Корреляционное поле
Из
рис. 2.7. видно, что отклонения точек от
построенной прямой незначительны.
Следовательно, связь между признаками
и
может носить линейный характер. Составим
уравнения линий регрессий y
на x по методу наименьших
квадратов и через коэффициент линейной
корреляции
.
Применим
метод наименьших квадратов к
нахождению коэффициентов
и
уравнения линейной регрессии
.
Решаем систему нормальных уравнений
(ф.1.59, 1.60):
Для нахождения сумм, входящих в систему, составляем табл. 2.13.
Таблица 2.13
x y |
125 |
135 |
145 |
155 |
165 |
175 |
185 |
195 |
205 |
ny |
nyy |
11 |
3 |
4 |
|
|
|
|
|
|
|
7 |
77 |
12 |
|
5 |
4 |
|
|
|
|
|
|
9 |
108 |
13 |
|
|
3 |
5 |
|
|
|
|
|
8 |
104 |
14 |
|
|
5 |
6 |
|
|
|
|
|
11 |
154 |
15 |
|
|
|
2 |
18 |
|
|
|
|
20 |
300 |
16 |
|
|
|
|
4 |
14 |
|
|
|
18 |
288 |
17 |
|
|
|
|
|
7 |
2 |
|
|
9 |
153 |
18 |
|
|
|
|
|
|
4 |
6 |
|
10 |
180 |
19 |
|
|
|
|
|
|
|
2 |
6 |
8 |
152 |
nx |
3 |
9 |
12 |
13 |
22 |
21 |
6 |
8 |
6 |
100 |
1516 |
nxx |
375 |
1215 |
1740 |
2015 |
3630 |
3675 |
1110 |
1560 |
1230 |
16550 |
|
nxx2 |
46875 |
164025 |
252300 |
312325 |
598950 |
643125 |
205350 |
304200 |
252150 |
2779300 |
|
nxyxy |
4125 |
14040 |
22765 |
27745 |
55110 |
60025 |
19610 |
28470 |
23370 |
255260 |
|
Полученная из табл. 2.13 система
имеет решение (а0, а1) = (-2,7645; 0,108). Тогда уравнение линейной регрессии запишется в виде:
Найдем уравнение линейной регрессии y на x по формуле, используя коэффициент линейной корреляции:
.
Так
как данные выборки для признаков X
и Y заданы в виде
корреляционной таблицы и объем выборки
,
то для нахождения величин, входящих в
уравнение регрессии, переходим к
вспомогательному распределению с
условными вариантами
и
.
По корреляционной табл. 2.12 находим
наибольшую частоту совместного появления
признаков X и Y:
.
Тогда
,
,
,
.
Составляем корреляционную табл. 2.14 в
условных вариантах.
Таблица 2.14
u v |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
nv |
-4 |
3 |
4 |
|
|
|
|
|
|
|
7 |
-3 |
|
5 |
4 |
|
|
|
|
|
|
9 |
-2 |
|
|
3 |
5 |
|
|
|
|
|
8 |
-1 |
|
|
5 |
6 |
|
|
|
|
|
11 |
0 |
|
|
|
2 |
18 |
|
|
|
|
20 |
1 |
|
|
|
|
4 |
14 |
|
|
|
18 |
2 |
|
|
|
|
|
7 |
2 |
|
|
9 |
3 |
|
|
|
|
|
|
4 |
6 |
|
10 |
4 |
|
|
|
|
|
|
|
2 |
6 |
8 |
nu |
3 |
9 |
12 |
13 |
22 |
21 |
6 |
8 |
6 |
100 |
По таблице находим:
,
,
,
.
Тогда
,
.
Для
нахождения суммы
составляем табл. 2.15.
Таблица 2.15
u v |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
nv |
-4 |
16 |
12 |
|
|
|
|
|
|
|
96 |
-3 |
|
9 |
6 |
|
|
|
|
|
|
69 |
-2 |
|
|
4 |
2 |
|
|
|
|
|
22 |
-1 |
|
|
2 |
1 |
|
|
|
|
|
16 |
0 |
|
|
|
0 |
|
|
|
|
|
0 |
1 |
|
|
|
|
|
1 |
|
|
|
14 |
2 |
|
|
|
|
|
2 |
4 |
|
|
22 |
3 |
|
|
|
|
|
|
6 |
9 |
|
78 |
4 |
|
|
|
|
|
|
|
12 |
16 |
120 |
nx |
48 |
93 |
46 |
16 |
0 |
28 |
32 |
78 |
96 |
437 |
Тогда, согласно формулам вычисления коэффициента корреляции находим:
,
,
,
,
.
Отсюда следуют уравнение линии регрессии y на х:
,
или
,
и уравнение линии регрессии x на y:
,
или
.
Проверяем тесноту связи между признаками X и Y. Для этого, используя критерий Стьюдента, вычисляем статистику:
.
При
уровне значимости
и числе степеней свободы
находим по таблице распределения
Стьюдента
.
Так как
,
то выборочный коэффициент линейной
корреляции
значимо отличается от нуля. Следовательно,
можно считать, что изменение притока
нефти и изменение забойного давления
связаны линейной корреляционной
зависимостью. Дадим интерпретацию,
например, уравнению регрессии y
на x. Из уравнения
регрессии видно, что при изменении
забойного давления, например, на 10 атм
на забое, изменение притока составит
.
Это результат воздействия отклонений
при изменении забойного давления.
Фактически изменение притока может
составить
,
что является результатом воздействия
неучтенных в модели факторов, не зависящих
от давления. Проверим полученное
уравнение регрессии y
на x на адекватность
по критерию Фишера-Снедекора. Вычислим
статистику:
.
где
– остаточная сумма квадратов,
характеризующая влияние неучтенных в
модели факторов, определяемая по формуле:
,
где
– сумма квадратов отклонений значений
от средней
,
– сумма квадратов отклонений условных
средних
от средней
.
Составим
расчетные табл. 2.16 и 2.17. Находим
.
По условию
,
.
Тогда
.
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
При
уровне значимости
и числах степеней свободы
,
по таблице критических точек распределения
Фишера-Снедекора находим
.
Так как
,
то модель линейной регрессии
согласуется с опытными данными.
