- •Высшая математика
- •Часть 4 Методические указания
- •Содержание
- •3.5. Задачи типа 421-430. 37
- •Введение
- •1. Контрольные задания
- •2. Задачи для контрольных заданий
- •3. Краткие сведения из теории и решение типовых задач
- •3.1 Операционное исчисление
- •3.2 Решение типовых задач 391-400, 401-410
- •3.3. Основы теории вероятностей
- •Классификация событий
- •Виды случайных событий.
- •3.4. Задачи типа 411-420. Классическое определение вероятности.
- •Элементы комбинаторики.
- •I. Перестановки.
- •II. Размещения
- •III. Сочетания
- •Теоремы сложения и умножения вероятностей.
- •Условная вероятность и ее свойства
- •Повторные независимые испытания. Испытания по схеме Бернулли.
- •Непрерывная случайная величина.
- •3.6. Элементы математической статистики
- •3. 7. Задачи типа 431-440.
- •3.8. Элементы корреляционного и регрессионного анализа.
- •Уравнение линейной парной регрессии.
- •Корреляционный момент, выборочный коэффициент корреляции
- •3.9. Задачи типа 441-450.
- •4. Вопросы для подготовки к экзамену
- •Список рекомендуемой литературы
- •Приложение а
- •6.051701 «Пищевые технологии и инженерия», 6.050503 «Машиностроение»,
- •6.050702 «Электромеханика».
- •98309, Г. Керчь, Орджоникидзе, 82
Уравнение линейной парной регрессии.
П
усть
между переменными
и
теоретически существует некоторая
линейная зависимость. Это утверждение
может основываться на том, что
корреляционное поле для пар
имеет, например, такой вид (рис. 2)
Как видим, в действительности между признаками и наблюдается не такая тесная связь, как предполагает функциональная зависимость.
Отдельные наблюдаемые значения, как правило, отклоняются от ожидаемой линейной зависимости под воздействием случайных факторов, которые в большинстве неизвестны. Отклонения от ожидаемой линейной формы связи могут возникнуть вследствие неправильной спецификации уравнения, т.е. еще с самого начала неправильно выбрано уравнение, которое описывает зависимость между и .
Допустим, что вид уравнения выбран правильно. Учитывая влияние на значения возмущающих случайных факторов, линейное уравнение связи и можно представить в таком виде:
,
где
и
- неизвестные параметры регрессии;
-
случайная величина, которая характеризует
отклонение
от гипотетической теоретической
регрессии.
В результате статистических наблюдений исследователь получает значения для независимой переменной и соответствующие значения зависимой переменной .
Следовательно,
необходимо определить параметры
,
.
Но истинные значения этих параметров
получить невозможно, т.к. мы пользуемся
информацией, полученной от выборки
ограниченного объема. Поэтому найденные
значения параметров будут лишь
статистическими оценками истинных
(неизвестных нам) параметров
,
.
Если обозначить параметры
,
,
которые получили способом обработки
выборки, то модели
соответствует статистическая оценка
.
На практике чаще всего параметры , определяются методом наименьших квадратов, разработка которого принадлежит К.Гауссу и П.Лапласу.
В
соответствии с этим методом уравнение
линейной регрессии
необходимо выбрать так, чтобы сумма
квадратов отклонений наблюдаемых
значений от линии регрессии была бы
минимальной
Решив
полученную систему относительно
параметров
,
(см. методическое пособие, часть 2),
получим
;
.
Корреляционный момент, выборочный коэффициент корреляции
Во
время исследования двумерного
статистического распределения выборки
возникает необходимость выяснить
наличие связи между признаками
и
,
которую в статистике называют
корреляционной. Для этого вычисляется
эмпирический корреляционный момент
по формуле
Если
,
то корреляционной связи между признаками
и
нет. Если
то эта связь существует.
Т.е. корреляционный момент дает лишь ответ на вопрос: есть связь между признаками и или ее нет.
Для измерения тесноты корреляционной линейной связи вычисляется выборочный коэффициент корреляции по формуле
,
где
.
Чем ближе коэффициент корреляции к
единице, тем корреляционная связь ближе
к функциональной.
3.9. Задачи типа 441-450.
Пример.
Зависимость растворимости
тиосульфата от температуры
представлена парным статистическим
распределением выборки
|
33,5 |
37,0 |
41,2 |
46,1 |
50,0 |
52,9 |
56,8 |
64,3 |
69,9 |
|
0 |
10 |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
Необходимо:
Построить корреляционное поле зависимости признака от .
Найти точечные статистические оценки , для параметров , парной линейной функции регрессии
.Вычислить выборочный коэффициент корреляции .
Построить график линии регрессии.
Р
ешение.
1. Корреляционное поле зависимости
признака
от
имеет такой вид (рис. 3). Как видим, с
увеличением признака
,
зависимая переменная
имеет тенденцию к увеличению.
Допустим, что между признаками и существует линейная функциональная зависимость
.
2. Для определения параметров , составим следующую таблицу
№ п/п |
хі |
уі |
|
хі уі |
|
1 |
0 |
33,5 |
0 |
0 |
1122,25 |
2 |
10 |
37,0 |
100 |
307 |
1369,00 |
3 |
20 |
41,2 |
400 |
824 |
1697,44 |
4 |
30 |
46,1 |
900 |
1383 |
2125,21 |
5 |
40 |
50,0 |
1000 |
2000 |
2500,00 |
6 |
50 |
52,9 |
2500 |
2645 |
2798,41 |
7 |
60 |
56,8 |
3600 |
3408 |
3226,24 |
8 |
70 |
64,3 |
4900 |
4501 |
4134,49 |
9 |
80 |
69,9 |
6400 |
5592 |
4886,01 |
Σ |
360 |
451,7 |
20400 |
20723 |
23859,05 |
Воспользуемся формулами
Так
как n
= 9,
получим
Следовательно, уравнение регрессии будет таким
3. Вычислим коэффициент корреляции по формуле
Как видим, коэффициент корреляции близок по своему значению к единице, что свидетельствует о том, что зависимость между и практически линейная.
4. График парной линейной функции регрессии представлен на рис. 4.
