Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4 часть метод.математика.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
2.43 Mб
Скачать

Уравнение линейной парной регрессии.

П усть между переменными и теоретически существует некоторая линейная зависимость. Это утверждение может основываться на том, что корреляционное поле для пар имеет, например, такой вид (рис. 2)

Как видим, в действительности между признаками и наблюдается не такая тесная связь, как предполагает функциональная зависимость.

Отдельные наблюдаемые значения, как правило, отклоняются от ожидаемой линейной зависимости под воздействием случайных факторов, которые в большинстве неизвестны. Отклонения от ожидаемой линейной формы связи могут возникнуть вследствие неправильной спецификации уравнения, т.е. еще с самого начала неправильно выбрано уравнение, которое описывает зависимость между и .

Допустим, что вид уравнения выбран правильно. Учитывая влияние на значения возмущающих случайных факторов, линейное уравнение связи и можно представить в таком виде:

,

где и - неизвестные параметры регрессии;

- случайная величина, которая характеризует отклонение от гипотетической теоретической регрессии.

В результате статистических наблюдений исследователь получает значения для независимой переменной и соответствующие значения зависимой переменной .

Следовательно, необходимо определить параметры , . Но истинные значения этих параметров получить невозможно, т.к. мы пользуемся информацией, полученной от выборки ограниченного объема. Поэтому найденные значения параметров будут лишь статистическими оценками истинных (неизвестных нам) параметров , . Если обозначить параметры , , которые получили способом обработки выборки, то модели

соответствует статистическая оценка

.

На практике чаще всего параметры , определяются методом наименьших квадратов, разработка которого принадлежит К.Гауссу и П.Лапласу.

В соответствии с этим методом уравнение линейной регрессии необходимо выбрать так, чтобы сумма квадратов отклонений наблюдаемых значений от линии регрессии была бы минимальной

Решив полученную систему относительно параметров , (см. методическое пособие, часть 2), получим

;

.

Корреляционный момент, выборочный коэффициент корреляции

Во время исследования двумерного статистического распределения выборки возникает необходимость выяснить наличие связи между признаками и , которую в статистике называют корреляционной. Для этого вычисляется эмпирический корреляционный момент по формуле

Если , то корреляционной связи между признаками и нет. Если то эта связь существует.

Т.е. корреляционный момент дает лишь ответ на вопрос: есть связь между признаками и или ее нет.

Для измерения тесноты корреляционной линейной связи вычисляется выборочный коэффициент корреляции по формуле

,

где . Чем ближе коэффициент корреляции к единице, тем корреляционная связь ближе к функциональной.

3.9. Задачи типа 441-450.

Пример. Зависимость растворимости тиосульфата от температуры представлена парным статистическим распределением выборки

33,5

37,0

41,2

46,1

50,0

52,9

56,8

64,3

69,9

0

10

20

30

40

50

60

70

80

Необходимо:

  1. Построить корреляционное поле зависимости признака от .

  2. Найти точечные статистические оценки , для параметров , парной линейной функции регрессии .

  3. Вычислить выборочный коэффициент корреляции .

  4. Построить график линии регрессии.

Р ешение. 1. Корреляционное поле зависимости признака от имеет такой вид (рис. 3). Как видим, с увеличением признака , зависимая переменная имеет тенденцию к увеличению.

Допустим, что между признаками и существует линейная функциональная зависимость

.

2. Для определения параметров , составим следующую таблицу

№ п/п

хі

уі

хі уі

1

0

33,5

0

0

1122,25

2

10

37,0

100

307

1369,00

3

20

41,2

400

824

1697,44

4

30

46,1

900

1383

2125,21

5

40

50,0

1000

2000

2500,00

6

50

52,9

2500

2645

2798,41

7

60

56,8

3600

3408

3226,24

8

70

64,3

4900

4501

4134,49

9

80

69,9

6400

5592

4886,01

Σ

360

451,7

20400

20723

23859,05

Воспользуемся формулами

Так как n = 9,

получим

Следовательно, уравнение регрессии будет таким

3. Вычислим коэффициент корреляции по формуле

Как видим, коэффициент корреляции близок по своему значению к единице, что свидетельствует о том, что зависимость между и практически линейная.

4. График парной линейной функции регрессии представлен на рис. 4. 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]