Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МС ПМИН 13.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
8.54 Mб
Скачать

1.3.10. Оценивание тесноты корреляционной связи

Систему экспериментальных точек в прямоугольных координатах можно приблизить (аппроксимировать) той или иной линией прямой или кривой. Мы проводили приближение системы точек заданной таблицей 21 прямой линией (14), квадратной параболой (13) и экспоненциальной зависимостью (15). Возникает вопрос: какая линия лучше описывает то или иное распределение? Что взять в качестве меры тесноты приближения системы точек к той или иной линии?

Что взять в качестве меры тесноты корреляционной связи, в случае использования метода наименьших квадратов, почти очевидно. После того, как вид аппроксимирующей функции подобран, можно при выбранном виде той или иной кривой сосчитать величины сумм квадратов отклонений. И тогда, если , то система экспериментальных точек ближе примыкает к линии , чем к линии . Общей же мерой рассеяния всех точек вокруг функции является величина , где - количество точек статистического материала, - число связей, накладываемых на статистическую выборку функцией , которое равно количеству неопределенных коэффициентов, входящих в аналитическое выражение этой функции. Например, для многочленов степени k число связей .

При аппроксимировании системы точек некоторой линией, достаточно плотно прилегающей к системе экспериментальных точек, можно пойти по пути последовательного увеличения степеней аппроксимирующих полиномов. Т.е., сначала искать y в виде , потом , и далее и т.д. При этом до определенного момента дисперсия будет уменьшаться, а затем, в основном за счет уменьшения числа , станет возрастать. Степень аппроксимирующих полиномов следует увеличивать до тех пор, пока D уменьшается. Таким образом, проводя вычисления с использованием метода наименьших квадратов, мы сталкиваемся с противоречием. С одной стороны, желательно рассматривать более широкий класс функций, например многочлены с более высокой степенью. С другой стороны, такое расширение приводит к увеличению числа связей и, значит, к увеличению дисперсии D. Для того чтобы выйти из этого противоречия необходимо проводить тщательное предварительное исследование изучаемой зависимости с тем, чтобы в уравнение регрессии вошло лишь минимально необходимое число неопределенных коэффициентов. Часто удается ограничиться уравнением первой степени , накладывающим на выборку лишь две связи. В других случаях удается аппроксимировать систему точек некоторой нелинейной зависимостью, которая приводится заменой переменных к линейной зависимости и, таким образом, так же накладывает на выборку лишь две связи. В других же случаях приходится переходить к зависимостям, накладывающим на выборку большее количество связей.

П р и м е р

Оценим различные аппроксимации системы экспериментальных точек, заданной таблицей 21.

Аппроксимация прямой линией здесь дает

.

Аппроксимация параболической зависимостью имеет вид

.

Экспоненциальная зависимость имеет вид

.

Сведем вычисления в следующую таблицу 26.

Таблица 26.

п/п

1

1,7

25

16,740

22,934

23,111

68,244

4,268

3,568

2

3,4

34

52,832

46,826

46,201

354,644

164,510

148,864

3

4,0

57

65,571

60,940

58,997

73,462

15,555

3,990

4

4,1

82

67,694

63,590

61,451

204,661

338,928

422,260

5

5,3

98

93,171

101,710

100,202

23,319

13,764

4,850

724,330

537,025

583,530

Теперь ,

,

.

Таким образом, и, следовательно, лучше всех кривых приближает систему экспериментальных точек экспонента , хуже всех парабола .

49