
- •Курс «Математическая статистика»
- •Генеральная и выборочная совокупности
- •Статистический ряд
- •Статистическая функция распределения
- •Полигон и гистограмма
- •Характеристики генеральной совокупности
- •Характеристики статистического ряда
- •Статистические оценки параметров распределения
- •Оценка для математического ожидания
- •Оценка для дисперсии
- •Интервальные оценки параметров распределения
- •Доверительные оценки параметров нормального распределения
- •Доверительные интервалы для математического ожидания при известном среднем квадратическом отклонении
- •Доверительные интервалы для математического ожидания при неизвестном среднем квадратическом отклонении , распределение Стьюдента
- •Доверительный интервал для среднего
- •Построение нормальной кривой по опытным данным
- •Проверка гипотез нормальности распределения
- •Преобразование распределений к нормальному
- •Методы построения парных зависимостей по экспериментальным данным
- •Две основные задачи теории корреляции
- •Методы построения, преобразования и оценки парных зависимостей по экспериментальным данным
- •Парная корреляция Статистическое оценивание парной корреляции и регрессии
- •1.3.4. Корреляционная таблица
- •Построение прямых линий регрессии по сгруппированным данным
- •Свойства коэффициента корреляции
- •1.3.7. Упрощение вычисления выборочного коэффициента корреляции.
- •1.3.8. Выборочное корреляционное отношение
- •1.3.9. Нелинейная парная регрессия
- •1.3.10. Оценивание тесноты корреляционной связи
1.3.10. Оценивание тесноты корреляционной связи
Систему экспериментальных точек в прямоугольных координатах можно приблизить (аппроксимировать) той или иной линией прямой или кривой. Мы проводили приближение системы точек заданной таблицей 21 прямой линией (14), квадратной параболой (13) и экспоненциальной зависимостью (15). Возникает вопрос: какая линия лучше описывает то или иное распределение? Что взять в качестве меры тесноты приближения системы точек к той или иной линии?
Что
взять в качестве меры тесноты корреляционной
связи, в случае использования метода
наименьших квадратов, почти очевидно.
После того, как вид аппроксимирующей
функции
подобран, можно при выбранном виде той
или иной кривой сосчитать величины сумм
квадратов отклонений. И тогда, если
,
то система экспериментальных точек
ближе примыкает к линии
,
чем к линии
.
Общей же мерой рассеяния всех точек
вокруг функции
является величина
,
где
-
количество точек
статистического материала,
-
число связей,
накладываемых на статистическую выборку
функцией
,
которое равно количеству неопределенных
коэффициентов, входящих в аналитическое
выражение этой функции. Например, для
многочленов степени k
число связей
.
При
аппроксимировании системы точек
некоторой линией, достаточно плотно
прилегающей к системе экспериментальных
точек, можно пойти по пути последовательного
увеличения степеней аппроксимирующих
полиномов. Т.е., сначала искать y
в виде
,
потом
,
и далее
и т.д. При этом до определенного момента
дисперсия
будет уменьшаться, а затем, в основном
за счет уменьшения числа
,
станет возрастать. Степень аппроксимирующих
полиномов следует увеличивать до тех
пор, пока D
уменьшается. Таким образом, проводя
вычисления с использованием метода
наименьших квадратов, мы сталкиваемся
с противоречием. С одной стороны,
желательно рассматривать более широкий
класс функций, например многочлены с
более высокой степенью. С другой стороны,
такое расширение приводит к увеличению
числа связей
и, значит, к
увеличению дисперсии D.
Для того чтобы выйти из этого противоречия
необходимо проводить тщательное
предварительное исследование изучаемой
зависимости с тем, чтобы в уравнение
регрессии вошло лишь минимально
необходимое число неопределенных
коэффициентов. Часто удается ограничиться
уравнением первой степени
,
накладывающим на выборку лишь две
связи. В других случаях удается
аппроксимировать систему точек некоторой
нелинейной зависимостью, которая
приводится заменой переменных к линейной
зависимости и, таким образом, так же
накладывает на выборку лишь две связи.
В других же случаях приходится переходить
к зависимостям, накладывающим на выборку
большее количество связей.
П р и м е р
Оценим различные аппроксимации системы экспериментальных точек, заданной таблицей 21.
Аппроксимация прямой линией здесь дает
.
Аппроксимация параболической зависимостью имеет вид
.
Экспоненциальная зависимость имеет вид
.
Сведем вычисления в следующую таблицу 26.
Таблица 26.
№ п/п |
|
|
|
|
|
|
|
|
1 |
1,7 |
25 |
16,740 |
22,934 |
23,111 |
68,244 |
4,268 |
3,568 |
2 |
3,4 |
34 |
52,832 |
46,826 |
46,201 |
354,644 |
164,510 |
148,864 |
3 |
4,0 |
57 |
65,571 |
60,940 |
58,997 |
73,462 |
15,555 |
3,990 |
4 |
4,1 |
82 |
67,694 |
63,590 |
61,451 |
204,661 |
338,928 |
422,260 |
5 |
5,3 |
98 |
93,171 |
101,710 |
100,202 |
23,319 |
13,764 |
4,850 |
|
|
|
|
|
|
724,330 |
537,025 |
583,530 |
Теперь
,
,
.
Таким
образом,
и, следовательно, лучше всех кривых
приближает систему экспериментальных
точек экспонента
,
хуже всех парабола
.