Генеральная и выборочная дисперсии, их свойства. Оценка генеральной дисперсии по выборочной. Исправленная дисперсия.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белгородский государственный национальный исследовательский университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Все вместе кроме 16 и 20.doc

Скачиваний:

Добавлен:

22.09.2019

Размер:

7.53 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2020

Генеральная и выборочная дисперсии, их свойства. Оценка генеральной дисперсии по выборочной. Исправленная дисперсия.

Линейная регрессия. Метод наименьших квадратов.

Регрессионный анализ.

Рассмотрим выборку двумерной случайной величины (Х, Y) . Примем в качестве оценок условных математических ожиданий компонент их условные средние значения, а именно: условным средним назовем среднее арифметическое наблюдавшихся значений Y, соответствующих Х = х. Аналогично условное среднее - среднее арифметическое наблюдавшихся значений Х, соответствующих Y = y. В лекции 11 были выведены уравнения регрессии Y на Х и Х на Y:

M (Y / x) = f (x), M ( X / y ) = φ (y).

Условные средние и являются оценками условных математических ожиданий и, следовательно, тоже функциями от х и у, то есть

= f*(x) - (22.1)

- выборочное уравнение регрессии Y на Х,

= φ*(у) - (22.2)

- выборочное уравнение регрессии Х на Y.

Соответственно функции f*(x) и φ*(у) называются выборочной регрессией Y на Х и Х на Y , а их графики – выборочными линиями регрессии. Выясним, как определять параметры выборочных уравнений регрессии, если сам вид этих уравнений известен.

Пусть изучается двумерная случайная величина (Х, Y), и получена выборка из п пар чисел (х₁, у₁), (х₂, у₂),…, (х_п, у_п). Будем искать параметры прямой линии среднеквадратической регрессии Y на Х вида

Y = ρ_yxx + b , (22.3)

Подбирая параметры ρ_ух и b так, чтобы точки на плоскости с координатами (х₁, у₁), (х₂, у₂), …, (х_п, у_п) лежали как можно ближе к прямой (22.3). Используем для этого метод наименьших квадратов и найдем минимум функции

. (22.4)

Приравняем нулю соответствующие частные производные:

В результате получим систему двух линейных уравнений относительно ρ и b:

. (22.5)

Ее решение позволяет найти искомые параметры в виде:

. (22.6)

При этом предполагалось, что все значения Х и Y наблюдались по одному разу.

Теперь рассмотрим случай, когда имеется достаточно большая выборка (не менее 50 значений), и данные сгруппированы в виде корреляционной таблицы:

Y	X
Y	x₁	x₂	…	x_k	n_y
y₁ y₂ … y_m	n₁₁ n₁₂ … n_1m	n₂₁ n₂₂ … n_2m	… … … …	n_k1 n_k2 … n_km	n₁₁+n₂₁+…+n_k1 n₁₂+n₂₂+…+n_k2 …………….. n_1m+n_2m+…+n_km
n_x	n₁₁+n₁₂+…+n_1m	n₂₁+n₂₂+…+n_2m	…	n_k1+n_k2+…+n_km	n=∑n_x = ∑n_y

Здесь n_ij – число появлений в выборке пары чисел (x_i, y_j).

Поскольку , заменим в системе (22.5)

, где п_ху – число появлений пары чисел (х, у). Тогда система (22.5) примет вид:

. (22.7)

Можно решить эту систему и найти параметры ρ_ух и b, определяющие выборочное уравнение прямой линии регрессии:

Но чаще уравнение регрессии записывают в ином виде, вводя выборочный коэффициент корреляции. Выразим b из второго уравнения системы (22.7):

Подставим это выражение в уравнение регрессии: . Из (22.7)

, (22.8)

где Введем понятие выборочного коэффициента корреляции

и умножим равенство (22.8) на : , откуда . Используя это соотношение, получим выборочное уравнение прямой линии регрессии Y на Х вида

. (22.9)

Метод квадратов.

Если требуется оценить зависимость величин у и х, причем известен вид связывающей их функции, но неизвестны значения входящих в нее коэффициентов, их величины можно оценить по имеющейся выборке с помощью метода наименьших квадратов. Для этого функция у = φ (х) выбирается так, чтобы сумма квадратов отклонений наблюдаемых значений у₁, у₂,…, у_п от φ(х_i) была минимальной:

При этом требуется найти стационарную точку функции φ(x; a, b, c…), то есть решить систему:

(решение, конечно, возможно только в случае, когда известен конкретный вид функции φ).

Рассмотрим в качестве примера подбор параметров линейной функции методом наименьших квадратов.

Для того, чтобы оценить параметры а и b в функции y = ax + b, найдем Тогда . Отсюда . Разделив оба полученных уравнения на п и вспомнив определения эмпирических моментов, можно получить выражения для а и b в виде:

. Следовательно, связь между х и у можно задать в виде:

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2020

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.2025495.27 Кб0Восточные славяне в древности.docx
#
01.05.2025178.18 Кб0впо - Экологическое право.doc
#
01.05.202542.92 Кб0вр. ком. и кон. вр..docx
#
12.11.2019151.55 Кб12Врачевание в Древнем Китае и Индии.doc
#
24.11.2019109.57 Кб17ВСД по ваготоническому типу.DOC
#
22.09.20197.53 Mб25Все вместе кроме 16 и 20.doc
#
01.05.20251.08 Mб5ВСЕ Лекции Геоэкология.doc
#
23.04.2019455.34 Кб6Все ответы ОЗД.docx
#
17.04.2019109.31 Кб12все ответы.docx
#
01.04.2025749.57 Кб6Все тесты 1-7.doc
#
26.09.20192.09 Mб32Все тесты.doc

Генеральная и выборочная дисперсии, их свойства. Оценка генеральной дисперсии по выборочной. Исправленная дисперсия.

Линейная регрессия. Метод наименьших квадратов.