- •Содержание
- •Предисловие
- •§ 1. Функциональная и корреляционная зависимости
- •§ 2. Определение статистической взаимосвязи
- •§ 3. Эмпирическая регрессия
- •§ 4. Дисперсионное и корреляционное отношения
- •§ 5. Аналитическая регрессия. Метод наименьших квадратов
- •§ 6. Линейная регрессия
- •§ 7. Ковариация и коэффициент корреляции
- •§ 8. Линейное уравнение регрессии в стандартных масштабах
- •§ 9. Некоторые нелинейные функции регрессии
- •§ 10. Множественная корреляция и регрессия
- •§ 11. Замена переменных в уравнениях регрессии
- •Приложения Приложение I. Теорема о разложении дисперсии
- •Приложение II. Теорема о среднем значении регрессии
- •Приложение III. Вторая теорема о разложении дисперсии
- •Приложение IV. Доказательство ограниченности ковариации
Приложения Приложение I. Теорема о разложении дисперсии
Известно следующее свойство, которым обладает вариация признака y в произвольной совокупности:
Здесь — среднее значение признака в данной совокупности, A — любое число. Если применить это свойство к некоторой группе, роль среднего арифметического будет играть групповое среднее :
где — дисперсия признака y в i-й группе:
где символ означает суммирование по элементам i-й группы. В частности, в качестве числа A может быть взято среднее значение по всей совокупности , которое для данной группы особыми свойствами не обладает. Если раскрыть усреднение в левой части, отмеченное свойство примет вид:
Умножим обе части полученного равенства на численность i-й группы :
Такие равенства должны выполняться во всех группах, на которые разбита совокупность: Почленно сложим эти равенства по всем группам:
В левой части равенства все суммы по элементам отдельных групп объединились в одну сумму по элементам всей совокупности. Разделив последнее равенство на объем совокупности , получим:
В левой части у нас получилась дисперсия признака во всей совокупности; правая часть состоит из двух слагаемых. Первое из них — это среднее значение из дисперсий отдельных групп, взвешенное по численностям этих групп (внутригрупповая дисперсия):
Второе слагаемое представляет собой средний квадрат отклонений групповых средних от общей средней, также взвешенный по численностям групп:
Эта величина получила название межгрупповой дисперсии.
Итак, мы доказали теорему о разложении дисперсии:
.
Приложение II. Теорема о среднем значении регрессии
В этом и следующем приложениях рассматриваются полезные свойства регрессии, порождаемые свойствами тех классов функций, в которых ищется регрессия. Будут доказаны достаточно общие утверждения, относящиеся и к однофакторным, и к многофакторным регрессиям. Речь пойдет о функциях , число и характер аргументов которых не будут иметь значения, и о классах таких функций, определенные свойства которых будут представлять интерес. Будем использовать обозначение x для набора факторов — аргументов функции . Результирующую переменную y будем считать вещественной.
Рассмотрим класс функций , обладающий тем свойством, что любая функция из этого класса при прибавлении к ней любой константы остается в этом же классе, т. е. из следует a , где a — произвольная константа. Пусть 0 — МНК-регрессия переменной y в классе . Покажем, что в этом случае .
Введем в рассмотрение величину z 0(x) и рассмотрим регрессию 1(z; a) a z, имеющую один параметр — «свободный член» a. Система нормальных уравнений для определения этого параметра состоит из единственного уравнения, соответствующая производной ∂1/∂a 1:
a a .
Но 0 — МНК-регрессия y по x в классе , а функция a 0(x) принадлежит этому же классу. Поэтому a 0, откуда следует доказываемое утверждение .
Доказательство имеют много общего с рассмотренным в § 5 свойством регрессий, содержащих свободный член в качестве параметра; доказываемое утверждение также напоминает равенство (5.4). Однако существует различие между этими утверждениями. Наличие в качестве параметра свободного члена — свойство представления функций данного класса, в то время как здесь рассматривается свойство самого класса функций. Для иллюстрации различия рассмотрим пример.
Допустим, что некоторое устройство круглосуточно присоединено к электросети и в каждый момент находится в одном из двух режимов: ожидания или полезной работы. Ежесуточно фиксируются затраты электроэнергии (y) и суммарные (за сутки) продолжительности ожидания (u) и работы (v). Характерные часовые затраты энергии в каждом из режимов (bu и bv) оцениваются как параметры регрессии
Здесь функция регрессии не содержит свободного члена. Однако факторы u и v определены таким образом, что в любом наблюдении u v 24, а поэтому прибавление к любой функции этого класса произвольной константы a равносильно прибавлению a/24 к каждому из параметров bu и bv. Поскольку на параметры не наложено никаких ограничений, новая функция принадлежит к исходному регрессионному классу, и поэтому найденные посредством МНК параметры удовлетворяют равенству
В отличие от этого регрессия вида , также не имеющая свободного члена, обсуждаемым здесь свойством не обладает: все функции вида (x) bx удовлетворяют условию (0) 0, и прибавление ненулевой константы создаст функцию, не содержащуюся в исходном классе. Равенство при этом возможно лишь при специально подобранных данных.