
- •1. Введение в статистику связей случайных величин
- •1.1. Краткие сведения об используемых понятиях и терминах
- •1.1.1. Эмпирические данные
- •1.1.2. Стохастическая эмпирическая зависимость случайных величин
- •1.1.3. Математическая модель эмпирической зависимости и ее остатки
- •1.1.4. Зависимая и независимая переменные эмпирической зависимости
- •1.2. Основные методы построения стохастической зависимости
- •1.2.1. Корреляционный анализ
- •1.2.2. Регрессионный анализ
- •1.2.3. Меры расхождений и методы приближений
- •1.3. Задача аппроксимации и принципы оптимального решения
- •1.3.1. Постановка задачи аппроксимации эмпирической зависимости
- •1.3.2. Неопределенность и неоднозначность задачи аппроксимации
- •1.3.3. Оптимальное приближение эмпирической зависимости
- •2. Основы линейного приближения стохастической зависимости
- •2.1. Задача линейного приближения при парной связи
- •2.1.1. Виды математических моделей парной линейной зависимости
- •2.1.2. Неопределенность задачи построения линейной модели
- •2.1.3. Правила оптимального решения задачи линейной аппроксимации
- •2.2. Оценка реальности парной линейной связи и ее тесноты
- •2.2.1. Случайное рассеяние и неопределенность парной линейной связи
- •2.2.2. Корреляционное отношение – показатель тесноты связи
- •2.2.3. Ковариация – признак линейной стохастической связи
- •2.2.4. Коэффициент корреляции – показатель силы линейной связи
- •2.2.5. Коэффициент детерминации – показатель определенности связи
- •2.2.6. Интерпретация линейной корреляции
- •2.3. Методы определения параметров линейной модели
- •2.3.1. Суть и эффективность методов определения параметров модели
- •2.3.2. Максимально правдоподобные меры расхождения
- •2.4. Качество линейной модели эмпирической зависимости
- •2.4.1. Значимость и доверительные интервалы параметров регрессии
- •2.4.2. Доверительные интервалы линейной эмпирической зависимости
- •2.4.3. Дисперсия и доверительная область прогнозных оценок
- •2.4.4. Оценка адекватности линейной модели
- •3. Компьютерный практикум
- •3.1. Исходные данные для построения парной зависимости
- •3.1.1 Регулярная составляющая аукционных цен
- •3.1.1. Случайная составляющая аукционных цен
- •3.1.3. Линейное приближение зависимости и его приложения
- •3.2. Линейное приближение парной зависимости в Excel
- •3.2.1. Ввод данных
- •3.2.2. Оценка тесноты линейной связи
- •3.2.3 Построение регрессии процедурой вывода тренда на график
- •3.2.4. Вывод параметров линейной регрессии встроенными функциями
- •3.2.5. Оценки качества линейной модели
- •3.2.6. Оценка регрессии и ее качества встроенной функцией линейн
- •3.2.7. Применение процедуры Регрессия для линейной модели
- •3.6. Вопросы для самопроверки
1.1.4. Зависимая и независимая переменные эмпирической зависимости
Определения зависимой (dependent variable) и независимых (independent variables) переменных условны, так как причинно-следственная связь исследуемых показателей не всегда очевидна, но при этом принято считать, что
– прогнозируемая характеристика (показатель) является случайной зависимой переменной (ее иначе называют предиктором);
– характеристики (показатели), используемые, как предсказывающие (прогнозные), – это независимые переменные (аргументы).
В теории эксперимента независимые переменные принято называть факторами, а зависимую переменную – откликом. В соответствии с этим парная эмпирическая зависимость (рис. 1А) именуется однофакторной, многомерная зависимость (рис. 1Б) – многофакторной.
Независимые переменные в общем случае являются случайными, но их принято считать детерминированными, и вызываемые ими случайные отклонения зависимой переменной относятся на ее счет.
1.2. Основные методы построения стохастической зависимости
Методы построения стохастической зависимости базируются на теории вероятностей и математической статистики.
1.2.1. Корреляционный анализ
Методом изучения взаимосвязи между изменяющимися величинами является корреляционный анализ (correlation analysis).
Корреляционный анализ используется для обнаружения стохастической зависимости и оценки ее силы (значимости) по величине коэффициента корреляции линейной связи или корреляционного отношения нелинейной и многомерной связи. Коэффициент корреляции и корреляционное отношение по абсолютной величине изменяются от 0 (при отсутствии связи) до 1 (при вырождении стохастической связи в функциональную связь). Коэффициент корреляции и корреляционное отношение являются случайными величинами, так как находятся по эмпирическим данным, и стохастическая связь значима (реальна), если абсолютная оценка коэффициента корреляции и корреляционного отношения на 2-3 стандарта превышают нуль.
В основе корреляционной связи может лежать причинная зависимость, например, тормозной путь автомашины, зависит от ее скорости.
Вместе с тем, корреляционная связь обнаруживается также между явлениями, не находящимися в причинно-следственном отношении. Например, для некоторых сельских районов выявлена прямая стохастическая связь между числом гнездящихся аистов и рождающихся детей. Весенний подсчет аистов позволяет предсказывать, сколько в этом году родится детей. Но зависимость, конечно, не доказывает известное поверье о том, что аисты приносят детей, и объясняется параллельными процессами:
– рождению детей обычно предшествует образование и обустройство новых семей с обзаведением сельскими домами и подворьями;
– расширение возможностей гнездования привлекает птиц и увеличивает их число.
Подобная корреляция между признаками, если она не отражает причинные отношения, называется ложной (иногда мнимой), хотя может иметь прикладное значение.
Иногда корреляционный анализ понимается шире и включает вопросы регрессии.
1.2.2. Регрессионный анализ
Метод математического моделирования стохастической зависимости условных средних зависимой переменной от одного или нескольких аргументов называется регрессионным анализом (regression analysis).
В результате регрессионного анализа определяются:
– общий вид модели (уравнения регрессии), как зависимости условных средних арифметических зависимой переменной от значений одной или нескольких независимых переменных (аргументов);
– параметры уравнения регрессии и их значимость.
В
парной связи условное среднее
арифметическое зависимой переменной
–
это среднее арифметическое значений
зависимой переменной yi
при условии, что аргумент принял значение
xi,
и регрессия – это зависимость таких
условных средних
(3)
от значений xi. Иначе уравнение регрессии можно записать, как
(xi) = (xi), (4)
где (xi) – функция, отвечающая зависимости условных средних арифметических зависимой переменной от значений одной или нескольких независимых переменных (аргументов).
Одно из основных свойств среднего арифметического случайных величин состоит в том, что сумма квадратов отклонений этих величин от среднего минимальна. В частности, для каждого среднего можно показать, что
(5)
Следовательно, уравнение регрессии (4), как зависимость условных средних арифметических зависимой переменной от значений xi, может строиться, исходя из условия (5).