- •1. Введение в статистику связей случайных величин
- •1.1. Краткие сведения об используемых понятиях и терминах
- •1.1.1. Эмпирические данные
- •1.1.2. Стохастическая эмпирическая зависимость случайных величин
- •1.1.3. Математическая модель эмпирической зависимости и ее остатки
- •1.1.4. Зависимая и независимая переменные эмпирической зависимости
- •1.2. Основные методы построения стохастической зависимости
- •1.2.1. Корреляционный анализ
- •1.2.2. Регрессионный анализ
- •1.2.3. Меры расхождений и методы приближений
- •1.3. Задача аппроксимации и принципы оптимального решения
- •1.3.1. Постановка задачи аппроксимации эмпирической зависимости
- •1.3.2. Неопределенность и неоднозначность задачи аппроксимации
- •1.3.3. Оптимальное приближение эмпирической зависимости
- •2. Основы линейного приближения стохастической зависимости
- •2.1. Задача линейного приближения при парной связи
- •2.1.1. Виды математических моделей парной линейной зависимости
- •2.1.2. Неопределенность задачи построения линейной модели
- •2.1.3. Правила оптимального решения задачи линейной аппроксимации
- •2.2. Оценка реальности парной линейной связи и ее тесноты
- •2.2.1. Случайное рассеяние и неопределенность парной линейной связи
- •2.2.2. Корреляционное отношение – показатель тесноты связи
- •2.2.3. Ковариация – признак линейной стохастической связи
- •2.2.4. Коэффициент корреляции – показатель силы линейной связи
- •2.2.5. Коэффициент детерминации – показатель определенности связи
- •2.2.6. Интерпретация линейной корреляции
- •2.3. Методы определения параметров линейной модели
- •2.3.1. Суть и эффективность методов определения параметров модели
- •2.3.2. Максимально правдоподобные меры расхождения
- •2.4. Качество линейной модели эмпирической зависимости
- •2.4.1. Значимость и доверительные интервалы параметров регрессии
- •2.4.2. Доверительные интервалы линейной эмпирической зависимости
- •2.4.3. Дисперсия и доверительная область прогнозных оценок
- •2.4.4. Оценка адекватности линейной модели
- •3. Компьютерный практикум
- •3.1. Исходные данные для построения парной зависимости
- •3.1.1 Регулярная составляющая аукционных цен
- •3.1.1. Случайная составляющая аукционных цен
- •3.1.3. Линейное приближение зависимости и его приложения
- •3.2. Линейное приближение парной зависимости в Excel
- •3.2.1. Ввод данных
- •3.2.2. Оценка тесноты линейной связи
- •3.2.3 Построение регрессии процедурой вывода тренда на график
- •3.2.4. Вывод параметров линейной регрессии встроенными функциями
- •3.2.5. Оценки качества линейной модели
- •3.2.6. Оценка регрессии и ее качества встроенной функцией линейн
- •3.2.7. Применение процедуры Регрессия для линейной модели
- •3.6. Вопросы для самопроверки
3.2. Линейное приближение парной зависимости в Excel
В рабочий лист Excel, прежде всего, необходимо ввести данные.
3.2.1. Ввод данных
Данные из таблицы 3.1 вводятся «вручную» или, если в файле есть таблица – копированием в буфер и затем вставкой в рабочий лист Excel.
Вставленную таблицу из 2 строк, целесообразно транспонировать в 2 столбца:
– вставленная таблица из строк копируется в буфер;
– курсор устанавливается в левый верхний угол намеченного блока для ввода столбцов так, чтобы сверху осталась пустая строка;
– командами Правка Специальная вставка Транспонировать ОК производится вставка таблицы в виде столбцов.
Правый столбец выделяется и мышкой перемещается на одну позицию вправо так, чтобы между вставленными столбцами оказался пустой столбец.
В пустом столбце организуются вычисления срока хранения вина x по формуле (3.1), используя годы закладки, указанные в столбце слева, как значения t (рис. 3.1).
Рис. 3.1. Рабочий лист Excel с исходными данными, графиком (1) и контекстным меню (2) для задания тренда (3)
Первый столбец с годами закладки обозначается как t, второй столбец с вычисленными сроками выдержки обозначается как х, сдвинутый столбец, как у (доллары).
3.2.2. Оценка тесноты линейной связи
Первым шагом построения линейной модели эмпирической зависимости является выяснение реальности связи, что предполагает:
– во-первых, вывод коэффициента корреляции между переменными в столбцах х и у;
– во-вторых, оценку доверительного интервала для этого коэффициента корреляции.
Коэффициент корреляции возвращается функцией КОРРЕЛ из категории Статистические функции, для чего
– табличный курсор устанавливается в намеченную пустую ячейку;
– пиктограммой fx вызывается список встроенных функций и выбирается КОРРЕЛ;
– в диалоговом окне функции КОРРЕЛ в поле массив1 указывается диапазон значений переменной в столбце х, в поле массив2 – диапазон переменной в столбце у (какой из этих столбцов в какое поле вводить, не имеет значения), и нажимается кнопка ОК.
Для коэффициента корреляции рассчитывается среднеквадратичная погрешность оценки по формуле (2.29) – получается 0,2. Доверительный интервал приблизительно втрое больше и строго определяется допустимым t-отклонением при 14 – 2 степенях свободы для задаваемой (пусть 99-процентной) доверительной вероятности. Допустимое t = 3,055 возвращает функция СТЬЮДРАСПОБР(1-0,99;14-2), и, следовательно, доверительный интервал оценки коэффициента корреляции составит 0,2 3,055 0,62. Поскольку фактическая оценка коэффициента корреляции 0,961 превышает критическую величину, то нулевую гипотезу о k = 0 можно отклонить. Следовательно, оценка коэффициента корреляции является значимой и с учетом стандарта равна 0,961 0,200.
Коэффициент детерминации по точной формуле (2.38) определяется, как 91,8% и 92,4% по приближенной формуле (2.39), то есть линейная модель объясняет более 90% рассеяния зависимой переменной.
Вероятность ошибки при отклонении нулевой гипотезы о равенстве нулю коэффициента детерминации вычисляется следующим образом:
– вначале находится / D2 по формуле (2.40) – / D2 = 1/(1 – Adjusted R2) = 12,2;
– для отношения / D2 находится вероятность ошибки отклонения нулевой гипотезы о равенстве нулю коэффициента детерминации (того, что / D2 = 1) – вероятность возвращается функцией FРАСП(12,2;13;12) = 510–5.
Можно также воспользоваться функцией FРАСПОБР(0,05;13;12), которая возвращает критическое отношение для заданной вероятности 0,05 ошибки при отклонении нулевой гипотезы. Поскольку FРАСПОБР(0,05;13;12) = 2,66, то вывод тот же: коэффициент детерминации значимо отличается от нуля.
Таким образом, проверки нулевой гипотезы для коэффициентов корреляции и детерминации указывают на значимость оценок. Это позволяет переменных и перейти к линейному регрессионному анализу зависимости аукционных цен на вина от срока их выдержки.