
- •1. Определение эконометрики
- •2. Свойства информации
- •3. Массив чисел
- •4. Графическое представление массива чисел
- •Программные средства Ехсе1
- •Пакет прикладных программ
- •5. Виды переменных
- •6. Взаимосвязь массивов чисел
- •7. Корреляционный анализ
- •8. Предпосылки коэффициента корреляции
- •9. Проверка статистической значимости коэффициента корреляции
- •10. Регрессионный анализ
- •11. Построение линейной модели
- •12. Примеры интерпретации коэффициентов а0 и а1
- •13. Постановка задачи метода наименьших квадратов
- •14. Пример использования метода наименьших квадратов.
- •15. Предпосылки мнк
- •16. Дисперсионный анализ регрессионной модели
- •17. Расчетные формулы характеристик линейной модели
- •18. Проверка статистической значимости эконометрической модели
- •19. Критерии Стьюдента для коэффициентов модели
- •20. Проверка статистической значимости параметров эконометрической модели
- •21. Точечный и интервальный прогноз
- •22. Вычислительные средства расчетов основных характеристик линейной модели
- •23. Описание расчетов
- •1) Постановка задачи.
- •2) Таблица данных.
- •4) Протокол расчетов.
- •5) Запись математической модели и ее характеристик
- •6) Анализ характеристик модели
- •7) Выводы в соответствии с постановкой задачи
- •24. Сравнение средних значений
- •25. Решение контрольного примера сравнения средних
- •26. Заключение по корреляционному и регрессионному анализам
- •27. Диалектический метод
- •28. Система
- •29. Система управления предприятием.
- •Принятие решений осуществляется по циклу Деминга: планируй, делай, анализируй, совершенствуй.
- •30. Диаграмма Исикавы
- •Области применения Диаграммы Исикавы
- •Последовательность построения диаграммы Исикавы
- •31. Метод попарного сравнения
- •32. Японская схема улучшения качества
- •33. 14 Принципов Деминга, пять смертельных болезней и 13 препятствий в деятельности предприятий "Проекция принципов менеджмента Деминга на российскую практику"
7. Корреляционный анализ
Корреляционный анализ изучается во многих дисциплинах: математическая статистика, статистика, но у студентов встречаются пробелы, связанные с графическим представлением связи переменных, предпосылками корреляционного анализа и типами ложной корреляции.
Корреляционный анализ получил широкое применение по двум его показателям качества:
- простота расчета коэффициента корреляции и его достоверности;
- четкость в интерпретации тесноты связи между переменными.
Однако, среди исследователей очень распространено использование ложного коэффициента корреляции.
Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными.
Допустим имеется два массива чисел двух переменных Х и У для определенных объектов исследований.
Коэффициент корреляции вычисляется по выборке совместных наблюдений величин Х и У по формуле:
где Хi , Уi – значения переменных;
i – порядковый номер значения переменных;
Хс, Ус – средние значения переменных.
Формула коэффициента корреляции читается следующим образом: коэффициент корреляции между переменными Х и У равен частному от деления числителя на знаменатель.
Числитель равен сумме произведений отклонений Х и У от своих средних значений.
Знаменатель равен корню квадратному от произведения суммы квадратов отклонений Х и У от своих средних значений.
Умение правильно прочитать математическую формулу входит в состав общекультурных компетенций.
Коэффициент корреляции обладает следующими свойствами:
1. Значения коэффициента корреляции r(Х,У) могут находиться в интервале [-1,+1].
2. Отрицательное значение r(Х,У) означает, что при увеличении Х наблюдается тенденция уменьшения У.
3. Положительное значение r(Х,У) означает, что при увеличении Х наблюдается увеличение У.
4. Если между Х и У существует функциональная линейная зависимость, то коэффициент корреляции принимает значения либо +1, либо -1.
5. Если коэффициент корреляции равен 0, то это означает, что между Х и У нет линейной зависимости, но может быть нелинейная зависимость.
Допустим имеется два массива чисел Х и У
Построим корреляционное поле зависимости У от Х см. рис. 4.
Рис. 4 – Корреляционное поле зависимости У от Х
Разделим корреляционное поле двумя линиями Ус и Хс, которые выделят четыре зоны.
Выделенные зоны обладают следующими свойствами:
- в первой зоне произведения отклонений (Хi-Хс)*(Уi-Ус) имеют положительные значения, так как отклонения имеют одинаковый положительный знак;
- в третьей зоне отклонения (Хi-Хс) и (Уi-Ус) имеют одинаковый отрицательный знак, а их произведение (Хi-Хс)*(Уi-Ус) имеет положительное значение;
- во второй и четвертой зоне отклонения (Хi-Хс) и (Уi-Ус) имеют разные знаки, а их произведения имеют отрицательное значение.
∑(Хi-Хс)* (Уi-Ус) - сумма произведений отклонений значений Х и У от своих средних значений, обладает следующими свойствами:
- будет иметь положительное значение, если исходных данных будет больше в третье и первой зоне (данные будут иметь прямо пропорциональную или положительную тенденцию),
- будет отрицательной, если исходных данных будет больше во второй и четвертой зоне (данные будут иметь обратно пропорциональную или отрицательную тенденцию)
- будет равной нулю, если исходных данных будет одинаково во всех зонах (данные будут расположены по кругу и линия тенденции будет иметь горизонтальную линию, совпадающей с Ус).
От знака числителя коэффициента корреляции ∑(Хi-Хс)*(Уi-Ус) зависит знак коэффициента корреляции, так как знаменатель коэффициента корреляции всегда будет положительным числом.
На рисунке 5 показаны примеры исходных корреляционных полей и рассчитанных для них коэффициентов корреляции
Рис. 5 – Примеры исходных корреляционных полей и рассчитанных для них коэффициентов корреляции
Анализ рис. 5 показывает следующее;
- на первой строке коэффициент корреляции отражает «зашумлённость» линейной зависимости и характеризует степень связи между двумя переменными от +1 до -1,
- на второй строке знак коэффициента корреляции характеризует наклон строго функциональной линейной зависимости,
- на третьей строке показаны примеры исходных данных, при которых коэффициент корреляции равен нулю, так как количество данных в четырех зонах является одинаковым.