- •Наблюдаемые явления (результат испытаний)
- •Алгебра событий
- •Диаграммы Эйлера-Венна
- •Доказательство теоремы о сложении вероятностей совместных событий
- •Формула полной вероятности
- •Формула вероятности гипотез
- •Формула Бернулли
- •Локальная формула Лапласа
- •Интегральная формула Лапласа
- •Случайные одномерные величины
- •Распределения вероятностей дискретной случайной величины
- •2.Распределение Пуассона
- •Основные формулы комбинаторики, используемые для определения вероятностей алгебры событий
- •Функция (интегральный закон) распределения с.В.
- •Плотность вероятности (дифференциальный закон) распределения непрерывной с.В.
- •Числовые характеристики распределения с.В.
- •Математическое (безусловное) ожидание с.В.
- •Дисперсия (безусловная) с.В.
- •5.Квантили распределения
- •Нормальное (Гауссово) распределение
- •Функция Лапласа
- •Равномерное (равновероятное, прямоугольное)
- •Показательное (экспоненциальное) распределение
- •Распределение χ2
- •Двумерные с.В. («проклятие размерности»)
- •Свойства
- •Условные математические ожидания (регрессии)
- •II. Математическая статистика
- •Построение эмпирической (статистической) функция распределения
- •Статистические оценки параметров распределения
- •Точечные оценки точности оценок (статистик) генеральных числовых характеристик
- •Математического ожидания и дисперсии
- •Доверительные интервалы оценки среднеквадратического отклонения
- •Методы оценки параметров известного распределения
- •1.Метод моментов (Пирсона)
- •2. Метод максимального правдоподобия (Фишера)
- •Парная линейная регрессия
- •Множественная линейная регрессия
- •Коэффициент детерминации регрессий
Коэффициент детерминации регрессий
Для линейной парной регрессии вводят критерий точности модели: коэффициент детерминации
где - невязка; .
Содержание : показывает отношение части вариации объясняемой переменной за счет воздействия вариации факторов, входящих в уравнение регрессии, к общей вариации объясняемой переменной относительно математического ожидания.
Для множественной линейной регрессии коэффициент детерминации показывает степень тесноты связи всех входящих в уравнение регрессии факторов с определяемой переменной .
, где , .
При помощи данной формулы можно определить , не вычисляя значений . При этом, если величина не удовлетворяет исследованию, то можно прекратить вычисления . Данное обстоятельство имеет значение, если выборка велика (сотни и тысячи наблюдений).
Для случая двух факторов коэффициент множественной детерминации вычисляется по формуле:.
Если - то, за счет вариации факторов объясняется 57,65% вариации .
Известны и более тонкие характеристики связи:
Используется коэффициент раздельной детерминации:
,
где - коэффициент парной корреляции, - стандартизированный коэффициент детерминации.
Например, если
то можно утверждать, что за счет вариации объясняется 24,18% вариации , а за счет вариации - 7,31%, за счет вариации - 58.3%.
.
Применяют и коэффициент частной детерминации с корректируемым коэффициентом детерминации.
Кроме количественных факторов могут рассматриваться и неколичественные (качественные).
Например, рассмотренная выше зависимость потребления (спроса на благо) может определяться не только доходом потребителей, но и вкусами, национальными, религиозными особенностями, полом, наличием образования и т.д.
Фиктивные переменные
Фиктивная (искусственная, двоичная) переменная (индикатор):
.
Можно ввести и несколько фиктивных переменных при возможности градации качественных факторов.
Пример: Пусть имеется 3 количественных фактора урожайности и 3 природных зоны, которые существенно влияют на урожайность. Уравнение регрессии можно представить в виде: .
Зоны урожай-ности |
Опреде-ляемые факторы |
Факторы |
Фиктивные переменные |
|||
1 |
0 |
0 |
||||
0 |
0 |
|||||
… |
… |
… |
… |
… |
… |
|
0 |
0 |
|||||
2 |
1 |
0 |
||||
… |
… |
… |
… |
… |
… |
|
1 |
0 |
|||||
3 |
|
0 |
1 |
|||
… |
… |
… |
… |
… |
… |
|
0 |
1 |
Уравнения регрессии для зон: 1. ;
2. ;
3. .
Величина коэффициента означает, что все единицы второй зоны при тех же значениях количественных факторов, что и в первой зоне, будет иметь среднее значение на единиц > (<), чем в первой зоне.
Число фиктивных переменных должно быть на единицу меньше числа градации факторов.
В ряде случаев статистическая связь может показывать так называемую «ложную корреляцию», когда и объясняемые переменные, и объясняющие переменные испытывают общее влияние от некоторого фактора, например времени.
Пример «ложной корреляции»: Количество санаториев со временем растет, как и количество студентов. какой правильный вывод можно сделать?
Литература
-
Гмурман В.Е. Теория вероятностей и математическая статистика. М.Высшая школа. 2003
-
Теория статистики/ Р.А. Шмойлова и др. М.: Финансы и статистика. 2004.
-
Елисеева И.И., Юзбашев М.М. Общая теория статистики. М.: Финансы и статистика. 2004.
-
Вентцель Е.С. Теория вероятности. (Любой год издания)И. Грекова. Дамский мастер и др.