- •Основные понятия теории вероятности.
- •Непосредственный подсчет вероятностей.
- •1. Полная группа событий.
- •2. Несовместимые события.
- •3. Равновозможные события.
- •Теоремы сложения вероятностей. Теорема сложения вероятностей несовместных событий
- •Теорема сложения вероятностей совместных событий
- •Теоремы умножения вероятностей Теорема умножения вероятностей
- •Теорема Байеса
- •«Физический смысл» и терминология
- •Следствие
- •Основные числовые характеристики дискретных случайных величин.
- •Основные числовые характеристики непрерывных случайных велечин.
- •Равновероятностный закон распределения вероятностей.
- •Биноминальный закон распределения вероятностей.
- •Экспоненциальный закон распределения вероятностей.
- •Нормальный закон распределения вероятностей.
- •13 Проверка статистической гипотезы о равенстве средних значений. Проверка статистических гипотез о равенстве средних
- •Формулировка гипотезы
- •14. Проверка статистической гипотезы о законе распределения.
- •15. Проверка статистической гипотезы об однороности дисперсий
- •16. Проверка статистической гипотезы о статистической взаимосвязи
- •17. Корреляционный анализ. Виды уравнений регрессии.
- •18. Расчет параметров уравнения регрессии
- •Оценка качества регрессионной модели
- •19. Проверка гипотезы об адекватности.
- •20. Линейная однофакторная регрессионаая модель
- •21. Степенная регрессионная модель
Оценка качества регрессионной модели
Характеризуется рядом показателей:
проверить статистическую значимость коэффициентов;
определить интервальные оценки коэффициентов уравнения регрессии;
определить доверительные интервалы для зависимой переменной;
проверить общее качество уравнения регрессии (коэффициент детерминации и его статистическую значимость).
19. Проверка гипотезы об адекватности.
Проверка адекватности математической модели данным эксперимента проводится только в случае ненасыщенного планирования на основе сопоставления дисперсии воспроизводимости среднего значения функции отклика s2(y) и дисперсии адекватности. Оценка дисперсии адекватности при N > m характеризует отклонения между результатами наблюдений и значениями, формируемыми по функции отклика ,
где m – количество оцениваемых коэффициентов модели;
– среднее значение результатов наблюдения в u-й точке плана;
y'u – значение отклика в этой же точке, предсказанное на модели.
Количество степеней свободы дисперсии адекватности ja = N – m.
При насыщенном планировании нет степеней свободы и сумма отклонений равна нулю.
Проверка адекватности сводится к проверке гипотезы об однородности оценки дисперсии воспроизводимости s2 (y) с количеством степеней свободы j(y) и оценки дисперсии адекватности. Проверка осуществляется по критерию Фишера аналогично рассмотренной выше проверке однородности дисперсий воспроизводимости. Оценки дисперсий в формуле расчета критерия расставляются так, чтобы его величина была больше единицы, критическая область является двусторонней.
Если вычисленное значение критерия меньше критического, то нет оснований для сомнений в адекватности модели. Однако положительный исход статистической проверки не гарантирует достоверной адекватности, а тем более истинности модели (хотя и не противоречит такому предположению). Когда гипотеза отклоняется, следует вывод о неадекватности модели, следовательно, она заведомо не является истинной. Дальнейшее применение неадекватной модели обычно нецелесообразно, и надо принять меры по ее совершенствованию.
Причиной неадекватности могут являться: ошибки в организации и проведении опытов, например неконтролируемое изменение неучтенных в модели факторов; погрешности в задании исходных данных и в измерении результатов; большой размах варьирования факторов и другие причины. Иначе говоря, анализ причин неадекватности требует серьезного изучения сущности исследуемого процесса и методов его исследования.
20. Линейная однофакторная регрессионаая модель
Линейная регрессия находит широкое применение в эконометрике в виде четкой эконометрической интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида: Ŷ = а + bx или Ŷ = a + bx + ε; Уравнение вида Ŷ = а + bx позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора X. На графике теоретические значения представляют линию регрессии.
dy |
Y |
A |
Dx |
Рисунок 1 – Графическая оценка параметров линейной регрессии Построение линейной регрессии сводится к оценке ее параметров – а и b. Оценки параметров линейной регрессии могут быть найдены разными методами. Можно обратится к полю корреляции и, выбрав на графике две точки, провести через них прямую линию. Далее по графику можно определить значения параметров. Параметр a определим как точку пересечения линии регрессии с осью OY, а параметр b оценим, исходя из угла наклона линии регрессии, как dy/dx, где dy – приращение результата y, а dx – приращение фактора x, т.е. Ŷ = а + bx. Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов(МНК). МНК позволяет получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений результативного признака (y) от расчетных (теоретических) минимальна: ∑(Yi – Ŷ xi)2 → min Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной. εi = Yi – Ŷ xi. следовательно ∑εi2 → min
εi |
A |
|
|
Рисунок 2 – Линия регрессии с минимальной дисперсией остатков Чтобы найти минимум функции, надо вычислить частные производные по каждому из параметров a и b и приравнять их к нулю. Обозначим ∑εi2 через S, тогда S = ∑ (Y –Ŷ xi)2 =∑(Y-a-bx)2; Дифференцируем данное выражение, решаем систему нормальных уравнений, получаем следующую формулу расчета оценки параметра b: b = (ух – у•x)/(x2-x2). Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Например, если в функции издержек Ŷ = 3000 + 2x (где x – количество единиц продукции, у – издержки, тыс. грн.) с увеличением объема продукции на 1 ед. издержки производства возрастают в среднем на 2 тыс. грн., т.е. дополнительный прирост продукции на ед. потребует увеличения затрат в среднем на 2 тыс. грн. Возможность четкой экономической интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях.