- •Преобраз Лапл:
- •Свертка функций
- •Прилож Оп исчисл
- •Случ События
- •Cлучайн величины
- •F(X) – Распредел дсв
- •Закон больш чисел
- •Сист 2х случ велич
- •Дсв(X,y) –Закон Распредел
- •Плотн распределен:
- •Условное м и d:
- •Коэф ковариации и кореляции
- •1) Кореляц Мом
- •Функц св
- •2. Φ(X) – монотон, деффиренц
- •Эл мат статистики
- •Регресс: корелляц анализ
- •Оц кач регрессии
- •3. Оц значим отдельн факторов
- •5.Оц значим мод в целом
- •3) Оц генерал ср X¯
Регресс: корелляц анализ
X,Y – СВ : статич данные:
X x1 x2 ….xn (xi,yi) – эмпирич точки - множ
Y y1 y2 ….yn всех т. – кореляц поле
По виду распред выбир класс ф-ий опр завис y=f(x):
y =a+bx, y=ax2+bx+c, y=a+b/x
Рассм линейн завис: y=a+bx
Ei – ошибка(отклон)=yi-ya
F=e12+e22=.. –сум квадр отклон
=(y1-(a+bx1))2+…=F(a,b)
«Метод наимен квадр»
Опред коэф линии y=f(x,α), α-набор коэф a,b
Основ на минимиз сум квадр отклон эмпирич т. от наилучш лин – наз лин регрессии
Необх усл min ф-ии 2x неизв: равенст 0 всех её частн произв: F=Σ(yi-(a+bxi))+2 -> min a,b
{∂F(a,b)/∂a=Σ(i=1,n)(2(yi-a-bxi)(-1))=0,
∂F(a,b)/∂b=Σ(i=1,n)(2(yi-a-bxi)(-xi))=0
{ Σ(i=1,n)(2(a-bxi-yi)=0, Σ(i=1,n)(2(axi-bxi2-yixi)=0
Во всех слаг ф F к-ты перед a2 , b2 положит, то ф F(a,b) в критич т буд min:
{n*a+bΣxi = Σyi, aΣxi + bΣx2i=Σxiyi}
{a+bx¯=y¯, a x¯+b x¯2=xy¯}
b x¯2 – b(x¯)2 =xy¯- x¯ *y¯
b= xy¯- x¯ *y / x¯2 – (x¯)2 , a=y¯-bx¯
Пр: x y xy x2
1 7 7 1 x¯=12/4
3 5 15 9 y¯=21/4
6 2 12 36 xy¯=48/4
2 7 14 4 x¯2=50/4
Σ 12 21 48 50 b=-1.07, a=8.46
y^=8.48-1.07x
Оц кач регрессии
Сущ идеальн y=α+βx. Получ разн лин регр y^=a1+b1x,
y^=a2+b2x… => a,b оценки к-ов α,β ур модели y=α+βx
1) Коэф корреляц:
rxy=r(x,y)=cov(x,y)/σxσy = bσx/σy = b √Dx/Dy хар тесноту и напр линейн связи мд x и y
cov(x,y)=xy¯ - x¯y¯, b=cov(x,y)/σ2x , -1<=r<=1
Напр связи: r(x,y)>0 : связь прям(с рост x ср знач y возр)
r(x,y)<0: обратн
Теснота связи: r(x,y)=0 (чисто теор) связь отсутств НСВ
0| r(x,y)| <0.3 практич отсут: либо нет связ, либо нелиней
0.3<| r(x,y)| <0.5 слаб лин св, 0.5<| r(x,y)| <0.7 –умеренная
0.7<| r(x,y)| <1 тесн св – эмпир т. расп близко к лин регр
r(x,y)=+-1 –Все эмпирич т. леж на лин регрес
2)Коэф детерминации
А) Дисперсиональн анализ:
D(y)=σ2y= (y1-y¯)2 +(y2-y¯)2 ..+ (yn-y¯)2 / n, M= y¯ , p=1/n
yi-y¯ = (yi-yi^)+( yi^ -y¯),
(y2-y¯)2 =(yi-yi^)2+( yi^ -y¯)2 -2 (yi-yi^)( yi^ -y¯)
Σ (y2-y¯)2 =
Σ (yi-yi^)- errors (ESS)+
Σ ( yi^ -y¯) – regression (RSS)
2Σ (yi-yi^)( yi^ -y¯)=0
D(y)=σ2y = TSS/n = ESS/n +RSS/n
TSS –общ дисп, ESS – часть дисп не обьясн регресс, RSS – обьясн регрессией
Б) Коэф детерминиз R2=1 - ESS/TSS , если много факт
R2=rxy 2 – если одна факториальн переменная.
-1<=R2<=1 (%) показ на скольк % измен результативн ~ y обуслизменен x. Оставш % - это влиян факторов, не вошед в мод. Чем ближе R2 к 1, тем ближе эмпир т. к лин регресс.
Регресс при неск факторах:
y^=a+bx, y^=a0+a1x+a2x2+..akxk
завис коэф корреляц от 2 х величин: Z(xi,y)-парные
R2=1 - ESS/TSS - коэф детерминизац
Парн коэф в случайн множ регресс часто не отраж истин влиян м\д xi и результативн ~ y
Истин взаимосв отраж частн коэф коррел: r(xi,y|z) – искл влиян факторов Z=(x1,x2…xk). -1<= r(xi,y|z) <=1
3. Оц значим отдельн факторов
Провер статистич гипот-за H0 – о том что xi не значимы для Y. H0: αi=0
Для пров данн гипот рассм t-статистика = функц подчин з-ну распред Стьюдента: t= (ai-αi) / Si ,
ai – соотв коэф регресс перед xi
αi =0 – по предполож, Si – ср квадр отклон ai - стандартн ош: √D(ai)
Далее по табл распред Стьюдента наход критич знач статист: tкр = tγ(n-k), обычно γ=95% - вер с кот мы получ определ рез-тат, n-наблюд, k –кол переменных
|t|<tкр – H0 на зад уровне доверия
|t|>tкр – H0 отверг с зад вер-ю γ в пользу альтерн гипот H1: αi≠0
Знач t можно определить:
4.Доверит интерв: зад ур доверия γ : доверит интерв αi наход: |t|<tкр, |(ai – α1)/Si|<tкр , Si>0
Ai – Sitкр < αi < ai+Si tкр –довер интерв с ур довер γ
Т.е. с вер-ю γ истин знач наход в этом промеж
Чем выше ур довер – тем шире доверит интерв