- •Курсовая работа по «Теории вероятностей и математической статистике»
- •Теоретическая часть Основные задачи математической статистики.
- •3Адача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным.
- •Задача проверки правдоподобия гипотез.
- •Задача нахождения неизвестных параметров распределения
- •Статистическое описание и выборочные характеристики двумерного случайного вектора.
- •Для контроля правильности вычислений используется тождество
- •Однофакторный дисперсионный анализ.
- •Практическая часть
- •Для контроля правильности вычислений используется тождество
- •2)Вычисление ei , Qe , Qr , s2 , r2, rxy
- •3)Доверительные интервалы
- •4)Однофакторный дисперсионный анализ
Задача проверки правдоподобия гипотез.
Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным статистическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на наличие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математическая статистика выработала ряд специальных приемов.
Задача нахождения неизвестных параметров распределения
Часто при обработке статистического материала вовсе не возникает вопрос об определении законов распределения исследуемых случайных величин. Обыкновенно это бывает связано с крайне недостаточным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случайная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений — определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об определении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности и надежности.
Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Построить диаграмму рассеяния нанести на нее уравнения регресси Y на X
y=*0 +*1x и X на Y x=*0 +*1y.
Сначала вычислим суммы
xi , yi ,x2i ,y2i , xiyi , (xi+yi)2
Для контроля правильности вычислений используется тождество
(xi+yi)2= x2i + 2 xiyi + y2i
Выборочные средние находятся по формулам
x*=*1,0=(1/n) xi , y*=*0,1=(1/n) yi . (1)
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :
Qx=(xi – x*)2=x2i – (x)2i/n , (2)
Qy=(yi – y*)2=y2i – (y)2i/n , (3)
Qxy=(xi – x*)(yi – y*)=xiyi – (x i)(yi )/n , (4)
Отсюда
D*x= (1/n) Qx , D*y= (1/n) Qy ,
R=(*1,1)/ (D*x D*y)1/2= (Qxy)/( Qx Qy)1/2 (5)
Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением
y=*0 +*1x= y* + r (D*y / D*x ) (x – x*)
Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам
1*=[n xiyi – (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)
0* = y*- 1*x* (7)
Аналогично определяется выборочная линейная регрессия X на Y :
x=*0 +*1y = x* + r (D*x / D*y ) (y – y*)
1*=[n xiyi – (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)
0*= x*- *1y* (9)
Для контроля правильности расчетов используют соотношение
(1*1*)1/2= r (10)
Прямые
y=*0 +*1x , x=*0 +*1y
Пересекаются в точке с координатами (x*, y* )
Функция y=*0 +*1x
Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями ŷi=*0 +*1x называются остатками и обозначаются ei :
ei = yi – ŷ i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)
Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле
S2= e2i /(n-2)=1/(n-2) [ yi – (*0 +*1xi)]2=Qe/(n-2) (12)
Величина Qe определяемая выражением
Qe = e2i= (yi – ŷ i)2 (13)
Называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
(yi – y*i)2 = (ŷi – y*i )2 + (yi – ŷi) 2 (14)
Которое записывается в виде
Qy = Qr + Qe , где
Qy= (yi – y*i)2= y2i – n*(y*i )2,
Qr = (ŷi – y*i )2=*1 Qxy=2*1 Qx= Q2xy/ Qx (15)
Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.
Полезной характеристокой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле
R2= Qr / Qy =1 – (Qe / Qy) (16)
Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=y* , которая объсняется выборочной регрессией . Величина R= + (R2)1/2 является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями ŷi , предсказываемыми регрессией , т.е.
R= p*yŷ= ryŷ
В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииrxyимеется следующее соотношение :
rxy = ( знак *1 ) R .