Добавил:

korayakov Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

Теория вероятностей и математическая статистика

Файл:

Курсовые / Курсачи ЭКТ 2-2 / 16 вар / Курсач 16 вар.doc

Скачиваний:

Добавлен:

17.04.2013

Размер:

244.22 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

Задача проверки правдоподобия гипотез.

Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным статистическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на наличие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математическая статистика выработала ряд специальных приемов.

Задача нахождения неизвестных параметров распределения

Часто при обработке статистического материала вовсе не возникает вопрос об определении законов распределения исследуемых случайных величин. Обыкновенно это бывает связано с крайне недостаточным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случайная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений — определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об определении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности и надежности.

Статистическое описание и выборочные характеристики двумерного случайного вектора.

Пусть (x_i,y_i), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Построить диаграмму рассеяния нанести на нее уравнения регресси Y на X

y=^*₀+^*₁x и X на Y x=^*^₀+^*^₁y.

Сначала вычислим суммы

x_i, y_i ,x²_i ,y²_i , x_iy_i , (x_i+y_i)²

Для контроля правильности вычислений используется тождество

 (x_i+y_i)²= x²_i + 2 x_iy_i + y²_i

Выборочные средние находятся по формулам

x^*=^*_1,0=(1/n) x_i, y^*=^*_0,1=(1/n) y_i_.(1)

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :

Q_x=(x_i– x^*)²=x²_i – (x)²_i/n , (2)

Q_y=(y_i– y^*)²=y²_i – (y)²_i/n , (3)

Q_xy=(x_i– x^*)(y_i– y^*)=x_iy_i – (x_i)(y_i )/n , (4)

Отсюда

D^*_x= (1/n) Q_x , D^*_y= (1/n) Q_y ,

R=(^*_1,1)/ (D^*_x D^*_y)^1/2= (Q_xy)/( Q_x Q_y)^1/2 (5)

Выборочная линейная регрессия Y на X по выборке (x_i , y_i ), i= 1,......, n определяется уравнением

y=^*₀+^*₁x= y^* + r (D^*_y / D^*_x) (x– x^*)

Коэффициенты ^*₀и ^*₁называются выборочными коэффициентами регрессии. Они вычисляются по формулам

₁^*=[n  x_iy_i – (x_i)(y_i )]/(n x²_i - (x_i)²) = Q_xy/ Q_x (6)

₀^*= y^*- ₁^*x^* (7)

Аналогично определяется выборочная линейная регрессия X на Y :

x=^*^₀+^*^₁y = x^* + r (D^*_x / D^*_y) (y– y^*)

₁^*^=[n  x_iy_i – (x_i)(y_i )]/(n y²_i - (y_i)²) = Q_xy/ Q_y (8)

₀^*^= x^*- ^*^₁y^* (9)

Для контроля правильности расчетов используют соотношение

(₁^*₁^*^)^1/2= r (10)

Прямые

y=^*₀+^*₁x , x=^*^₀+^*^₁y

Пересекаются в точке с координатами (x^*, y^*)

Функция y=^*₀+^*₁x

Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=x_i, i=1,2,....,n, и расчетными значениями ŷ_i=^*₀+^*₁x называются остатками и обозначаются e_i :

e_i= y_i – ŷ _i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)

Качество аппроксимации результатов наблюдений (x_i,y_i), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле

S²= e²_i/(n-2)=1/(n-2) [ y_i – (^*₀+^*₁x_i)]²=Q_e/(n-2) (12)

Величина Q_eопределяемая выражением

Q_e=  e²_i= (y_i– ŷ _i)² (13)

Называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

 (y_i– y^*_i)² =  (ŷ_i – y^*_i)² +  (y_i– ŷ_i) ² (14)

Которое записывается в виде

Q_y = Q_r + Q_e, где

Q_y=  (y_i– y^*_i)²=  y²_i– n*(y^*_i )²,

Q_r = (ŷ_i – y^*_i)²=^*₁ Q_xy=^2*₁ Q_x= Q²_xy/ Q_x(15)

Величина Q_rназывается суммой квадратов, обусловленной регрессией регрессией.

Полезной характеристокой линейной регрессии является коэффициент детерминации R² , вычисляемый по формуле

R²= Q_r / Q_y =1 – (Q_e / Q_y) (16)

Коэффициент детерминации R² равен той доле разброса результатов наблюдений (x_i,y_i), i = 1,2,......,n , относительно горизонтальной прямой y=y^* , которая объсняется выборочной регрессией . Величина R= + (R²)^1/2 является оценкой коэффициента корреляции между результатами наблюдений y_iи вычисленными значениями ŷ_i , предсказываемыми регрессией , т.е.

R= p^*_y_ŷ= r_y_ŷ

В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииr_xyимеется следующее соотношение :

r_xy = ( знак ^*₁ ) R .

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>