Добавил:

korayakov Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

Теория вероятностей и математическая статистика

Файл:

Курсовые / Курсачи ЭКТ 2-2 / 26 вар / тервер в-26.doc

Скачиваний:

Добавлен:

17.04.2013

Размер:

284.16 Кб

Скачать

☆

<<< < Предыдущая 12 / 32 3 > Следующая >>>

Для контроля правильности вычислений используется тождество

 (x_i+y_i)²= x²_i + 2 x_iy_i + y²_i

Выборочные средние находятся по формулам

x^*=^*_1,0=(1/n) x_i, y^*=^*_0,1=(1/n) y_i_.(1)

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :

Q_x=(x_i– x^*)²=x²_i – (x)²_i/n , (2)

Q_y=(y_i– y^*)²=y²_i – (y)²_i/n , (3)

Q_xy=(x_i– x^*)(y_i– y^*)=x_iy_i – (x_i)(y_i )/n , (4)

Отсюда

D^*_x= (1/n) Q_x , D^*_y= (1/n) Q_y ,

R=(^*_1,1)/ (D^*_x D^*_y)^1/2= (Q_xy)/( Q_x Q_y)^1/2 (5)

Выборочная линейная регрессия Y на X по выборке (x_i , y_i ), i= 1,......, n определяется уравнением

y=^*₀+^*₁x= y^* + r (D^*_x / D^*_y) (x– x^*)

Коэффициенты ^*₀и ^*₁называются выборочными коэффициентами регрессии. Они вычисляются по формулам

₁^*=[n  x_iy_i – (x_i)(y_i )]/(n x²_i - (x_i)²) = Q_xy/ Q_x (6)

₀^*= y^*- ₁^*x^* (7)

Аналогично определяется выборочная линейная регрессия X на Y :

x=^*^₀+^*^₁y = x^* + r (D^*_x / D^*_y) (y– y^*)

₁^*^=[n  x_iy_i – (x_i)(y_i )]/(n y²_i - (y_i)²) = Q_xy/ Q_y (8)

₀^*^= x^*- ^*^₁y^* (9)

Для контроля правильности расчетов используют соотношение

(₁^*₁^*^)^1/2= r (10)

Прямые

y=^*₀+^*₁x , x=^*^₀+^*^₁y

Пересекаются в точке с координатами (x^*, y^*)

Функция y=^*₀+^*₁x

Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=x_i, i=1,2,....,n, и расчетными значениями ŷ_i=^*₀+^*₁x называются остатками и обозначаются e_i :

e_i= y_i – ŷ _i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)

Качество аппроксимации результатов наблюдений (x_i,y_i), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле

S²= e²_i/(n-2)=1/(n-2) [ y_i – (^*₀+^*₁x_i)]²=Q_e/(n-2) (12)

Величина Q_eопределяемая выражением

Q_e=  e²_i= (y_i– ŷ _i) (13)

Называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

 (y_i– y^*_i)² =  (ŷ_i – y^*_i)² +  (y_i– ŷ_i) ² (14)

Которое записывается в виде

Q_y = Q_r + Q_e, где

Q_y=  (y_i– y^*_i)²=  (y²_i– n*y^*_i) ,

Q_r = (ŷ_i – y^*_i)²=^*₁ Q_xy=^2*₁ Q_x= Q²_xy/ Q_x(15)

Величина Q_rназывается суммой квадратов, обусловленной регрессией регрессией.

Полезной характеристокой линейной регрессии является коэффициент детерминации R² , вычисляемый по формуле

R²= Q_r / Q_y =1 – (Q_e / Q_y) (16)

Коэффициент детерминации R² равен той доле разброса результатов наблюдений (x_i,y_i), i = 1,2,......,n , относительно горизонтальной прямой y=y^* , которая объсняется выборочной регрессией . Величина R= + (R²)^1/2 является оценкой коэффициента корреляции между результатами наблюдений y_iи вычисленными значениями ŷ_i , предсказываемыми регрессией , т.е.

R= p^*_y_ŷ= r_y_ŷ

В случае линейной регрессии Y на x (одной независимой переменной x) между коэффициентом R и выборочным коэффициентом корреляции r_xy имеется следующее соотношение :

r_xy = ( знак ^*₁ ) R .

Однофакторный дисперсионный анализ.

Пусть результаты наблюдений составляют l независимых выборок ( групп ), полученных из l нормально распределенных генеральных совокупностей, которые имеют, вообще говоря, различные средние m₁ , m₂ , ..... , m_l и равные дисперсии ². Проверяется гипотеза о равенстве средних H₀ m₁= m₂ = ..... =m_l. На практике такая задача возникает при исследованиии влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на l различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае на синтересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку ( гипотеза H₀ ) . При l=2 для проверки гипотезы H₀используется известные критерии значимости. Если l>2, то для проверки гипотезы о равенстве l средних применяют однофакторный дисперсионный анализ, суть которого состоит в следующем.

Пусть x_ik обозначает i–й элемент k–й выборки , i = 1,2,......,n , k = 1,2,......,n , x^*_k-выборочное среднее k–й выборки, т.е.

x^*_k=(1/n_k)  x_ik= (1/n) x ._.k ,

k^*- общее выборочное среднее, т.е.

x^*= x_ik= (1/n) x . . ,

где n – общее число наблюдений, n=  n_k

Общая сумма квадратов отклонений наблюдений от общего среднего x^* может быть предтавлена так :

 ( x_ik – x^*)²= n_k ( x^*_k – x^*)²+ ( x_ik – x^*_k)²(17)

Это основное тождество дисперсионного анализа. Запишем его в виде

Q=Q₁+Q₂ (18)

Где Q- общая сумма квадратов отклонений наблюдений от общего среднего, Q₁ – сумма квадратов отклонений выборочных средних x^*_kот общего среднего x^* (между группами), Q₂-сумма квадратов отклонений наблюдений от выборочных средних групп (внутри групп).

Тождество (1) легко проверяется , если воспользоваться очевидным равенством

( x_ik – x^*)= [( x^*_k – x^*)+ ( x_ik – x^*_k)]

и учесть, что

 ( x_ik – x^*_k) ( x^*_k – x^*)=0

в силу определения средних x^*_k и x^*

Если верна гипотеза H₀: m₁= m₂ = .....= m_l, то статистики Q_1/² и Q₂/² независимы и имеют распределение ² с l-1 и n-l степенями свободы. Следовательно, статистики S²₁₌ Q₁/(l-1) и S²₂₌ Q₂/(n-l) являются несмещенными оценками неизвесной дисперсии ². Оценка S²₁характеризует рассеяние групповых средних, а оценка S²₂–рассеяние внутри групп, которое обусловленно случайными вариациями результатов наблюдений. Значительное превышение величины S²₁над значением величины S²₂можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с l-1 и n-l степенями свободы, т.е.

S²₁/S²₂₌ Q₁/(l-1)Q₂/(n-l)=F(l-1,n-l)

Статистика используется для проверки гипотезы H₀: m₁= m₂ = .....= m_l. Гипотеза H₀ не противоречит результатам наблюдений, если выборочное значение F_в статистики меньше квантили F_1-_(l-1,n-l) , т.е. если F_в< F_1-_(l-1,n-l). В этом случае x^* и Q₂/(n-l) являются несмещенными оценками параметров m и ² .Если F_в< F_1-_(l-1,n-l), то гипотеза H₀ отклоняется и следует считать, что среди средних m₁, m₂ , ....., m_l имеется хотя бы два не равных друг другу.

Линейные контрасты

Если гипотеза о равенстве средних отклоняется, то требуется определить, какие именно группы имеют значимое различие средних. Для этих целей используется метод линейных контрастов. Линейный контраст Lk определяется как линейная комбинация

Lk=c_km_k

где c_kk = 1,2,......,l- константы, однозначно определяемые из формулировки проверяемых гипотез, причем c_k = 0 . Оценка Lk равна Lk^* =c_kx^*_k, а оценка дисперсии Lk^* равна

S²_LK= D[Lk^*] = ^*2 (c²_k/n_k) = Q₂/(n-l)  (c²_k/n_k)

<<< < Предыдущая 12 / 32 3 > Следующая >>>