Скачиваний:
18
Добавлен:
17.04.2013
Размер:
301.06 Кб
Скачать

1.2. Задача проверки правдоподобия гипотез.

Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным стати­стическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на нали­чие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математи­ческая статистика выработала ряд специальных приемов.

1.3. Задача нахождения неизвестных параметров распределения

Часто при обработке статистического материала вовсе не возни­кает вопрос об определении законов распределения исследуемых слу­чайных величин. Обыкновенно это бывает связано с крайне недоста­точным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случай­ная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений — определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неиз­бежно значительный элемент случайности; поэтому случайными ока­зываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об опреде­лении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошиб­кам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности и надежности.

2.Статистическое описание и выборочные характеристики двумерного случайного вектора.

Пусть,i=1,2,…, n, - выборка объема n из наблюдений случайного двумерного вектора . Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения ,i=1,2,…,n , с вероятностями, равными 1/n. Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.

Вычисление указанных выборочных характеристик удобно вычислять в следующей последовательности. Сначала вычисляют суммы

,,,,,.

Для контроля правильности вычислений используется тождество

.

Выборочные средние находятся по формулам

.

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних

= ,

,

.

Дисперсия находится по формулам: ,; коэффициент корреляции считается как

.

Выборочная линейная регрессия Y на X по выборке,i=1,2,…,n , определяется уравнением

Коэффициенты иназываются выборочными коэффициентами регрессии. Они вычисляются по формулам: ,

.

Аналогично определяются выборочная линейная регрессия X на Y

.

Коэффициенты инаходятся по формулам:

, .

Для контроля правильности расчетов используется соотношение: .

Прямые ,пересекаются в точке с координатами.

Для нахождения оценок параметров регрессии по результатам наблюдений используется метод наименьших квадратов. По этому методу в качестве оценок параметров выбирают такие значенияи, которые минимизируют сумму квадратов отклонений наблюдаемых значений случайных величин,i=1,2,…,n , от их математических ожиданий, т.е. сумму .

Оценки параметров линейной регрессии, получаемые по методу наименьших квадратов, при любом законе распределения ошибок наблюдений ,i=1,2,….n , имеют следующие свойства:

1. Они являются линейными функциями результатов наблюдений , i=1,2,…,n , и несмещенными оценками параметров, т.е. ,j=0,1.

2. Они имеют минимальные дисперсии в классе не смещенных оценок, являющихся линейными функциями результатов наблюдений. Если ошибки наблюдений не коррелированны и имеют нормальное распределение , т.е. , то в дополнение к свойствам 1,2 выполняется свойство:

3. МНК – оценки совпадают с оценками, вычисляемыми по методу максимального подобия.

Функция определяет выборочную регрессиюY на X . Последняя является оценкой предполагаемой линейной регрессией по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при , i=1,2,…,n , и расчетными значениями называются остатками и обозначаются : .

Качество аппроксимации результатов наблюдений , i=1,2,…,n , определяются величиной остаточной дисперсии, вычисляемой по формуле

.

Величина , определяемая выражением, называется остаточной суммой квадратов.

Остаточную сумму квадратов получают из тождества

,

которое записывается в виде:

где ,

.

Величина называется суммой квадратов, обусловленной регрессией. Полезной характеристикой линейной регрессии является коэффициент детерминацииR2 , вычисляемый по формуле: .

Коэффициент детерминации R2 равен той доле разброса результатов наблюдений,i=1,2,…,n , относительно горизонтальной прямой , которая объясняется выборочной регрессией. Величина R является оценкой коэффициента корреляции между результатами наблюдений и вычисленными значениями, предсказываемыми регрессией. В случае линейной регрессииY на X (одной независимой переменой X) между коэффициентом R и выборочным коэффициентом корреляции имеется следующее соотношение:

.

Доверительным интервалом для параметра называется интервал, содержащий истинное значение с заданной вероятностью, т.е.. Числоназывается доверительной вероятностью, а значение- уровнем значимости. Статистики, определяемые по выборке из генеральной совокупности с неизвестным параметром, называются нижней и верхней границами доверительного интервала.

Границы доверительных интервалов для параметров линейной регрессии имеют вид:

,

, где - квантиль распределения Стьюдента сn-2 степенями свободы.

Границы доверительного интервала для среднего значения , соответствующего заданному значению, определяются формулой:.

Доверительный интервал для дисперсии ошибок при неизвестном и при доверительной вероятностиимеет вид, где- квантиль распределениясn-2 степенями свободы.

Соседние файлы в папке 18 вар