Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовые / Курсачи ЭКТ 2-2 / 4 вар / тервер-слющай.doc
Скачиваний:
17
Добавлен:
17.04.2013
Размер:
279.04 Кб
Скачать

1.2. Задача проверки правдоподобия гипотез.

Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным стати­стическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на нали­чие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математи­ческая статистика выработала ряд специальных приемов.

1.3. Задача нахождения неизвестных параметров распределения

Часто при обработке статистического материала вовсе не возни­кает вопрос об определении законов распределения исследуемых слу­чайных величин. Обыкновенно это бывает связано с крайне недоста­точным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случай­ная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений — определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неиз­бежно значительный элемент случайности; поэтому случайными ока­зываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об опреде­лении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошиб­кам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности и надежности.

2.Статистическое описание и выборочные характеристики двумерного случайного вектора.

Пусть,i=1,2,…,n, - выборка объемаnиз наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения ,i=1,2,…,n, с вероятностями, равными 1/n. Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.

Вычисление указанных выборочных характеристик удобно вычислять в следующей последовательности. Сначала вычисляют суммы

,,,,,.

Для контроля правильности вычислений используется тождество

.

Выборочные средние находятся по формулам

.

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних

= ,

,

.

Дисперсия находится по формулам: ,; коэффициент корреляции считается как

.

Выборочная линейная регрессия YнаXпо выборке,i=1,2,…,n, определяется уравнением

Коэффициенты иназываются выборочными коэффициентами регрессии. Они вычисляются по формулам: ,

.

Аналогично определяются выборочная линейная регрессия XнаY

.

Коэффициенты инаходятся по формулам:

, .

Для контроля правильности расчетов используется соотношение: .

Прямые ,пересекаются в точке с координатами.

Для нахождения оценок параметров регрессии по результатам наблюдений используется метод наименьших квадратов. По этому методу в качестве оценок параметров выбирают такие значенияи, которые миними-зируют сумму квадратов отклонений наблюдаемых значений случайных величин,i=1,2,…,n, от их математических ожиданий, т.е. сумму.

Оценки параметров линейной регрессии , получаемые по методу наименьших квадратов , при любом законе распределения ошибок наблюдений ,i=1,2,….n, имеют следующие свойства :

1. Они являются линейными функциями результатов наблюдений ,i=1,2,…,n, и несмещенными оценками параметров, т.е.,j=0,1.

2. Они имеют минимальные дисперсии в классе не смещенных оценок , являющихся линейными функциями результатов наблюдений . Если ошибки наблюдений не коррелированны и имеют нормальное распределение , т.е. , то в дополнение к свойствам 1,2 выполняется свойство:

3. МНК – оценки совпадают с оценками , вычисляемыми по методу максимального подобия .

Функция определяет выборочную регрессиюYнаX. Последняя является оценкой предполагаемой линейной регрессией по результатам наблюдений. Разности между наблюдаемыми значениями переменнойYпри ,i=1,2,…,n, и расчетными значенияминазываются остатками и обозначаются :.

Качество аппроксимации результатов наблюдений ,i=1,2,…,n, определяются величиной остаточной дисперсии, вычисляемой по формуле

.

Величина , определяемая выражением, называется остаточной суммой квадратов.

Остаточную сумму квадратов получают из тождества

,

которое записывается в виде:

где ,

.

Величина называется суммой квадратов, обусловленной регрессией. Полезной характеристикой линейной регрессии является коэффициент детерминацииR2, вычисляемый по формуле: .

Коэффициент детерминации R2равен той доле разброса результатов наблюдений,i=1,2,…,n, относительно горизонтальной прямой , которая объясняется выборочной регрессией. ВеличинаRявляется оценкой коэффициента корреляции между результатами наблюденийи вычисленными значениями, предсказываемыми регрессией. В случае линейной регрессииYнаX(одной независимой переменойX) между коэффициентомRи выборочным коэффициентом корреляции имеется следующее соотношение:

.

Доверительным интервалом для параметра называется интервал, содержащий истинное значение с заданной вероятностью, т.е.. Число называется доверительной вероятностью, а значение - уровнем значимости. Статистики, определяемые по выборке из генеральной совокупности с неизвестным параметром, называются нижней и верхней границами доверительного интервала.

Границы доверительных интервалов для параметров линейной регрессии имеют вид:

,

, где- квантиль распределения Стьюдента сn-2 степенями свободы.

Границы доверительного интервала для среднего значения , соответствующего заданному значению, определяются формулой:.

Доверительный интервал для дисперсии ошибок при неизвестном и при доверительной вероятностиимеет вид, где- квантиль распределениясn-2 степенями свободы.

Соседние файлы в папке 4 вар