- •Московский Институт Электронной Техники
- •1. 1.3Адача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным.
- •1.2. Задача проверки правдоподобия гипотез.
- •1.3. Задача нахождения неизвестных параметров распределения
- •2.Статистическое описание и выборочные характеристики двумерного случайного вектора.
- •3.Однофакторный дисперсионный анализ.
- •Практическая часть
1.2. Задача проверки правдоподобия гипотез.
Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным статистическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на наличие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математическая статистика выработала ряд специальных приемов.
1.3. Задача нахождения неизвестных параметров распределения
Часто при обработке статистического материала вовсе не возникает вопрос об определении законов распределения исследуемых случайных величин. Обыкновенно это бывает связано с крайне недостаточным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случайная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений — определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об определении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности и надежности.
2.Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть,i=1,2,…,n, - выборка объемаnиз наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения ,i=1,2,…,n, с вероятностями, равными 1/n. Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.
Вычисление указанных выборочных характеристик удобно вычислять в следующей последовательности. Сначала вычисляют суммы
,,,,,.
Для контроля правильности вычислений используется тождество
.
Выборочные средние находятся по формулам
.
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних
= ,
,
.
Дисперсия находится по формулам: ,; коэффициент корреляции считается как
.
Выборочная линейная регрессия YнаXпо выборке,i=1,2,…,n, определяется уравнением
Коэффициенты иназываются выборочными коэффициентами регрессии. Они вычисляются по формулам: ,
.
Аналогично определяются выборочная линейная регрессия XнаY
.
Коэффициенты инаходятся по формулам:
, .
Для контроля правильности расчетов используется соотношение: .
Прямые ,пересекаются в точке с координатами.
Для нахождения оценок параметров регрессии по результатам наблюдений используется метод наименьших квадратов. По этому методу в качестве оценок параметров выбирают такие значенияи, которые миними-зируют сумму квадратов отклонений наблюдаемых значений случайных величин,i=1,2,…,n, от их математических ожиданий, т.е. сумму.
Оценки параметров линейной регрессии , получаемые по методу наименьших квадратов , при любом законе распределения ошибок наблюдений ,i=1,2,….n, имеют следующие свойства :
1. Они являются линейными функциями результатов наблюдений ,i=1,2,…,n, и несмещенными оценками параметров, т.е.,j=0,1.
2. Они имеют минимальные дисперсии в классе не смещенных оценок , являющихся линейными функциями результатов наблюдений . Если ошибки наблюдений не коррелированны и имеют нормальное распределение , т.е. , то в дополнение к свойствам 1,2 выполняется свойство:
3. МНК – оценки совпадают с оценками , вычисляемыми по методу максимального подобия .
Функция определяет выборочную регрессиюYнаX. Последняя является оценкой предполагаемой линейной регрессией по результатам наблюдений. Разности между наблюдаемыми значениями переменнойYпри ,i=1,2,…,n, и расчетными значенияминазываются остатками и обозначаются :.
Качество аппроксимации результатов наблюдений ,i=1,2,…,n, определяются величиной остаточной дисперсии, вычисляемой по формуле
.
Величина , определяемая выражением, называется остаточной суммой квадратов.
Остаточную сумму квадратов получают из тождества
,
которое записывается в виде:
где ,
.
Величина называется суммой квадратов, обусловленной регрессией. Полезной характеристикой линейной регрессии является коэффициент детерминацииR2, вычисляемый по формуле: .
Коэффициент детерминации R2равен той доле разброса результатов наблюдений,i=1,2,…,n, относительно горизонтальной прямой , которая объясняется выборочной регрессией. ВеличинаRявляется оценкой коэффициента корреляции между результатами наблюденийи вычисленными значениями, предсказываемыми регрессией. В случае линейной регрессииYнаX(одной независимой переменойX) между коэффициентомRи выборочным коэффициентом корреляции имеется следующее соотношение:
.
Доверительным интервалом для параметра называется интервал, содержащий истинное значение с заданной вероятностью, т.е.. Число называется доверительной вероятностью, а значение - уровнем значимости. Статистики, определяемые по выборке из генеральной совокупности с неизвестным параметром, называются нижней и верхней границами доверительного интервала.
Границы доверительных интервалов для параметров линейной регрессии имеют вид:
,
, где- квантиль распределения Стьюдента сn-2 степенями свободы.
Границы доверительного интервала для среднего значения , соответствующего заданному значению, определяются формулой:.
Доверительный интервал для дисперсии ошибок при неизвестном и при доверительной вероятностиимеет вид, где- квантиль распределениясn-2 степенями свободы.