Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория к экзамену по Анализу данных.docx
Скачиваний:
29
Добавлен:
31.03.2020
Размер:
993.01 Кб
Скачать

8. Точечные оценки для математического ожидания и дисперсии. Метод максимального правдоподобия.

Оценки математического ожидания и дисперсии вычисляются по формулам

 ,  , (1)

 

где  — частота варианты  в выборке объема  .

Если объем выработки велик, то вычисление точечных оценок математического ожидания  и дисперсии  по формулам (1)громоздко. Для сокращения вычислений элементам выборки, попавшим в  –тый интервал, припишем значения равные серединам интервалов

Дана выборка  генеральной случайной величины Х. Неизвестными параметрами распределения случайной величины Х являются 

Случайная выборка  состоит из независимых случайных величин, распределение каждой из которых совпадает с распределением случайной величины Х, то есть

если Х дискретна;

если Х непрерывна.

Здесь указана зависимость от параметра  вероятности принятия случайной величиной Х значения х, или значение плотности распределения случайной величины Х в точке х.

Функция правдоподобия – это функция  значение которой в точке определяется соотношением:

Когда случайная величина Х дискретна, функция правдоподобия в точке  равна вероятности того, что случайная выборка  принимает значение .

Если случайная величина Х непрерывна, то функция правдоподобия в точке  равна значению плотности совместного распределения  в точке 

Чем больше значение функции правдоподобия в точке  тем чаще (с большей вероятностью) случайная выборка  принимает значения  или очень близкие к нему (в случае непрерывного распределения). Поэтому в роли точечных оценок неизвестных параметров выбирают значения  при которых достигается максимум функции правдоподобия:

Максимум рассматривается по области допустимых значений  Методом максимального правдоподобия выбираются оценки, при которых выборка  наиболее вероятна (наиболее правдоподобна).

Точка максимума не изменится, если вместо L взять 

Напомним необходимое условие нахождения экстремума функции нескольких переменных:

Задача 1. Дана выборка  генеральной случайной величины Х, распределенной по показательному закону. Методом максимального правдоподобия оценить неизвестный параметр распределения.

Запишем плотность распределения случайной величины Х:

при 

при 

Неизвестным параметром распределения является  Во введенных обозначениях 

Генеральная случайная величина Х распределена по показательному закону, поэтому все выборочные значения неотрицательны.

Удобнее рассматривать максимум логарифма функции правдоподобия:

9. Проверка гипотезы о соответствии наблюдаемых значений нормальному распределению.

10. Проверка гипотезы о соответствии наблюдаемых значений показательному распределению.

. Проверка гипотезы о показательном распределении генеральной совокупности.

Для того чтобы при уровне значимости а проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:

1. Найти по заданному эмпирическому распределению выборочную среднюю хcp. Для этого находят середину i-го интервала xcpi = (xi+xi+1)/2, составляют последовательность равноотстоящих вариант и соответствующих им частот.

2. Принять в качестве оценки параметра Х показательного распределения величину, обратную выборочной средней:

3. Найти вероятности попадания X в частичные интервалы (xi,xi+1) по формуле:

Pi = P(xi < X < xi+1) = e-λxi - e-λxi+1

4. Вычислить теоретические частоты:

ni = n • Pi

5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s-2, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.

Соседние файлы в предмете Анализ данных