- •Томский государственный университет систем управления и радиоэлектроники (тусур)
- •2012 Реферат
- •Томский государственный университет систем управления ирадиоэлектроники
- •1 Постановка задачи
- •Часть I.
- •Часть II
- •2.1 Теоретический обзор
- •Распределение Стьюдента
- •2.2 Расчеты
- •3. Часть II
- •4. Заключение
- •5. Литература
1 Постановка задачи
В первой части данной работы нужно разъяснить, что такое точечное и интервальное оценивание, а так же закрепить полученные знания на примере оценивания таких параметров, как дисперсия, математическое ожидание и вероятность.
Во второй части необходимо рассмотреть такое понятие, как регрессионный анализ, а именно метод наименьших квадратов (МНК). Также, во второй части нужно закрепить полученные знания на практике. Задача состоит в извлечении истинного тренда.
Часть I.
Дана выборка из N =100 значений.
Требуется:
а) найти статистический ряд;
б) построить гистограмму и полигон частот;
в) найти оценки для математического ожидания и дисперсии;
г) считая распределение генеральной совокупности нормальным,
найти границы доверительного интервала для математического ожидания и дисперсии при надёжности а= 0,95;
д) проверить с помощью критерия Х2 гипотезу о том, что выборка извлечена из нормальной генеральной совокупности с математическим ожиданием и средним квадратическим отклонением равными соответственно статистическому среднему и статистическому среднему квадратичному отклонению. Уровень значимости принять равным а = 0,05.
|
41,77 |
41,81 |
41,64 |
41,54 |
41,91 |
41,67 |
41,55 |
41,84 |
41,61 |
41,80 |
|
42 |
62 |
86 |
65 |
70 |
85 |
60 |
69 |
95 |
62 |
|
71 |
50 |
76 |
73 |
66 |
43 |
68 |
52 |
70 |
46 |
|
58 |
89 |
56 |
32 |
53 |
99 |
83 |
35 |
61 |
37 |
|
95 |
57 |
87 |
75 |
82 |
50 |
41 |
78 |
42 |
98 |
|
64 |
80 |
65 |
58 |
72 |
80 |
60 |
72 |
70 |
62 |
|
70 |
92 |
53 |
60 |
74 |
69 |
61 |
55 |
38 |
51 |
|
82 |
44 |
97 |
78 |
80 |
34 |
70 |
49 |
60 |
63 |
|
75 |
63 |
70 |
48 |
52 |
73 |
69 |
71 |
78 |
47 |
|
58 |
74 |
55 |
65 |
78 |
54 |
51 |
68 |
56 |
64 |
Часть II
В MathCAD с помощью датчика (генераторы) случайных чисел с нормальным законом распределения rnorm(m,μ,σ)зададим шум. Он возвращает вектор m случайных чисел, имеющих нормальное распределение с математическим ожиданием μ и среднеквадратическим отклонением σ.Математическое ожидание примем равным нулю, а дисперсию равной единице.
![]()
![]()
Истинный
тренд имеет вид:
![]()

Функция
сигнал + шум имеет вид:
![]()

2. ЧастьI
2.1 Теоретический обзор
Теория оценок.
Параметры законов распределения обычно оцениваются по выборке, т.е строится функция выборочных данных, которая мало отличается от истинного значения параметра. Существуют разные способы оценивания. Основными являются точечные и интервальные оценки параметров закона распределения.
1. Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра приближается отдельным числом.
Способы точечного оценивания:
Метод моментов.
Метод максимального правдоподобия
Точечные оценки характеризуются следующими свойствами:
Смещение. Оценка параметра называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра.
Состоятельность. При достаточно больших объемах выборки оценка параметра стремится к истинному значению.
Эффективность. Та оценка, у которой дисперсия минимальна, называется эффективной оценкой.
Для точечных оценок математического ожидания и дисперсии были найдены следующие формулы:


Где n – объем выборки
2. Интервальное оценивание - оценка, представляемая интервалом значений, внутри которого, с задаваемой исследователем вероятностью, находится истинное значение оцениваемого параметра.
Главную роль в таком оценивании играет доверительный интервал.
Доверительный интервал – интервал, в котором находится истинное значение параметра с заданной вероятностью.
Вероятность того, что истинное значение лежит в интервале называетсядоверительной вероятностью (коэффициентом доверия) или надежностью, соответствующей данному доверительному интервалу.
Для построения доверительного интервала требуется знать:
1. Закон распределения статистики.
2. Точечная оценка параметров.
3. Уровень значимости
4. Квантиль P – значение случайной величины, при котором функция распределения равна P.
Формулы для расчета доверительного интервала для математического ожидания и дисперсии:


Где N объем выборки, msr – точечная оценка математического ожидания, St1-a/2(N-1) - квантиль распределения Стьюдента уровня 1-a/2 и степенью свободы N-1, S2 – точечная оценка дисперсии,
(N-1)-
квантиль распределения Х2 Пирсона уровня
1-а.2, и степенью свободы N-1.
Квантили этих распределений табулированы.
Критерий
согласия
Пирсона
Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми) частотами, рассчитываемыми по формулам теоретического распределения.
Условия применения:
объем выборки
,
выборочные данные сгруппированы в
интервальный вариационный ряд с числом
интервалов не менее 7, ожидаемые
(теоретические) частоты интервалов не
должны быть меньше 5.
Гипотеза Н0:
— плотность распределения
генеральной совокупности, из которой
взята выборка, соответствует теоретической
модели нормального распределения.
Альтернатива Н1:
![]()
Уровень значимости:
.
Порядок, применения:
1. Формулируется
гипотеза, выбирается уровень значимости
.
2. Получается
выборка объема
независимых наблюдений и представляется
эмпирическое распределение в виде
интервального вариационного ряда.
3. Рассчитываются
выборочные характеристики
и
S. Их используют в качестве генеральных
параметров и нормального распределения,
с которым предстоит сравнить эмпирическое
распределение.
4. Вычисляются значения теоретических частот попадания в i-й интервал группировки. Для этого необходимо вычислить:

где Ф0(u) — функции Лапласа, xвi и хнi — верхняя и нижняя границы i-го интервала группировки.
Если окажется, что
вычисленные ожидаемые частоты
некоторых интервалов группировки меньше
5, то соседние интервалы объединяются
так, чтобы сумма их ожидаемых частот
была больше или равна 5. Соответственно
складываются и эмпирические частоты
объединяемых интервалов.
5. Значение
-критерия
рассчитывается по формуле:
![]()
где ni — эмпирические
частоты;
–
ожидаемые (теоретические) частоты; k —
число интервалов группировки после
объединения.
6. Из таблиц
распределения
находится
критическое значение
критерия для уровня значимости
и
числа степеней свободы r = k-3
7. Вывод: если
то эмпирическое распределение не
соответствует нормальному распределению
на уровне значимости
,
в противном случае нет оснований отрицать
это соответствие.
