
- •Математическая статистика и прогнозирование
- •1. Вариационные ряды
- •2. Точечные и интервальные оценки параметров распределения
- •3. Проверка гипотез.
- •4. Регрессионный и корреляционный анализ.
- •5. Моделирование временных рядов и прогнозирование
- •Критические точки f(α; k1; k2) распределения Фишера–Снедекора
Министерство образования и науки Российской Федерации
Саратовский государственный технический университет имени Гагарина Ю.А.
Балаковский институт техники, технологии и управления
Математическая статистика и прогнозирование
Методические указания к выполнению контрольной работы
для студентов направления 230400.62
заочной формы обучения
Одобрено
редакционно-издательским советом
Балаковского института техники,
технологии и управления
Балаково 2013
ОСНОВНЫЕ ПОНЯТИЯ
1. Вариационные ряды
Генеральной совокупностью называется вся подлежащая изучению совокупность объектов (наблюдений).
Выборочной совокупностью, или просто выборкой, называется совокупность случайно отобранных из генеральной совокупности объектов.
Объемом совокупности (выборочной или генеральной) называется число объектов в этой совокупности. Различные наблюдаемые значения признака называют вариантами (обозначаются хi). Числа, показывающие, сколько раз встречаются варианты в совокупности, называются частотами (обозначаются ni). Тогда объем выборки можно определить как n=∑ni. Отношение частот к объему выборки wi=ni/n называют относительными частотами. Последовательность вариант, записанных в порядке возрастания или убывания с соответствующими им частотами (или относительными частотами) называется вариационным рядом. Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину, и непрерывным (интервальным), если его значения могут отличаться одно от другого на сколь угодно малую величину.
Для наглядности представления вариационного ряда строят различные графики статистического распределения, в частности, полигон и гистограмму. Полигон, как правило, служит для изображения дискретного вариационного ряда, и представляет собой ломаную, в которой концы отрезков имеют координаты (xi, ni) или (xi, wi). Гистограмма служит для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака (x i–1, xi), и высотами, равными частотам ni (или относительным частотам wi) интервалов. Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения.
2. Точечные и интервальные оценки параметров распределения
Статистической
оценкой
неизвестного параметра θ генеральной
совокупности называют функцию наблюдений
над случайной величиной X:
.
Поскольку X1,
X2,
…, Xn
– случайные величины, то и оценка
также
является случайной величиной, в отличие
от оцениваемого параметра θ. Оценка
называется
несмещенной,
если ее математическое ожидание равно
оцениваемому параметру, т.е. М(
)=θ.
В противном случае оценка называется
смещенной.
Несмещенная оценка
называется
эффективной,
если она имеет наименьшую дисперсию
среди всех возможных несмещенных оценок
параметра θ, вычисленных по выборкам
одного и того же объема Оценка
называется
состоятельной,
если она сходится по вероятности к
оцениваемому параметру:
для
любого ε > 0.
Генеральной
средней
конечной генеральной совокупности
называют среднее арифметическое
значений признака генеральной
совокупности. Пусть из генеральной
совокупности объема n
отобрана случайная выборка X1,
X2,
..., Xn
. Выборочная средняя
,
которая является несмещенной и
состоятельной оценкой генеральной
средней, определяется по формуле:
(2.1)
Если значения признака x1, x2, ..., xk имеют соответственно частоты n1, n 2, ..., n k, причем n = ∑ ni , то
(2.2)
В
качестве характеристики разброса
значений количественного признака X
вокруг своего среднего значения
используется дисперсия. В случае конечной
генеральной совокупности генеральной
дисперсией
D
= σ2
называют среднее арифметическое
квадратов отклонений значений признака
генеральной совокупности от их среднего
значения
.
Выборочной
дисперсией
Dв
называют среднее арифметическое
квадратов отклонений наблюдаемых
значений признака от их среднего значения
.
Выборочная дисперсия является смещенной
оценкой генеральной дисперсии.
Если все значения x 1, x 2, ..., x n признака выборки объема n различны, то
(2.3)
Если значения признака x1, x2, ..., xk имеют соответственно частоты n1, n 2, ..., n k, причем n = ∑ ni , то
(2.4)
Несмещенной оценкой генеральной дисперсии является исправленная выборочная дисперсия
(2.5)
Если в качестве оценки параметра предлагается число – точка на координатной оси, то оценка называется точечной. Оценки, рассмотренные выше – точечные.
Интервальной
оценкой
параметра θ
называют числовой интервал
,
который с заданной вероятностью γ
накрывает неизвестное значение параметра
θ.
Такой интервал называется доверительным,
а вероятность γ
называется доверительной
вероятностью,
или надежностью оценки.
Границы доверительного интервала и его длина находятся по выборочным данным, и являются случайными величинами. Величина доверительного интервала уменьшается с ростом объема выборки n и увеличивается с ростом доверительной вероятности γ. Если количественный признак генеральной совокупности X имеет нормальное распределение, то доверительный интервал для математического ожидания имеет вид
(2.6)
В случае, когда генеральная дисперсия D = σ2 является известной величиной, то точность оценки δ находится по формуле
,
, (2.7)
где число t определяется из равенства Φ(t) = γ/2, т.е. по таблице функции Лапласа (приложение 1) находят значение аргумента t, которому соответствует значение функции Лапласа γ/2.
В
случае, когда генеральная дисперсия
неизвестна, а известна лишь ее исправленная
выборочная оценка
, то точность оценки δ
находится по формуле
,
(2.8)
где значение числа T(1 – γ; n –1) определяется по таблице критических точек распределения Стьюдента (приложение 2) при уровне вероятности α=1– γ и числе степеней свободы n–1.
Доверительный интервал для среднеквадратического отклонения σ нормального распределения имеет вид
,
(2.9)
где значения χ12, χ22 находятся по таблице критических точек распределения χ2 (приложение 3) при числе степеней свободы n–1 и уровнях вероятности (1 + γ) /2 и (1 – γ) /2 соответственно.