
Курсовая работа по математической статистике
«ВЫБОРОЧНЫЙ МЕТОД. СТАТИСТИЧЕСКИЕ ОЦЕНКИ. ЛИНЕЙНАЯ РЕГРЕССИЯ»
для студентов потока ТВМС доцента Марковой И.А.
(группы 2101,2102 - менеджмент, 2111,2112 - ГМУ, 2131 - социологи)
Методические указания по выполнению курсовой работы.
Часть 1.
Совокупность значений какого-то признака объектов называется генеральной совокупностью. Основной задачей математической статистики является исследование генеральной совокупности статистически, т.е. выяснение вероятностных свойств совокупности: распределения, числовых характеристик и т.д.
Для исследования некоторых свойств генеральной совокупности обычно делают выборку объектов из генеральной совокупности. С помощью выборки оценивают генеральную совокупность по вероятностным свойствам. Чтобы оценки были достоверными, выборка должна быть представительной, т.е. её вероятностные свойства должны совпадать или быть близкими к свойствам генеральной совокупности. Объём выборки определяется особенностями решаемой задачи.
Представительную выборку можно получить, если выбирать объекты для исследования случайно, т.е. гарантировать всем объектам генеральной совокупности одинаковую вероятность подвергнуться исследованию.
Случайно выбранный объект после проверки нужного признака можно возвратить (повторная выборка) или не возвратить (бесповторная выборка) обратно в генеральную совокупность. В первом случае получаем более независимую и представительную выборку.
Часто под генеральной совокупностью понимают множество значений исследуемой случайной величины. Для исследования случайной величины при постоянных условиях выполняются испытания. Совокупность полученных значений также называется выборкой и обрабатывается статистически. Методы статистической обработки выборки аналогичны в обоих случаях.
Пусть имеется
случайная величина
с
функцией распределения
.
Набор значений
случайной величины
,
полученных в результате
опытов,
называется
выборкой объёма n.
Предполагается, что опыты произведены
в одинаковых условиях и независимо.
Выборку
можно рассматривать как n-мерный
случайный вектор, где величины
независимы
и каждая из них распределена так же, как
случайная величина
:
.
Тогда говорят, что выборка значений
взята из генеральной совокупности
случайной величины
с теоретической функцией распределения
.
Выборка, расположенная
в порядке возрастания, называется
вариационным
рядом или
вариационной
таблицей. В
первом её столбце (ряду ) находятся
различные возможные значения (варианты)
генеральной совокупности, а во втором
– числа
,
т.е. частоты
появления i-го
значения, или числа
,так
называемые относительные
частоты
элемента
.
Очевидно, что
.
Полигоном
частот
выборки называется ломаная с вершинами
в точках
.
Полигоном
относительных частот выборки
называется ломаная с вершинами в точках
.
Гистограммой
частот
называют ступенчатую фигуру, состоящую
из прямоугольников, основаниями которых
служат частичные интервалы длиною h,
а высоты равны отношению
(плотность
частоты).
Площадь i-го
частичного прямоугольника равна
-
сумме частот вариантов i-го
интервала; следовательно, площадь
гистограммы частот равна сумме всех
частот, т.е. объёму выборки.
Гистограммой
относительных частот
называют ступенчатую фигуру, состоящую
из прямоугольников, основаниями которых
служат частичные интервалы длиною h,
а высоты равны
(плотность
относительной частоты).
Аналогично площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
Функцию
,
где n-объём
выборки, а k-количество
значений случайной величины
в выборке, меньших x,
называют эмпирической
функцией распределения.
Функция
-
неубывающая, её график имеет ступенчатый
вид.
ЭЛЕМЕНТЫ ТЕОРИИ СТАТИСТИЧЕСКИХ ОЦЕНОК.
По результатам
измерений (опытов) требуется найти
число, близкое к неизвестному значению
измеряемого параметра генеральной
совокупности. Пусть, например, по
значениям выборки объёма n
требуется оценить неизвестный параметр
закона (функции) распределения
.
Оценкой
неизвестного
параметра
назовём произвольную функцию
от выборки
.
Таким образом, статистическая оценка
есть случайная величина. Значения этой
функции
при
полученных в результате измерений
значениях
будем рассматривать как приближённое
значение параметра
.
Это определение отражает только самое
общее требование, что оценка должна
определяться по значениям выборки.
Очевидно, что любая оценка не обязательно
будет близкой к оцениваемому параметру
.
Введём два свойства оценок, которые
обеспечивают их близость к соответствующим
параметрам.
Оценка
параметра
называется несмещённой,
если её математическое ожидание равно
оцениваемому параметру:
.
Несмещённость оценки означает, что в среднем оценка совпадает с оцениваемым параметром, т.е. оценка не имеет систематической ошибки.
Несмещённая оценка параметра называется эффективной, если её дисперсия минимальна по сравнению с дисперсией любой другой несмещённой оценки. Во многих задачах построить эффективную оценку не удаётся. В этих случаях из построенных несмещённых оценок выбирается оценка с наименьшей дисперсией и она тоже называется эффективной.
Мы определили
оценку
как
функцию от выборки фиксированного
объёма n.
Но её можно рассматривать как
последовательность оценок
,
применяемых для выборок объёма 1,2 и т.д.
Оценка
параметра
называется состоятельной,
если для любого
при
. Свойство состоятельности означает,
что даже небольшие отклонения от
истинного значения параметра с большой
вероятностью должны становиться ещё
более малыми при больших значениях n.
Другими словами, свойство состоятельности
обеспечивает сближение по вероятности
статистической оценки с измеряемым
параметром при увеличении числа
измерений.