
- •Факультет Учетно-экономический
- •Учебно - методический комплекс
- •Оглавление
- •Рабочая учебная программа
- •Основание
- •Краткое изложение программного материала Модуль 1 «Основы сбора статистических данных» Тема «Предмет, метод и задачи дисциплины. Основы теории статистического оценивания»
- •Тема «Статистическое наблюдение»
- •Тема «Организация выборочных обследований»
- •Тема «Математико-статистические основы выборочного метода».
- •Модуль 2 «Основы первичной обработки статистических данных. Статистическое оценивание параметров» Тема «Сводка и группировка статистических данных».
- •Тема «Способы представления статистических данных»
- •Тема «Вариационные ряды»
- •Тема «Числовые характеристики вариационного ряда».
- •Методические указания (рекомендации) Методические указания по изучению дисциплины
- •Методические указания по выполнению практических и лабораторных работ
- •Тема «Статистическое наблюдение»
- •Тема «Математико-статистические основы выборочного метода».
- •Тема «Сводка и группировка статистических данных»
- •Тема «Способы представления статистических данных».
- •Тема «Вариационные ряды»
- •Тема «Числовые характеристики вариационного ряда»
- •Методические указания по выполнению курсовых работ/проектов и рефератов
- •Методические указания по самостоятельной работе студентов
- •Выполнение контрольной работы №1 «Основы сбора статистических данных»
- •Выполнение контрольной работы №2 «Основы первичной обработки статистических данных. Статистическое оценивание параметров»
- •Модуль 2 «Основы первичной обработки статистических данных. Статистическое оценивание параметров».
- •Вопросы для текущего контроля Модуль 1 «Основы сбора статистических данных»
- •Модуль 2 «Основы первичной обработки статистических данных. Статистическое оценивание параметров»
- •Итоговый контроль знаний
- •Пример зачетного билета. Билет № 1
- •Задача №1
- •Задача №2
- •Сведения о ппс
- •Интерактивные технологии и инновационные методы, используемые в образовательном процессе
- •Дополнительный материал Глоссарий
- •Статистические таблицы
Тема «Математико-статистические основы выборочного метода».
Числовые характеристики
генеральной совокупности, как правило,
- неизвестные, (средняя, дисперсия и
др.) называются параметрами (характеристиками)
генеральной совокупности (обозначаются,
например,
или
,
).
Доля единиц, обладающих тем или иным
признаком в генеральной совокупности,
называется генеральной долей и
обозначается р.
По выборочным данным
рассчитывают числовые характеристики,
которые называют выборочными
характеристиками (статистиками)
(обозначаются
,
или
,
,
выборочная доля обозначается w).
Если из генеральной
совокупности объема N
извлекается выборка объема n, причем
значение признака х1 наблюдается
m1 раз,
х2 - m2
раз,..., хk - наблюдается
mk раз,
то
- объем выборки.
Вместо частот mi каждому значению xi можно сопоставить относительную частоту (частость) wi=mi/n.
Определенным образом заданное соответствие между возможными значениями признака xi и соответствующими им весами (частотами - mi или относительными частотами (частостями) - wi) называют статистическим распределением выборки.
Числовые характеристики, получаемые по различным выборкам, как правило, отличаются не только друг от друга, но и от соответствующей характеристики генеральной совокупности. Поэтому числовая характеристика, полученная по выборочным данным, является только статистической оценкой неизвестного параметра генеральной совокупности.
Обозначим Θ неизвестный параметр генеральной совокупности, Θ* - его статистическую оценку, полученную по выборочным данным.
Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Это – требования:
- несмещенности,
- эффективности и
- состоятельности.
Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, т.е.
M(Θ*) = Θ.
Смещенной называют статистическую оценку Θ*, математическое ожидание которой не равно оцениваемому параметру.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.
Состоятельной называют статистическую оценку, которая при n → ∞ стремится к оцениваемому параметру, т.е.
.
Различают точечные и интервальные оценки.
Точечной называют оценку, которая определяется одним числом.
В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обоснование возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чисел и центральная предельная теорема Ляпунова.
Выборочная средняя является точечной несмещенной, состоятельной, а при известном σ – и состоятельной оценкой генеральной средней, т.е.
≈
Генеральная дисперсия имеет 2 точечные оценки:
- выборочная дисперсия
– смещенная оценка генеральной дисперсии;
- исправленная
выборочная дисперсия - несмещенная
оценка генеральной дисперсии.
исчисляется при
,
а
- при
.
или
При больших объемах выборки и практически совпадают.
Генеральное среднее
квадратическое отклонение
также
имеет 2 точечные оценки:
- выборочное среднее
квадратическое отклонение и
- исправленное
выборочное среднее квадратическое
отклонение.
используется для
оценивания
при
,
а
для оценивания
,
при
.
При этом:
,
а
.
Интервальной оценкой называют оценку, которая определяется двумя числами - границами интервала, который с заданной надежностью накрывает неизвестный параметр генеральной совокупности.
Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом.
Для его определения
вычисляется предельная ошибка выборки
,
позволяющая установить предельные
границы, в которых с заданной вероятностью
(надёжностью) должен находиться
неизвестный оцениваемый параметр
генеральной совокупности.
Ошибка репрезентативности может быть представлена как разность между генеральными и выборочными характеристиками изучаемой совокупности:
ε = Θ - Θ*.
Поскольку оцениваются, как правило, средние или доли, то:
,
либо
.
Пусть
представляет собой предел, которым
ограничена сверху абсолютная величина
.
Тогда:
.
Следовательно,
.
Мы получили интервальную оценку неизвестного параметра генеральной совокупности.
Применительно к выборочному методу из теоремы Чебышева следует, что с вероятностью сколь угодно близкой к единице можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между характеристиками выборочной и генеральной совокупностей будет сколь угодно мала.
,
где t – кратность ошибки,
μ – стандартная (средняя) ошибка выборки,
- предельная ошибка
выборки.
Согласно центральной предельной теореме Ляпунова выборочные распределения статистик (при n ³ 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная совокупность. Следовательно:
,
где
- функция Лапласа,
γ – доверительная вероятность (надежность).
Запись показывает, что о величине расхождения между неизвестным параметром генеральной совокупности и его выборочной характеристикой , можно судить лишь с определенной вероятностью, от которой зависит величина t.
Здесь устанавливается связь между пределом ошибки , гарантируемым с некоторой надежностью γ, кратностью ошибки t и стандартной (средней) ошибкой выборки μ.
Надежность γ
устанавливается до проведения
выборочного обследования. Если γ=0,95,
то: со статистической надежностью в
95% доверительный интервал содержит
неизвестный оцениваемый параметр
генеральной совокупности. Статистической
надежности в 95% соответствует доверительная
вероятность - 0,95. В 5% случаев утверждение
«неизвестный оцениваемый параметр
генеральной совокупности принадлежит
доверительному интервалу» будет
неверным. Т.е. 5% задает уровень
значимости (
=0,05)
или 0,05 - вероятность ошибки. Доверительная
вероятность и уровень значимости
дополняют друг друга до 1, т.е. представляют
собой сумму вероятностей противоположных
событий:
γ+α=1.
При n < 30 выборочные распределения статистик будут иметь распределение Стьюдента. Тогда:
,
где
- плотность распределения Стьюдента,
и
- гамма-функция.
Значения вероятностей, соответствующие различным t, содержатся в специальных таблицах: при n ³ 30 - в таблице значений Ф0(t), а при n < 30 в таблице распределения t-Стьюдента.
При больших выборках, т.е. n ³ 30 t определяется по таблицам функции Лапласа из соотношения 2F0(t) = g.
При малых выборках, т.е. n < 30 t определяется по таблицам Стьюдента
по уровню значимости a = 1 - g
и числу степеней свободы k = n - 1;
Стандартная (средняя) ошибка выборки μ представляет собой среднее квадратическое (стандартное) отклонение оценки неизвестного параметра генеральной совокупности σ(Θ*). В зависимости от оцениваемого параметра и способа отбора стандартная (средняя) ошибка выборки μ определяется по различным формулам.
С помощью доверительного интервала можно оценить генеральную среднюю, генеральную долю и другие неизвестные параметры генеральной совокупности.
Границы доверительного интервала генеральной средней при больших выборках можно оценить с помощью следующего соотношения:
,
- при малых:
.
Границы доверительного интервала генеральной доли при больших выборках можно оценить с помощью следующего соотношения:
.
При малых:
.
Одной из важнейших проблем выборочного метода является определение необходимого объема выборки. От объема выборки зависят надежность оценок параметров генеральной совокупности, размеры стандартной (средней) μ, а, значит, и предельной Δ ошибок выборки и экономичность проводимого выборочного наблюдения, т.к. чем больше объем выборки, тем больше затраты на изучение элементов выборки, но тем меньше при этом ошибки выборки.
Расчет минимально необходимой численности выборки – это ответ на вопрос: «Сколько нужно обследовать единиц генеральной совокупности, чтобы с заранее заданной надежностью γ не превысить заранее заданную ошибку Δ?». Необходимо помнить, что точность и надежность оценок необходимо задавать до проведения выборки.
Формулы расчета
необходимой численности выборки n
для различных способов отбора можно
получить из формул предельной ошибки
и, соответственно, формул стандартных
(средних) ошибок выборки.