
- •Cтатистика
- •История статистики
- •Язык статистики
- •Характеристика статистических исследований
- •Группировка населения в Российской державе 1905 года.
- •Статистические таблицы
- •Абсолютные и относительные статистические величины
- •Средние величины
- •Основные принципы и правила использования средних
- •Вариационные ряды и их характеристики
- •Ряды динамики
- •Основные показатели ряда
- •Средний показатель в рядах динамики
- •Индексы
- •Средние индексы
- •Выборочные наблюдения
- •Способы отбора единиц выборки, обеспечивающих репрезентативность (представительность)
- •Ошибка выборки (репрезентативной)
- •Задачи, решаемые при использовании выборочного метода
- •Ошибки выборки
- •Распространение данных выборочного наблюдения на генеральной совокупности
- •Малая выборка
- •Испытания статистических гипотез
- •Гипотеза о законе распределения
- •Методика построения теоретического ряда
- •Гипотеза о наличии и отсутствии связи
- •Гипотеза о средних величинах
- •Группировки
- •Структурная группировка
- •Распределение финансовых ресурсов в экономике России
- •Распределение ввп
- •Аналитическая группировка
Задачи, решаемые при использовании выборочного метода
Расчет объема выборки, которая необходима для получения требуемой точности результата с заданной вероятностью.
Определение возможного предела ошибки репрезентативности, гарантированного с заданной вероятностью и сравнение его с величиной допустимой погрешности.
Определение вероятности того, что ошибка выборки не превысит допустимой погрешности.
Ошибки выборки
Отклонение выборочной средней от генеральной средней:
Нормированное отклонение t устанавливает по таблице значение интеграла вероятности. Обычно задается определенный уровень вероятности суждения о точности данной выборки. Вероятность, которая принимается при расчете ошибки, называется доверительной. Чаще всего принимаются следующие стандарты доверительной вероятности: 0,95; 0,954; 0,997; 0,999.
Доверительный уровень вероятности 0,95 означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы.
Чтобы вычислить ошибку в выборке при
принятой доверительной вероятности,
нужно рассчитать величину средней
ошибки
.
Однако реально может быть определена
только выборочная дисперсия, о генеральной
мы, как правило, ничего не знаем. В
математике доказано, что генеральная
и выборочная дисперсии связаны между
собой соотношением:
Если n велико, тогда
,
поэтому выборочную дисперсию S можно
взять в качестве оценки генеральной
дисперсии и подставить её в формулу
средней ошибки:
Распространение данных выборочного наблюдения на генеральной совокупности
Конечной целью выборки является характеристика генеральной совокупности на основе данных выборки. При этом исходят из того, что все показатели, полученные при выборке, являются эффективными характеристиками генеральной совокупности.
Выборочные средние и относительные характеристики распространяются на генеральную совокупность обязательно с учетом их возможной предельной ошибки, то есть дается выборочный показатель и дополнительные сведения о возможной ошибке с указание доверительной вероятности.
Малая выборка
Таблица интеграла вероятности используется
для выборок
,
если n<100, то возникает несоответствие
интегрируемых табличных значений. При
n≤30 погрешность становится значительной.
Несоответствие вызывается главным
образом характером распределения границ
генеральной совокупности. При большом
объеме выборки особенности распределения
генеральной совокупности не имеют
значения, т.к. распределение отклонения
выборочных показателей от генеральной
характеристики при большой выборке
всегда остается нормальным.
В малых выборках характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибок выборки при небольшом объеме наблюдений отбор должен проводиться из совокупности имеющихся нормальных распределений.
Госсет (Стьюдент) 1908г.-теорема малых выборок, построено специальное распределение, которое позволило при малых выборках соотносить t и f(t) (нормировать разность и плотность вероятности). Если n>100, то таблица распределения Стьюдента совпадает с распределением Лапласа. Но когда 30<n<100 различия между ними незначительны. Поэтому их используют при малых выборках и тогда различия очень значительны.
Плотность вероятности распределения Стьюдента расписывается следующим образом:
,
t-нормированная разность;
n-объем выборки;
Вm-величина, зависящая от n.
Распределение
Стьюдента
публикуется в двух вариантах:
Аналогично таблице интегрирования вероятности. Значение t и f(t) в зависимости от числа степеней свободы (df).
Значение t приводится для наиболее употребляемых доверительных вероятностей 0,9; 0,95; 0,99 или для соответствующих им уровням значимости d=1-f(t) при разном числе степеней свободы.
При малых выборках расчет средней возможной ошибки основан на выборочных дисперсиях:
Эта формула используется для определения возможности ошибки выборочных показателей.