
- •Статистика Конспект лекций
- •Часть I. Теория статистики
- •Глава 1. Предмет и метод статистики
- •1.1. Предмет, метод и основные категории статистики как науки
- •1.2. Органы государственной статистики Российской Федерации
- •Глава 2. Статистическое наблюдение
- •2.1. Основные этапы статистического исследования
- •2.2. Статистическое наблюдение — первый этап статистического исследования
- •2.3. Программно-методологические и организационные вопросы статистического наблюдения
- •2.4. Формы, виды и способы наблюдения
- •2.5. Понятие выборочного наблюдения, отбор единиц в выборочную совокупность
- •2.6. Определение ошибок выборки*
- •2.7. Определение численности выборки
- •2.8. Распространение выборочных результатов
- •Глава 3. Сводка и группировка данньк статистического наблюдения
- •3.1. Сводка статистических данных
- •3.2. Группировка статистических данных
- •3.3. Многомерные группировки в статистике
- •3.4. Статистические таблицы
- •3.5. Статистические графики
- •35 % 61 % 4% [Активы, свободные от риска ! Активы с минимальным риском Активы с повышенным риском
- •Глава 4. Статистические величины
- •4.1. Понятие абсолютной и относительной величины в статистике
- •4.2. Виды и взаимосвязи относительных величин
- •2. Относительная величина планового задания.
- •4.3. Средние величины. Общие принципы их применения
- •4.4. Расчет средней через показатели структуры
- •3.'Средний уровень оплаты труда (f):
- •4. Средний уровень фондоотдачи (н):
- •4.5. Расчет средних по результатам группировки. Свойства средней арифметической
- •4.6. Структурные средние
- •4.7 Показатели вариации
- •Глава 5. Изучение динамики общественных явлений
- •5.1. Ряды динамики. Классификация
- •5.2. Правила построения рядов динамики
- •5.3. Показатели анализа рядов динамики
- •5.4. Структура ряда динамики. Проверка ряда на наличие тренда
- •5.5. Анализ сезонных колебаний
- •5.6. Анализ взаимосвязанных рядов динамики
- •Глава 6. Индексы
- •6.1. Индивидуальные индексы и их применение в экономическом анализе
- •6.2. Общие индексы и их применение в анализе
- •6.3. Общие индексы как средние из индивидуальных индексов
- •6.5. Индексы при анализе структурных изменений
- •6.6. Индексы средних величин
- •6.7. Территориальные индексы
- •Глава 7. Статистическое изучение взаимосвязей
- •7.1. Основные понятия корреляционного и регрессионного анализа
- •7.2. Парная корреляция и парная линейная регрессия
- •Ireop u 1 I
- •7.3. Множественная линейная регрессия
- •7.4. Нелинейная регрессия. Коэффициенты эластичности
- •7.5. Множественная корреляция
- •7.6. Оценка значимости параметров взаимосвязи
- •7.7. Непараметрические методы оценки связи
2.6. Определение ошибок выборки*
По мере отбора единиц в выборочную совокупность или по его завершении производится регистрация предусмотренных программой признаков. Итогом же является расчет обобщающих выборочных характеристик. Часто кроме выборочной средней (X) исчисляют также выборочную долю (W) единиц, обладающих каким-либо интересующим нас признаком, в общей их численности.
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т. д.
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам, сотням и т. д.), и случайные, проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Ошибки репрезентативности также могут быть систематическими и случайными. Систематические ошибки репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки — принцип случайности. Случайные ошибки репрезентативности означают, что, несмотря на принцип случайности отбора единиц, все же имеются расхождения между
* Содержание разделов 2.6, 2.7 рекомендуется изучать после ознакомления с материалом гл 4 («Статистические величины»).
22
характеристиками выборочной и генеральной совокупности. Изучение и измерение случайных ошибок репрезентативности и является основной задачей выборочного метода, о
Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов (две 10 %-е выборки):
|
Чи |
ело студентов, ч |
ел. |
Оценка |
Генеральная совокупность |
Первая выборка |
Вторая выборка |
2 3 4 5 |
100 300 520 80 |
9 27 54 10 |
12 29 52 7 |
Итого |
1000 |
100 |
100 |
Средний балл рассчитаем по средней арифметической взвешенной.
По генеральной совокупности
100 • 2 + 300 • 3 + 520 • 4 + 80 • 5
X = —————————————————————————— = 3,58;
1000
X, = 3,65;
X, = 3,65;
по второй выборке
X, = 3,54. Доля студентов, получивших оценки «4» и «5»:
по генеральной совокупности
520 + 80
р = ———————— = 0,6, или 60 %;
1000
по первой выборке
W, = 0,64, или 64 %;
по второй выборке
W;, = 0,59, или 59 %.
Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности. Ошибки репрезентативности:
X, -Х= 3,65-3,58 =+0,07;
X;, - X = 3,54 - 3,58 = - 0,04;
W, - р = 0,64 - 0,6 = + 0,04;
W^-p= 0,59 - 0,6 = - 0,01.
23
Как видно из расчетов, выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных
ошибок (обозначим ее через Ц). Средняя ошибка выборки равна среднему квадратическому отклонению, деленному на квадратный корень из численности выборки:
для
средней Ц„
для
доли Ц^
\[^~ \/ П
/ Р(1 -Р)
V——
В этих формулах (7^ и р(1 - р) являются характеристиками генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными характеристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность при достаточно большом объеме достаточно точно воспроизводит характеристики генеральной совокупности. Следовательно, средние ошибки выборки можно представить следующим образом: ____
г^
^= v
—•
П
/W(1
-W)
^=
———•
п
При бесповторном отборе подкоренное выражение умножается на величину (1 - n / N), которая всегда меньше единицы, поэтому величина средней ошибки выборки при бесповторном отборе оказывается меньше, чем при повторном. В тех случаях, когда доля выборки незначительна и множитель (1 - n / N) близок к единице, поправкой можно пренебречь. Для решения практических задач кроме средней пользуются предельной ошибкой выборки, которая связана с гарантирующим ее уровнем вероятности. Уровень вероятности определяет величина нормированного отклонения t, и наоборот. Значения t даются в таблицах нормального распределения вероятностей.
24
Чаще всего используют следующие сочетания:
t Р
1,0 0,683
1,5 0,866
2,0 0,954
2,5 0,988
3,0 0,997
3,5 0,999
Так, если t =1, то с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки. Предельные ошибки выборки (А) определяются по формулам табл. 2.1.
Таблица 2.1
Предельные ошибки выборки
Метод |
Предельные ошибки |
индивидуального отбора |
отбора |
для средней |
для доли |
|
|
|
|
.———— / °2 |
/ W(1 -W) |
Повторный |
A=t!/ \/ n |
A=t!/ / n |
|
|
|
|
д2 n A-t,/—(l-—) |
/W(1 -W) n Д-t,/————(1-—) |
Бесповторный т |
Ч п N |
Ч n N |
После исчисления предельных ошибок выборки находят доверительные интервалы для генеральных показателей. Для Х это (X ± А,). Для Р это (W ± AJ.
Из формул табл. 2.1 видно, что величина Л зависит от:
1) колеблемости признака (прямая связь); 2) численности выборки (обратная связь); 3) доверительной вероятности (прямая связь);
4) метода отбора.
Формулы, приведенные в табл. 2.1, используются при определении ошибок выборки, осуществляемой собственно случайным или механическим методами.
При стратифицированном отборе в выборку обязательно попадают представители всех групп и обычно в тех же пропорциях, что и в генеральной совокупности. Поэтому ошибка выборки в данном случае зависит главным образом от средней из групповых
дисперсий (82). По правилу сложения дисперсий О2^ + 52 = <72. Отсюда следует, что ошибка выборки для стратифицированного отбора всегда будет меньше, чем для собственно случайного.
25
При серийном (гнездовом) отборе мерой колеблемости будет межгрупповая дисперсия (СТ^гр)-