- •Учебное пособие
- •Таганрог Издательство Таганрогского государственного педагогического института
- •Предисловие
- •Введение
- •Раздел I теория статистики
- •Тема 1.1. Основоположники статистической науки
- •Тема 1.2. Предмет метод и задачи статистики
- •Тема 1.3. Статистическое наблюдение
- •Точность наблюдения.
- •Контрольные вопросы:
- •Тема 1.4. Сводка и группировка статистических материалов
- •Пример 1. Проведем статистическое исследование. Имеются следующие данные о количественном составе 50 семей (данные условные).
- •Контрольные вопросы:
- •Тема 1.5. Статистические таблицы
- •Динамика безработицы в Российской Федерации
- •Иностранные инвестиции в Россию
- •Контрольные вопросы
- •Тема 1.6. Способы наглядного представления данных, графическое изображение статистических данных
- •Тема 1.7. Абсолютные и относительные статистические величины
- •Контрольные вопросы:
- •Тема 1.8. Средние величины в статистике, общие принципы их применения. Степенные и структурные средние величины
- •Контрольные вопросы:
- •Тема 1.9. Показатели вариации и их значение в статистике
- •Контрольные вопросы:
- •Тема 1.10. Ряды динамики и их классификация. Показатели рядов динамики. Средние показатели рядов динамики
- •Тема 1.12. Выборочное наблюдение
- •Формулы расчета
- •Алгоритмы решения задач выборочного метода
- •Контрольные вопросы:
- •Раздел II социально-экономическая статистика
- •Тема 2.1. Статистическое изучение численности населения
- •Тема 2.2. Миграция населения и ее виды
- •Тема 2.3. Статистик рынка труда
- •Тема 2.3. Статистик рынка труда
- •Тема 2.5. Статистика производительности труда
- •Тема 2.6. Статистика оплаты труда и издержек на рабочую силу
- •Тема 2.7. Статистика национального богатства
- •Раздел III задания для самостоятельной работы
- •Тема 3.1. Статистическое наблюдение
- •Тема 3.2. Сводка и группировка статистических материалов
- •Тема 3.3. Статистические таблицы
- •Тема 3.4. Графическое изображение статистических данных
- •Тема 3.5. Абсолютные и относительные статистические величины
- •Рождаемость в рф
- •Тема 3.6. Средние величины
- •Тема 3.7. Показатели вариации
- •Выписка из платежной ведомости
- •3.8. Ряды динамики
- •3.9. Индексы
- •3.10. Выборочное наблюдение
- •3.12. Статистическое изучение численности населения
- •3.13. Статистик рынка труда
- •3.14. Статистика рабочей силы и рабочего времени
- •Библиографический список Основная
- •Дополнительная
- •Ежегодные статистические сборники
- •Периодические издания
- •Средства обеспечения освоения дисциплины
- •Вариант 1.
- •Примерный перечень вопросов дисциплине для подготовки к экзамену
- •Примерный перечень задания для контрольной работы для студентов заочной формы обучения
- •Задание 4. Имеются следующие данные о жилищном фонде (общей площади жилищ) по состоянию на конец года:
- •Задание 5. Имеются данные выборочного обследования весенней торговли фруктами на продовольственных рынках:
- •2.2. Вариант второй
- •Задание 4. Имеются следующие данные о жилищном фонде (общей площади жилищ) по состоянию на конец года:
- •2.3. Вариант третий
- •Задание 4. Абсолютные приросты выпуска продукции предприятия характеризуются следующими данными (по сравнению с предыдущим годом):
- •2.4. Вариант четвертый
- •Задание 3. Имеются следующие данные по трем предприятиям, выпускающим одноименную продукцию.
- •Задание 5. Имеются следующие данные:
- •2.5. Вариант пятый
- •Для решения поставленной задачи:
- •Разработайте программу статистического наблюдения;
- •Задание 2. По торговым организациям имеются следующие данные:
- •Задание 4. Заполните таблицу недостающими показателями.
- •Определите: 1) среднегодовой абсолютный прирост; 2) среднегодовые темпы роста и прироста потребления картофеля на душу населения.
- •Значения интеграла вероятностей нормального закона распределения функции Ляпунова л.М.
Формулы расчета
Способ отбора |
Для средней |
Для доли |
Собственно случайный повторный |
|
|
Случайный и механический бесповторный |
|
|
Типичный бесповторный |
|
|
Серийный бесповторный равновеликими сериями |
|
|
где:
– дисперсия средней в выборочной
совокупности;
– доля признака
в выборочной совокупности;
n – число единиц в выборочной совокупности;
N –число серий в генеральной совокупности;
–
средняя из выборочных
дисперсий типических групп;
– средняя из
выборочных дисперсий типических групп
для доли;
R – число серий в генеральной совокупности;
r – число серий в выборочной совокупности;
– межсерийная
(межгрупповая) дисперсия средних;
– межсерийная
(межгрупповая) дисперсия доли.
Для малой выборки средняя (стандартная) ошибка определяется по формуле:
.
Таким образом,
теория выборочного метода доказывает,
что величина генеральной средней (
)
с вероятностью равной Ф(t) находится
внутри интервала
,
то есть:
Во взаимосвязи рассматриваются три характеристики: отклонение среднего значения признака (доли) в генеральной и выборочной совокупностях (ошибка выборки), вероятность этой ошибки и численность выборки. Зная две из вышеназванных величин, всегда можно определить третью. Это позволяет ставить задачу выборочного метода в трех вариантах, или говорить о существовании трех задач выборочного метода, позволяющих осуществлять корректировку и контроль точности результатов выборочного наблюдения:
1) определение границ изменения генеральной средней (доли) на основе данных о численности выборки и вероятности ошибки выборки;
2) определение объема (численности) выборки, при котором пределы возможной ошибки не превысят некоторой установленной величины с заданной вероятностью;
3) определение вероятности того, что при наблюдении заданного числа единиц выборочной совокупности ошибка будет иметь заданный предел.
Алгоритмы решения задач выборочного метода
Задача определения величины ошибки выборки.
1. По результатам выборочного наблюдения производится расчет среднего значения (доли) признака в выборочной совокупности – или .
2. Определяется дисперсия признака. Расчет удобнее производить по формулам:
для средней –
для доли –
3. В соответствии с использованным способом отбора по формулам табл. 1. исчисляется величина средней ошибки выборки – .
4. По таблице закона нормального распределения, в соответствии с заданной величиной вероятности ошибки выборки определяется величина коэффициента доверия t.
5. По формуле
исчисляется величина предельной ошибки
выборки –
.
6. По формулам исчисляются границы возможного колебания выборочной средней границы, в которых находится величина генеральной средней.
Задача определения численности выборки.
Необходимая
численность выборки при заданной
величине допустимой ошибки выборки и
ее вероятности определяется из формулы
и формул определения
.
Например, для собственно случайного
повторного отбора:
,
или
,
откуда
.
Для иных вариантов отбора большой выборки формулы расчета численности выборки (доли) представлены в табл. 2.
Таблица 2.
Формулы расчета численности выборки (n) при собственно случайном способе отбора
Схема отбора |
Для средней |
Для доли |
Если доля
неизвестна, то
|
Повторный |
|
|
|
Бесповторный |
|
|
1. По таблице закона нормального распределения определяем коэффициент доверия t, соответствующий заданной вероятности.
2. По формулам табл. 2 определяем численность выборочной совокупности, обеспечивающую получение заданной точности определения генеральной средней (доли) с заданной вероятностью.
Задача определения вероятности ошибки выборки.
Определение
вероятности достижения заданного
предела ошибки выборки при известном
способе отбора и численности выборки
осуществляется на основе формулы
исчисления величины предельной ошибки
выборки
,
откуда t =
и
последующем использовании таблиц закона
нормального распределения для нахождения
величины вероятности, соответствующей
величине t.
1. Определяем величину стандартного отклонения .
2. Исчисляем коэффициент доверия.
3. Находим соответствующее полученному коэффициенту доверия табличное значение вероятности получения заданной ошибки при заданной численности выборки.
Пример 1. Исходные данные. На предприятиях города работает 15000 рабочих. Необходимо провести обследование выполнения норм выработки и определить средний процент выполнения норм выработки. Так как провести обследование всех рабочих не представляется возможным, необходимо организовать выборочное наблюдение. Рассмотрим возможные варианты решения задачи.
Задача определения величины ошибки выборки.
Предположим, что имеется возможность получения данных о проценте выполнения нормы выработки у 150 рабочих (n = 150). Отбор производится случайным способом по схеме бесповторного отбора. Необходимо определить величину отклонения генеральной средней от выборочной с вероятностью 0,954.
Результаты наблюдения выполнения норм выработки у 150 рабочих представлены в табл. 3.
Таблица 3.
Результат наблюдения |
Расчет |
||||
Распределение по проценту выполнения норм выработки |
Численность работников f |
Средний процент
выполнения нормы, %
|
|
|
|
до 90 |
8 |
85,0 |
680,0 |
7722,00 |
57800,00 |
90 – 100 |
22 |
95,0 |
2090,0 |
8025,00 |
198550,00 |
100 – 105 |
65 |
102,5 |
6662,5 |
10506,25 |
682906,25 |
105 – 110 |
40 |
107,5 |
4300,0 |
11556,25 |
462250,00 |
свыше 110 |
15 |
112,5 |
1687,5 |
12656,25 |
189843,75 |
Итого |
150 |
|
15420 |
|
1591350,00 |
1. На основе выборочных данных определяем средний процент выполнения нормы выработки по выборочным данным:
.
2. Определяем дисперсию выборочной средней:
.
3. В соответствии с формулами табл. 1 определяем величину средней ошибки выборки при случайном бесповторном отборе:
.
4. Коэффициент доверия находим по таблице закона нормального распределения (приложение 1) по величине вероятности. В случае Р = 0,954, t = 2.
5. Определяем величину предельной ошибки
.
6. Средняя по выборке
в соответствии с формулой (5) отличается
от средней генеральной совокупности
на величину
,
то есть доверительные границы для
среднего процента выполнения норм
выработки в генеральной совокупности
составляют:
102,8 – 1,04
102,8 + 1,04.
Вывод. В 954 случаях из 1000 средний уровень выполнения норм выработки рабочими предприятий данного города будет не ниже 101,8% и не выше 103,8%.
Проанализируем, как на величину доверительного интервала повлияет изменение схемы отбора. Пусть отбор осуществляется по повторной схеме, тогда:
.
При той же допустимой вероятности (0,954) величина предельной ошибки равна:
.
Границы генеральной средней составят:
102,8 – 1,05 102,8 + 1,05.
Вывод. Таким образом, изменение схемы отбора несущественно повлияло на изменение величины границ генеральной средней.
Проанализируем взаимосвязь величины ошибки выборки и вероятности попадания средней в расчетный интервал. Увеличим вероятность попадания в расчетные границы – пусть вероятность равна 0, 997. Это означает, что коэффициент доверия должен быть равен трем (t = 3), то есть предельная ошибка и пределы изменения генеральной средней увеличиваются и принимают значения при бесповторном отборе:
или
.
При уменьшении вероятности попадания в расчетный интервал (пусть Р = 0,683), величина коэффициента доверия уменьшается (t = 1) и соответственно уменьшаются границы изменения генеральной средней:
.
Вывод. Увеличение точности исчисления генеральной средней (уменьшение границ ее изменения) приводит к уменьшению вероятности получения результата и, наоборот, с большей вероятностью возможно получение менее точного результата (увеличение границ изменения генеральной средней).
Задача определения численности выборки.
Организация
выборочного наблюдения может начинаться
и с определения численности выборки. В
этом случае необходимо задать величину
допустимой ошибки в исчислении генеральной
средней и вероятность ее возникновения.
Пусть предельная величина ошибки
среднего процента выполнения нормы
выработки составит
с вероятностью 0,954. Отбор производится
случайным бесповторным способом из той
же генеральной совокупности (N = 15000).
Решение. 1. Заданной величине вероятности соответствует коэффициент доверия t = 2.
2. Величину дисперсии
генеральной совокупности определяем
любым допустимым способом. В нашем
случае берем ее на уровне дисперсии
выборочной совокупности по решению
предыдущей задачи
.
3. Формула расчета численности выборки при условиях случайного бесповторного отбора:
ед.
Вывод. При осуществлении обследования выполнения норм выработки у 41 рабочего с вероятностью 0,954 можно говорить, что средняя величина выполнения нормы выработки, рассчитанная для всей совокупности (генеральной средней), будет отклоняться от средней величины выполнения нормы выработки среди обследованных рабочих (выборочной средней) на 2%.
Сравнивая полученные результаты с решением задачи определения ошибки выборки, можно отметить, что увеличение величины ошибки резко снижает численность выборочной совокупности. Если в предыдущей задаче при одинаковой вероятности (0,954) для получения отклонения на 1,0424% требовалась выборка 150 рабочих, то в этом варианте для получения ошибки в 2% (рост меньше чем в 2 раза) требуется обследование только 41 человека (уменьшение почти в 4 раза).
Задача определения вероятности заданной ошибки выборки
Продолжим рассмотрение на исходных данных первого примера. Теперь организация выборочного наблюдения начинается с задания величины численности выборки и допустимой ошибки. Пусть n = 150, а предельная ошибка не превышает 0,5%. Необходимо оценить вероятность получения заданной ошибки, если отбор производится случайным бесповторным способом.
1. Определяем величину стандартного отклонения по формуле:
.
Если принять величину генеральной дисперсии равной величине выборочной дисперсии первой задачи, то и стандартное отклонение будет равным стандартному отклонению первой задачи:
.
2. Из формулы (0,5 =
t
0,5212),
коэффициент доверия равен 0,96. По таблице
закона нормального распределения этому
значению коэффициента t соответствует
вероятность 0,6629.
Вывод. Вероятность получения точных результатов (средняя величина выполнения нормы выработки во всей совокупности будет отклоняться от средней величины выполнения нормы выработки, полученной по результатам обследования 150 рабочих только на 0,5%) при заданных условиях невелика – 0,6629.
Сравнение полученных результатов с результатами решения варианта 1 подтверждает сделанный вывод о прямой зависимости вероятности и величины границ изменения генеральной средней – уменьшение интервала изменения генеральной средней уменьшает вероятность попадания в эти границы при неизменной численности наблюдения.
Пример 2. В отобранной методом случайной повторной выборки партии товаров 97% соответствовали требованиям ГОСТа. С вероятностью 0,997 необходимо определить пределы, в которых колеблется доля стандартной продукции во всей партии, если контролю было подвергнуто 200 единиц товара.
Средняя ошибка выборочной доли равна:
,
или 1,21%.
Предельная
ошибка выборки с вероятностью 0,997 (t = 3)
составляет:
.
Нижняя граница доли стандартной продукции в генеральной совокупности: 97 – 3,63 = 93,37%.
Верхняя граница
доли стандартной продукции в генеральной
совокупности: 97 + 3,63 = 100, 63
100%.
Если судить по результатам выборки, то не менее 93,4% всей партии товаров соответствует стандарту.
Пример 3. Росстат планирует провести обследование рентабельности арендных предприятий общественного питания методом случайного бесповторного отбора. Какова должна быть численность выборочной совокупности, если на момент обследования в республике насчитывалось 1230 предприятий питания, а предельная ошибка выборки не должна превышать 1% с вероятностью 0,954 при среднем квадратичном 2,5%.
n = = = 24,5 25 (предпр.).
Следовательно, для решения поставленной задачи необходимо обследовать 25 предприятий.
Пример 4. Имеются следующие данные о вкладах в филиалах Сбербанка России по результатам 5% выборочного обследования. Типическая выборка осуществлялась по видам вкладов случайным бесповторным методом пропорционально численности типических групп. Определить средний размер вклада и границы его изменения с вероятностью 0,683.
Виды вкладов |
Число вкладов (N) |
Средний размер вклада, руб. (x) |
Численность выборки (n) |
Выборочная
дисперсия ( |
xn |
|
До востребования |
11200 |
1360 |
560 |
7225 |
761600 |
4046000 |
Срочные |
6300 |
2250 |
315 |
52900 |
708750 |
16663500 |
S |
17500 |
– |
875 |
– |
1470350 |
20709500 |
Средний размер вклада в выборочной совокупности:
=
=
= 1680,4 руб.
Средняя из внутригрупповых дисперсий:
=
=
= 23668.
Средняя ошибка выборочной средней типической выборки:
=
=
5,079 руб.
Предельная ошибка выборки с вероятностью 0,683 (t = 1):
=
t
=
1
5,079
руб.
Доверительные границы колеблемости среднего размера вклада в генеральной совокупности:
.
