- •Оглавление
- •Введение. Статистика как наука
- •Вопрос 1. Понятие, предмет и методы статистики
- •Вопрос 2. Основные категории статистики
- •Вопрос 3. Организация государственной статистики в Российской Федерации
- •Тема 1. Статистическое наблюдение
- •Вопрос 1. Сущность и принципы статистического наблюдения
- •Вопрос 2. Основные формы, виды и способы статистического наблюдения
- •Вопрос 3. Организационно-методологические основы наблюдения
- •Тема 2. Сводка и группировка статистических данных
- •Вопрос 1. Понятие сводки и группировки в статистике
- •Вопрос 2. Основные положения теории группировок
- •2.1. Определение числа интервалов группировки данных
- •1). Для качественного (атрибутивного) группировочного признака:
- •2.2. Расчет числа и ширины интервалов группировки данных
- •Вопрос 3. Виды группировок
- •Тема 3. Статистический анализ рядов распределения
- •Вопрос 1. Понятие и виды рядов распределения
- •Вопрос 2. Графическое изображение рядов распределения
- •30 Компаний мира по размеру годового дохода
- •Тема 4. Обобщающие статистические показатели
- •Вопрос 1. Абсолютные показатели: сущность и единицы измерения
- •Вопрос 2. Относительные показатели: сущность и значение, формы выражения и виды
- •Тема 5. Средние величины
- •Вопрос 1. Сущность средних величин и правила их применения
- •Вопрос 2. Виды средних величин
- •1. Средняя арифметическая
- •Вопрос 3. Мода и медиана – структурные средние величины
- •3.1. Расчет моды в дискретных и интервальных рядах распределения по наибольшей частоте
- •3.2. Расчет медианы в дискретных и интервальных рядах по накопленным частотам
- •Вопрос 4. Показатели дифференциации признака в ряду распределения
- •Тема 6. Статистический анализ вариации признака
- •Вопрос 1. Сущность и виды показателей вариации
- •Вопрос 2. Виды дисперсий в аналитических группировках. Правило сложения дисперсий
- •Вопрос 3. Дисперсия альтернативного признака
- •Тема 7. Выборочное наблюдение
- •Вопрос 1. Сущность и виды выборочного наблюдения
- •Вопрос 2. Ошибка репрезентативности выборки
- •Вопрос 3. Способы отбора в выборочную совокупность
- •2. Механическая выборка
- •3. Типический отбор с механической выборкой
- •6. Серийная (гнездовая) выборка
- •Вопрос 4. Распространение выборочных данных на генеральную совокупность
- •Вопрос 5. Определение необходимой численности выборки
- •Тема 8. Статистические методы анализа связи социально-экономических явлений
- •Вопрос 1. Виды взаимосвязей в статистике
- •Вопрос 2. Корреляционный анализ связи
- •2.1. Аналитические методы корреляционного анализа
- •1. Метод приведения параллельных данных
- •2. Метод построения корреляционных таблиц
- •3. Графический метод
- •4. Дисперсионный анализ
- •2.2. Эмпирические методы корреляционного анализа
- •1. Коэффициент Фехнера:
- •2. Коэффициент корреляции рангов Спирмена:
- •Вопрос 3. Регрессионный анализ связи
- •1 Этап. Теоретическое обоснование регрессионной модели
- •2 Этап. Расчет параметров уравнения регрессии
- •3 Этап. Измерение тесноты связи
- •4 Этап. Проверка существенности связи
- •Тема 9. Анализ рядов динамики
- •Вопрос 1. Ряды динамики и их виды
- •Виды рядов динамики
- •Вопрос 2. Сопоставимость статистических величин
- •Вопрос 3. Показатели анализа рядов динамики
- •3.1. Расчет среднего уровня ряда
- •I. Интервальный ряд динамики
- •II. Моментный ряд динамики
- •3.2. Расчет абсолютных, относительных и средних показателей анализа рядов динамики
- •Абсолютные показатели анализа рядов динамики
- •Относительные показатели анализа рядов динамики
- •Средние показатели анализа рядов динамики
- •Вопрос 4. Приемы анализа и обработки рядов динамики
- •4.1. Приемы анализа рядов динамики
- •2. Приемы обработки рядов динамики
- •Вопрос 5. Проверка ряда динамики на наличие тренда
- •5.1. Сглаживание рядов динамики методом скользящей средней
- •5.2. Аналитическое выравнивание ряда динамики
- •Вопрос 6. Изучение сезонных колебаний в ряду динамики
- •1). Метод скользящей средней
- •2). Метод аналитического выравнивания ряда динамики:
- •Тема 10. Индексный метод анализа
- •Вопрос 1. Сущность и виды индексов
- •Вопрос 2. Построение индивидуальных и сводных индексов
- •Расчет агрегатных индексов
- •Расчет средних индексов
- •Вопрос 3. Изучение динамики явлений при помощи индексов
- •2. Общие индексы:
- •3. Абсолютное изменение товарооборота:
- •Вопрос 4. Система индексов динамики средней величины
- •Тема 11. Статистические таблицы и графики
- •Вопрос 1. Статистические таблицы и правила их построения
- •Правила построения статистических таблиц
- •Вопрос 2. Статистический график и его элементы, правила построения графиков
- •Вопрос 3. Виды статистических графиков
- •Вопрос 4. Статистические карты
- •Вопросы и задания для самопроверки
- •Тема 1. Статистическое наблюдение
- •Тема 2. Сводка и группировка статистических данных
- •Тема 3. Статистические ряды распределения
- •Тема 4. Обобщающие статистические показатели
- •Тема 5. Средние величины
- •Тема 6. Показатели вариации признака
- •Тема 7. Выборочное наблюдение
- •Тема 8. Статистические методы анализа связи
- •Тема 9. Анализ рядов динамики
- •Тема 10. Индексный метод анализа
- •Тема 11. Статистические таблицы и графики
Вопрос 5. Определение необходимой численности выборки
Иногда в статистической практике при организации выборочного наблюдения предполагают заранее заданными величину допустимой ошибки выборки и вероятность ответа р. Неизвестным, следовательно, остается тот минимальный объем выборки, который должен обеспечить требуемую точность. Из формулы для повторного отбора получим , тогда численность выборки при повторном отборе …(7.14)
Аналогично численность выборки определяется для доли и бесповторного отбора (табл. 7.3).
Таблица 7.3.
Формулы расчета необходимой численности выборочной совокупности для различных видов отбора
Способ отбора |
Для средней |
Для доли |
Повторный |
(7.14) |
(7.15) |
Бесповторный |
(7.16) |
(7.17) |
Основное затруднение при расчете численности выборки заключается в определении величин и =5. До проведения выборочного наблюдения они могут быть неизвестны, поэтому вместо точного их значения принимают приближенные, установленные на основании уже проведенного другого наблюдения или нескольких пробных, избирая из найденных результатов наибольшие значения и .
Важно! Следует знать, что при расчетах численности выборочной совокупности правило округления дробных чисел, применяющееся в математике, не действует. В данном случае все дробные числа следует округлять до большего значения. Только в этом случае ошибка репрезентативности не превысит своего предельного значения. |
Пример (комплексный). Имеются данные о стоимости собственных оборотных средств (СОС) предприятий области за истекший финансовый год (табл. 7.4).
Таблица 7.4.
Стоимость собственных оборотных средств 150 производственных предприятий за прошлый год (млн. руб.)
№ пред. |
Стоимость СОС |
|
№ пред. |
Стоимость СОС |
|
№ пред. |
Стоимость СОС |
|
№ пред. |
Стоимость СОС |
|
№ пред. |
Стоимость СОС |
1 |
2 |
1 |
2 |
1 |
2 |
1 |
2 |
1 |
2 |
||||
1 |
1 333 |
31 |
1 214 |
61 |
1 168 |
91 |
1 363 |
121 |
1 147 |
||||
2 |
1 032 |
32 |
1 122 |
62 |
1 161 |
92 |
1 148 |
122 |
1 102 |
||||
3 |
1 080 |
33 |
1 123 |
63 |
1 089 |
93 |
1 168 |
123 |
1 302 |
||||
4 |
1 004 |
34 |
1 025 |
64 |
1 007 |
94 |
1 061 |
124 |
1 184 |
||||
5 |
1 008 |
35 |
1 083 |
65 |
1 030 |
95 |
1 123 |
125 |
1 251 |
||||
6 |
1 116 |
36 |
1 166 |
66 |
1 099 |
96 |
1 025 |
126 |
1 306 |
||||
7 |
1 185 |
37 |
1 242 |
67 |
1 197 |
97 |
1 083 |
127 |
1 193 |
||||
8 |
1 120 |
38 |
1 087 |
68 |
1 186 |
98 |
1 266 |
128 |
1 386 |
||||
9 |
1 147 |
39 |
1 104 |
69 |
1 198 |
99 |
1 242 |
129 |
1 031 |
||||
10 |
1 102 |
40 |
1 177 |
70 |
1 072 |
100 |
1 116 |
130 |
1 167 |
||||
11 |
1 002 |
41 |
1 192 |
71 |
1 184 |
101 |
1 177 |
131 |
1 367 |
||||
12 |
1 284 |
42 |
1 072 |
72 |
1 060 |
102 |
1 092 |
132 |
1 207 |
||||
13 |
1 251 |
43 |
1 178 |
73 |
1 112 |
103 |
1 072 |
133 |
1 295 |
||||
14 |
1 076 |
44 |
1 004 |
74 |
1 120 |
104 |
1 178 |
134 |
1 099 |
||||
15 |
1 193 |
45 |
1 008 |
75 |
1 247 |
105 |
1 104 |
135 |
1 197 |
||||
16 |
1 086 |
46 |
1 116 |
76 |
1 102 |
106 |
1 108 |
136 |
1 120 |
||||
17 |
1 231 |
47 |
1 185 |
77 |
1 002 |
107 |
1 016 |
137 |
1 047 |
||||
18 |
1 135 |
48 |
1 220 |
78 |
1 077 |
108 |
1 181 |
138 |
1 102 |
||||
19 |
1 181 |
49 |
1 011 |
79 |
1 120 |
109 |
1 220 |
139 |
1 084 |
||||
20 |
1 122 |
50 |
1 188 |
80 |
1 231 |
110 |
1 281 |
140 |
1 157 |
||||
21 |
1 281 |
51 |
1 218 |
81 |
1 111 |
111 |
1 333 |
141 |
1 068 |
||||
22 |
1 333 |
52 |
1 209 |
82 |
1 140 |
112 |
1 288 |
142 |
999 |
||||
23 |
1 232 |
53 |
1 188 |
83 |
1 215 |
113 |
1 018 |
143 |
1 311 |
||||
24 |
1 235 |
54 |
1 094 |
84 |
1 284 |
114 |
1 209 |
144 |
1 288 |
||||
25 |
1 049 |
55 |
1 135 |
85 |
1 036 |
115 |
1 120 |
145 |
1 218 |
||||
26 |
1 188 |
56 |
1 114 |
86 |
1 012 |
116 |
1 147 |
146 |
1 009 |
||||
27 |
1 258 |
57 |
1 077 |
87 |
1 147 |
117 |
1 102 |
147 |
1 204 |
||||
28 |
1 273 |
58 |
1 079 |
88 |
1 093 |
118 |
1 035 |
148 |
1 072 |
||||
29 |
1 179 |
59 |
1 210 |
89 |
1 163 |
119 |
1 114 |
149 |
1 184 |
||||
30 |
1 085 |
60 |
1 248 |
90 |
1 114 |
120 |
1 277 |
150 |
1 060 |
Требуется:
1. Сформировать 20%-ную выборочную совокупность способом случайного бесповторного отбора.
2. Рассчитать:
а) среднее значение собственных оборотных средств предприятий в выборочной совокупности;
б) долю предприятий в выборочной совокупности с размером собственных оборотных средств, равной или выше 1250 млн. руб.
3. С доверительной вероятностью 0,954 определить:
а) пределы выборочного среднего значения признака (стоимости собственных оборотных средств) в генеральной совокупности;
б) пределы выборочной доли в генеральной совокупности.
4. С той же доверительной вероятностью рассчитать необходимый объем выборки, при котором:
а) предельная ошибка выборочного среднего значения сократиться в четыре раза;
б) предельная ошибка выборочной доли составит 1%.
Решение
1. Определим необходимый объем выборки: 20% от 150 предприятий – это 30 предприятий.
В случайном порядке отберем для исследования и ранжируем по возрастанию стоимости собственных оборотных средств 30 предприятий (табл. 7.5).
Таблица 7.5.
Выборочные ранжированные данные по стоимости собственных оборотных средств тридцати производственных предприятий (млн. руб.)
№ предприятия |
Собственные оборотные средства предприятия |
|
№ предприятия |
Собственные оборотные средства предприятия |
|
№ предприятия |
Собственные оборотные средства предприятия |
1 |
2 |
1 |
2 |
1 |
2 |
||
44 |
1 004 |
139 |
1 084 |
68 |
1 186 |
||
49 |
1 011 |
10 |
1 102 |
127 |
1 193 |
||
34 |
1 025 |
90 |
1 114 |
147 |
1 204 |
||
2 |
1 032 |
46 |
1 116 |
52 |
1 209 |
||
118 |
1 035 |
95 |
1 123 |
83 |
1 215 |
||
25 |
1 049 |
82 |
1 140 |
27 |
1 258 |
||
94 |
1 061 |
9 |
1 147 |
98 |
1 266 |
||
58 |
1 079 |
40 |
1 177 |
21 |
1 281 |
||
3 |
1 080 |
108 |
1 181 |
144 |
1 288 |
||
35 |
1 083 |
149 |
1 184 |
111 |
1 333 |
2. Рассчитаем среднее значение собственных оборотных средств предприятий в выборочной совокупности и долю предприятий с размером собственных оборотных средств, равным или выше 1250 млн. руб.
а). Выборочные данные ранжированы. Это позволяет применить для расчета средней стоимости собственных оборотных средств 30 предприятий формулу средней арифметической простой (5.3):
млн. руб.;
б). Стоимость собственных оборотных средств каждого из 30 предприятий либо ниже, либо равна и выше 1250 млн. руб. Следовательно, мы имеем дело с альтернативным признаком.
Долю единиц, обладающих изучаемым признаком (стоимостью собственных оборотных средств, равной и выше 1250 млн. руб.) в выборочной совокупности рассчитаем по формуле (7.1): . Здесь n=30 – численность отобранных для исследования предприятий; w – число предприятий из 30 со стоимостью СОС равной или выше 1250 млн. руб. По графе 1 таблицы 7.5 посчитаем, сколько таких предприятий. Их оказалось всего 6. Следовательно, доля единиц, обладающих изучаемым признаком, равна:
.
3. С вероятностью р=0,954 определим пределы выборочной средней и выборочной доли в генеральной совокупности.
а). Пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака в генеральной совокупности, можно определить по формуле (7.12):
.
Среднее значение признака в выборочной совокупности () составляет 1142 млн. руб. Осталось рассчитать предельную ошибку выборочного наблюдения: .
Критерий доверия (t) определим на основе данных таблицы 7.2. Поскольку по условию задачи доверительная вероятность р=0,954, то .
Среднюю ошибку выборки () для собственно случайного бесповторного отбора следует рассчитывать по формуле (7.4):
,
где – общая дисперсия изучаемого признака (стоимость собственных оборотных средств предприятия) в пределах выборочной совокупности.
Поскольку данные не сгруппированы, то для расчета общей дисперсия можно воспользоваться формулой (6.5):
Тогда средняя ошибка репрезентативности генерального среднего будет равна:
млн. руб.
Предельная ошибка репрезентативности генерального среднего:
млн. руб.
Таким образом, с вероятностью 0,954 (95,4%) можно утверждать, что среднее значение стоимости собственных оборотных средств в генеральной совокупности 150 предприятий находится в интервале:
млн. руб. Иначе говоря, генеральное среднее находится в диапазоне от 1113 до 1171 млн. руб.
б). Пределы, за которые с доверительной вероятностью 0,954 не выйдет генеральная доля, можно рассчитать по формуле (7.13):
.
В свою очередь, .
Для собственно случайного бесповторного отбора средняя ошибки репрезентативности выборочной доли определяется по формуле (7.5):
,
где d – доля альтернативного признака в выборочной совокупности, коэфф.
Доля единиц, обладающих изучаемым признаком (стоимостью собственных оборотных средств, равной и выше 1250 млн. руб.) в выборочной совокупности составляет d = 0,2 (20%). Подставим имеющиеся данные в формулу:
.
Предельная ошибка репрезентативности генеральной доли составляет:
Таким образом, с вероятностью 95,4% можно утверждать, что в генеральной совокупности 150 предприятий доля предприятий со стоимостью собственных оборотных средств, равной или выше 1250 млн. руб., находится в пределах от 7 до 33%:
или .
4. С доверительностью вероятностью 0,954 рассчитаем необходимый объем выборки (n), при котором:
а). Предельная ошибка выборочного среднего значения сократится в четыре раза, т.е. составит 29 : 4 = 7,25 млн. руб.
При бесповторном отборе необходимая численность выборочной совокупности, обеспечивающая заданное значение предельной ошибки репрезентативности генерального среднего, определяется по формуле (7.16):
.
Следовательно, для того, чтобы с вероятностью 95,4% можно было утверждать, что в генеральной совокупности 150 предприятий средняя стоимость их собственных оборотных средств находится в пределах от 1134,75 до 1149,25 млн. руб. () для исследования следовало бы отобрать не менее 120 предприятий из 150.
б). Предельная ошибка выборочной доли составит (1%).
Формула (7.17) позволяет определить необходимую численность выборки (n) для бесповторного отбора, обеспечивающую заданное значение предельной ошибки репрезентативности генеральной доли альтернативного признака:
.
Таким образом, для того, чтобы с вероятностью 95,4% можно было утверждать, что в генеральной совокупности 150 предприятий доля предприятий со стоимостью собственных оборотных средств, равной или выше 1250 млн. руб., составляет от 19 до 21% () для исследования следовало бы отобрать не менее 147 предприятий из 150, т.е. провести практически сплошное обследование предприятий.