- •9. Статистическое изучение взаимосвязи социально-экономических явлений 101
- •1. Основные понятия статистики
- •2. Статистическое наблюдение
- •2.1. Основные организационные формы, виды и способы статистического наблюдения Организационные формы статистического наблюдения
- •Способы статистического наблюдения
- •Виды статистического наблюдения
- •2.2. Точность статистического наблюдения
- •3. Статистическая сводка и группировка
- •3.1. Вторичная группировка, ее виды
- •Расчет численности групп на основе метода долевой перегруппировки
- •4. Статистические таблицы
- •Название таблицы*
- •4.1. Основные правила построения статистических таблиц
- •5. Графическое изображение статистических данных
- •5.1. Классификация статистических графиков
- •6. Статистические показатели, их виды
- •6.1. Виды признаков и шкал
- •Сравнительные характеристики различных видов шкал
- •6.2. Статистические показатели, их виды
- •7. Статистическое распределение выборки и показатели, рассчитываемые на его основе.
- •7.1. Статистическое распределение выборки
- •Табличная форма представления
- •7.2. Средние величины
- •7.3. Структурные характеристики статистических рядов
- •7.4. Показатели вариации
- •7.5. Построение теоретического закона распределения по опытным данным
- •Расчет выборочных характеристик
- •1. Дискретные случайные величины
- •2. Непрерывные случайные величины
- •Расчет χ2-критерия Пирсона
- •Расчет χ2-критерия Пирсона
- •Расчет величины d
- •7.6. Моменты распределения. Асимметрия и эксцесс
- •8. Выборочное наблюдение
- •8.1. Сущность и этапы выборочного наблюдения
- •8.2. Методы формирования выборок
- •8.3. Виды выборок
- •8.4. Статистические оценки параметров распределения
- •8.4.1. Понятие и свойства точечных оценок
- •8.4.2. Методы получения точечных оценок
- •8.4.3. Сущность интервального оценивания
- •Формулы расчета стандартной ошибки выборки7
- •8.4.4. Оценка параметров генеральной совокупности по малым выборкам
- •8.5. Определение необходимой численности выборки
- •Формулы расчета численности выборки
- •8.6. Распространение результатов полученных по выборке на генеральную совокупность
- •9. Статистическое изучение взаимосвязи социально-экономических явлений
- •9.1. Сущность причинно-следственной связи, ее виды
- •9.2. Корреляционный анализ количественных признаков
- •9.2.1. Парная корреляция
- •9.2.1.1. Метод сопоставления параллельных данных
- •Основные показатели деятельности предприятий
- •9.2.1.2. Метод группировок
- •9.2.1.3. Выборочный линейный коэффициент корреляции к. Пирсона
- •9.2.2. Частная и множественная корреляция
- •9.3. Корреляционный анализ качественных признаков
8.4.4. Оценка параметров генеральной совокупности по малым выборкам
На практике зачастую в ходе выборочного исследования нецелесообразно или нет возможности использовать выборки повышенного объема, что связано с утерей в ходе обследования изучаемых свойств единицами наблюдения. К примеру, исследуется прочность изделия, средняя продолжительность его эксплуатации и т.д. В данных случаях целесообразно использование выборок небольшого объема – малых выборок.
В статистике выборка считается малой, если ее объем n < 20÷30. Использование малых выборок при выборочном наблюдении имеет следующие особенности:
необоснованным становится вывод о нормальном законе распределения выборочных средней и доли w, так как он основан на центральной предельной теореме при больших значениях n 10;
необоснованной становится замена неизвестных генеральной дисперсии σ2 и доли р их точечными оценками соответственно s2 и w, так как в силу состоятельности данных оценок эта замена возможна лишь при больших n.
В случае малых выборок оценка генеральной средней и доли осуществляется следующим образом.
1. Оценка генеральной средней.
В теории математической статистики доказано, что по данным выборки можно построить случайную величину
,
которая имеет распределение Стьюдента с степенями свободы. Функция плотности распределения Стьюдента имеет следующий вид:
,
где ; - гамма-функция;
t – возможные реализации случайной величины T; n – объем выборки.
Тогда доверительную вероятность (и доверительный интервал соответственно), т.е. вероятность попадания оцениваемой величины в заданный интервал можно определить на основе функции распределения Стьюдента11:
,
2. Оценка генеральной доли (вероятности биномиального распределения).
Границы p1 и p2 доверительного интервала для генеральной доли (для случая повторного отбора) можно определить по следующим формулам:
.
В случае больших выборок, при , в вышеприведенной формуле величинами (по сравнению с 1), (по сравнению w) и (по сравнению с ) можно пренебречь, в результате чего данную формулу можно упростить следующим образом:
.
8.5. Определение необходимой численности выборки
При разработке программы выборочного обследования одним из наиболее сложных является вопрос об объеме выборки.
Анализируя формулу предельной ошибки выборки, можно отметить, что при любом способе отбора предельная ошибка выборки обратно пропорциональна числу обследованных единиц. Таким образом, с увеличением объема выборки, уменьшается погрешность результатов выборочного обследования (при прочих равных условиях), однако при этом необходимо учитывать, что возрастут и затраты на проведение обследования.
Определение необходимой численности выборки осуществляется на основе формулы предельной ошибки выборки, к примеру, для собственно-случайной повторной выборки ее численность может быть определена следующим образом:
.
Аналогичным образом определяются формулы для расчета объема различных видов выборок при различных способах отбора (таблица 3).
Таблица 11
Формулы расчета численности выборки
№ |
Тип выборки |
Оцениваемый параметр |
Повторный отбор |
Бесповторный или механический отбор |
1. |
Собственно-случайная и механическая выборки |
|
|
|
p |
|
|
||
2. |
Типическая (стратифицированная) выборка |
|
|
|
p |
|
|
||
3. |
Серийная (гнездовая) выборка |
|
|
|
p |
|
|
Для определения необходимой численности выборки должны быть заданы предельная ее ошибка, вероятность того, что эта ошибка не превысит заданного предела, а также иметься информация о дисперсии изучаемого признака в генеральной совокупности.
В практике исследований величина предельной ошибки выборки, как правило, устанавливается не в абсолютном, а в относительном выражении:
,
,
причем ее величина для обеспечения репрезентативности выборки, как правило, не должна превышать 5%.
Тогда абсолютная величина предельной ошибки выборки может быть определена по следующим формулам:
,
.
Зачастую в практике исследований имеют место случаи, когда на этапе разработки программы выборочного обследования нет точной информации о вариации изучаемого признака. В таких случаях (т.е. до проведения обследования) приближенно оценить дисперсию или среднее квадратическое отклонение можно следующим образом:
исходя из результатов специально организованного пробного обследования;
опираясь на данные предыдущих обследований, как выборочных, так и сплошных. К примеру, если из предыдущих исследований имеется информация о коэффициенте вариации (V), то дисперсия может быть определена следующим образом:
;
исходя из закона распределения изучаемого признака в генеральной совокупности, к примеру, если распределение изучаемого признака близко к нормальному, то среднее квадратическое отклонение в 6 раз меньше размаха вариации.
Если дисперсия доли единиц генеральной совокупности, обладающих определенным значением альтернативного признака, неизвестна, то при определении объема выборки можно использовать максимальное ее значение 0,25 (при p=q=0,5). Однако в данном случае объем выборки существенно возрастет, что приведет к значительному увеличению трудоемкости выборочного обследования.
Уровень надежности результатов выборочного обследования или вероятность того, что предельная ошибка не превысит заданного предела, задается, как правило, равной 0,95 и выше, что обуславливается необходимостью обеспечения практической ценности результатов выборочного обследования.