- •Содержание
- •2. Обобщающие статистические показатели 11
- •3. Вариационные ряды распределения 22
- •4. Статистическое изучение структуры совокупности 44
- •5. Выборочное наблюдение 54
- •6. Ряды динамики 60
- •6.7. Методические указания 76
- •7. Статистическое изучение взаимосвязей 81
- •8. Индексы 108
- •1.1. Предмет и метод статистики
- •1.2. Статистическое наблюдение
- •1.3. Сводка и группировка статистических данных
- •1.4. Формы представления статистических данных
- •1.5. Контрольные задания
- •2. Обобщающие статистические показатели
- •2.1. Абсолютные величины
- •2.2. Относительные величины
- •2.3. Средние величины
- •2.4. Контрольные задания
- •3. Вариационные ряды распределения
- •3.1. Построение ряда распределения
- •3.2. Расчет структурных характеристик ряда распределения
- •3.3. Расчет показателей размера и интенсивности вариации
- •3.4. Расчет моментов распределения и показателей его формы
- •3.5. Проверка соответствия ряда распределения нормальному
- •3.6. Проверка соответствия ряда распределения закону Пуассона
- •3.7. Контрольные задания
- •4. Статистическое изучение структуры совокупности
- •4.1. Абсолютные и относительные показатели изменения структуры
- •4.2. Ранговые показатели изменения структуры
- •4.3. Контрольные задания
- •5. Выборочное наблюдение
- •5.1. Понятие выборочного наблюдения
- •5.2. Способы формирования выборки
- •5.3. Средняя ошибка выборки
- •5.4. Предельная ошибка выборки
- •5.5. Необходимая численность выборки
- •5.6. Методические указания
- •5.7. Контрольные задания
- •6. Ряды динамики
- •6.1. Понятие о рядах динамики
- •6.2. Показатели изменения уровней ряда динамики
- •6.3. Средние показатели ряда динамики
- •6.4. Методы выявления основной тенденции (тренда) в рядах динамики
- •6.5. Оценка адекватности тренда и прогнозирование
- •6.7. Методические указания
- •6.8. Контрольные задания
- •7. Статистическое изучение взаимосвязей
- •7.1. Понятие корреляционной зависимости
- •7.3. Коэффициенты корреляции рангов
- •7.4. Особенности коррелирования рядов динамики
- •7.5. Показатели тесноты связи между качественными признаками
- •7.6. Множественная корреляция
- •7.7. Контрольные задания
- •8. Индексы
- •8.1. Назначение и виды индексов
- •8.2. Индивидуальные индексы
- •8.3. Общие индексы
- •8.4. Индексы средних величин
- •8.5. Территориальные индексы
- •8.6. Контрольные задания
- •Список литературы
- •Приложения – статистические таблицы Приложение 1. Значения интеграла Лапласа
- •Приложение 2. Значения t-критерия Стьюдента
- •Приложение 3. Значения χ2-критерия Пирсона
- •Приложение 4. Значения f-критерия Фишера
- •Приложение 5. Критические значения коэффициента автокорреляции
- •Приложение 6. Значения критерия Колмогорова p(λ)
5.4. Предельная ошибка выборки
Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. В конкретной выборке разность может быть больше, меньше или равна . Каждое из отклонений от имеет определенную вероятность. При выборочном обследовании реальное значение в ГС неизвестно. Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (в данном случае среднее значение) в генеральной совокупности. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки . Она определяется в долях средней ошибки с заданной вероятностью, т.е.
= t, (67)
где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.
Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме Чебышёва, при достаточно большом объеме выборки и ограниченной дисперсии генеральной ГС вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:
при . (68)
А. М. Ляпунов доказал, что независимо от характера распределения генеральной ГС при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению (центральная предельная теорема). Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:
, (69)
где – нормированное отклонение выборочной средней от генеральной средней.
Значения P (интеграла Лапласа) для разных t рассчитаны и имеются в специальной таблице, которая приведена в Приложении 1.
Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. Чаще всего принимают вероятность P = 0,950, которая означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения t по Приложению 1 и рассчитывают предельную ошибку выборки по формуле (67).
После расчета предельной ошибки находят доверительный интервал обобщающей характеристики ГС совокупности по формуле (70) – для среднего значения, и по формуле (71) – для доли единиц, обладающих каким-либо значением признака:
или (–) (+) (70)
или (–) d (+) (71)
Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики ГС, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.
5.5. Необходимая численность выборки
Разрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. Неизвестной остается минимальная численность выборки, обеспечивающая заданную точность. Ее можно получить из формул средней и предельной ошибок в зависимости от типа выборки. Так, подставляя формулы сначала (65) и затем (66) в формулу (67) и решая ее относительно численности выборки, получим следующие формулы:
для повторной выборки n = ; (72) для бесповторной выборки n = . (73)
Вариация () значений признака к началу выборочного наблюдения как правило неизвестна, поэтому ее берут приближенно одним из способов:
-
берется из предыдущих выборочных наблюдений;
-
по правилу «трех сигм», согласно которому в размахе вариации укладывается примерно 6 стандартных отклонений (H/ = 6, отсюда = Н2 /36);
-
если приблизительно известна средняя величина изучаемого признака, то = 2 /9;
-
если неизвестна дисперсия доли единиц, обладающих каким-либо значением признака, то используется ее максимально возможная величина = 0,25.