
- •Статистика. Курс лекций
- •Раздел I. Описательная статистика
- •Тема 1. Статистика как наука. Методы статистики
- •1. Общее понятие статистики. Предмет статистики.
- •2. Статистические совокупности. Признаки и их классификация.
- •3.Статистическое исследование. Методы статистики
- •4. Статистическое наблюдение. Виды статистического наблюдения.
- •Тема 2. Статистические показатели. Представление статистических
- •1. Сущность и значение статистических показателей. Показатель и его атрибуты
- •2. Общие принципы построения относительных статистических показателей
- •3. Роль и значение статистических показателей в управлении экономическими и социальными процессами
- •4. Представление статистических данных: таблицы и графики Статистические таблицы
- •Распределение занятого населения России по секторам экономики (млн. Человек)
- •Распределение населения России по основным возрастным группам по регионам рф на 1 января 1996 г. (%)
- •Тема 3. Статистическая группировка
- •1. Значение и сущность группировки. Построение группировки
- •2. Виды группировок
- •Группировка населения по размеру среднедушевого дохода в апреле 1994 г.
- •Группировка коммерческих банков России по сумме активов баланса (данные условные)
- •Группировка семей России по месту проживания и числу детей в 1989 г. (по материалам переписи населения)
- •3. Многомерные группировки
- •Тема 4. Средние величины
- •1. Средняя арифметическая величина. Свойства средней арифметической величины
- •Виды средней арифметической
- •Свойства арифметической средней
- •2. Другие формы средних величин
- •Средняя квадратическая величина
- •Средняя геометрическая величина
- •Средняя гармоническая величина
- •Раздел II. Аналитическая статистика
- •Тема 5. Вариация массовых явлений. Показатели вариации
- •1. Вариации массовых явлений. Построение вариационного ряда
- •2. Структурные характеристики вариационного ряда. Показатели размера и интенсивности вариации.
- •3. Показатели размера и интенсивности вариации.
- •1) Относительный размах вариации ρ:
- •2) Относительное отклонение по модулю m
- •4. Закономерности распределения.
- •Тема 6. Выборочное наблюдение.
- •1. Способы формирования выборочной совокупности. Виды выборки.
- •2. Ошибка выборки
- •3. Определение необходимой численности выборки.
- •4. Малая выборка
- •Тема 7. Статистическое изучение взаимосвязи социально-экономических явлений
- •1. Понятие о статистической и корреляционной связи
- •2. Парная регрессия на основе метода наименьших квадратов и метода группировок.
- •3. Множественная (многофакторная) регрессия.
- •4. Оценка тесноты связи.
- •5. Проверка значимости параметров регрессии.
- •Тема 8.Статистическое изучение динамики социально-экономических явлений.
- •1. Понятие и классификация рядов динамики. Показатели изменения уровней ряда динамики.
- •2. Методы выявления типа тенденции динамики
- •3. Методика измерения параметров тренда
- •4. Методика изучения и показатели колеблемости
- •5. Прогнозирование на основе тренда
- •Тема 9. Экономические индексы
- •1. Понятие и классификация экономических индексов
- •2. Индивидуальные и общие индексы
- •3. Агрегатные и средние индексы
- •4. Индексы структурных сдвигов и пространственно-территориального сопоставления. Индексы структурных сдвигов
- •Индексы пространственно-территориального сопоставления
- •5. Экономические индексы Ласпейреса, Пааше, Фишера. Индексы-дефляторы.
- •Границы и условия применения индексного метода
4. Малая выборка
Таблицы интеграла вероятностей используются для выборок большого объема из бесконечно большой генеральной совокупности. Но уже при n > 100 получается несоответствие между табличными данными и вероятностью предела; при n ≤ 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в генеральной совокупности не имеет значения, так как распределение отклонений выборочного показателя от генеральной характеристики при большой выборке всегда оказывается нормальным.
В выборках небольшого объема n ≤ 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводится из совокупности, имеющей нормальное распределение.
Теория малых выборок разработана английским статистиком В. Госсетом (писавшим под псевдонимом Стьюдент) в начале ХХ века. В 1908 г. им построено специальное распределение, которое позволяет и при малых выборках соотносить t и доверительную вероятность P(t). При n > 100 таблицы распределения Стьюдента дает те же результаты, что и таблицы вероятностей Лапласа, при 30 ≤ n ≤ 100 различия незначительны. Поэтому практически к малым выборкам относят выборки объемом менее 30 единиц (безусловно, большой считается выборка с объемом более 100 единиц).
Для оценки возможных пределов ошибки малой выборки пользуются отношением Стьюдента:
(30)
Знаменатель данной формулы представляет собой меру случайных колебаний выборочной средней малой выборки:
,
где
Таким образом, теоретическое отношение Стьюдента t имеет дело с величинами, определяемыми по выборке. Коэффициент t еще называют коэффициентом доверия малой выборки.
Плотность вероятностей распределения Стьюдента описывается функцией:
(31)
где k – число степеней свободы варьирования при определении выборочной дисперсии и для малых выборок равно n-1;
n - объем выборки;
А – определяется
в зависимости от числа степеней свободы
с помощью гамма-функции
Это распределение, как и нормальное, симметрично относительно точки t=0, но оно более пологое. При увеличении объема выборки, распределение Стьюдента быстро приближается к нормальному. Таблицы распределения Стьюдента публикуются в двух видах:
аналогично таблицам интеграла вероятностей приводятся значения t и соответственно вероятности F(t) при разном числе степени свободы;
значения t приводятся для наиболее употребляемых доверительных вероятностей 0,90; 0,95 и 0,99 или для 1 - 0,9 = 0,1; 1 - 0,95 = 0,05; 1 - 0,99 = 0,01 при разном числе степени свободы.
Таблицы Стьюдента показывают, что фактическое отношение Стьюдента будет не больше приведенного в таблице, т.е.
Пример. Оздоровительный центр, рекламируя свои услуги, предлагает клиентам за короткий срок снижение веса на 10 кг. По результатам выборочного обследования было опрошено 15 человек, которые воспользовались услугами центра. Были получены следующие данные:
-
№ п/п
Снижение веса, кг
№ п/п
Снижение веса, кг
1
10,2
9
5,2
2
7,6
10
6,1
3
6,1
11
5,0
4
8,4
12
3,7
5
6,0
13
4,7
6
5,7
14
3,6
7
13,7
15
3,2
8
6,9
Выборочная
средняя определяется как простая средняя
арифметическая и равна
кг, т.е. среднее снижение веса у опрошенных
клиентов составило 6,41 кг.
Выборочная
дисперсия составила:
Следовательно, средняя квадратическая ошибка выборки составит:
кг
Оценим с вероятностью 0,99 предел возможных расхождений выборочной средней и генеральной средней. Так как число степеней свободы k=n-1=15-1=14, то по таблицам распределения Стьюдента находим коэффициент доверия t:
Для числа степеней свободы 14 коэффициент доверия равен t=2,977.
Тогда с вероятностью 0,99 можно предположить, что ошибка выборочной средней будет не больше:
кг, а снижение веса пациентов
оздоровительного центра будет находится
в пределах:
,
т.е. в пределах от 4,3 до 8,52 кг. Следовательно,
указанное в рекламе снижение веса на
10 кг имеет столь малую вероятность, что
считается практически невозможным.