Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Voprosy_k_ekzamenu_po_statistike_2010_1.doc
Скачиваний:
12
Добавлен:
23.04.2019
Размер:
209.92 Кб
Скачать

12.Виды дисперсий и правило их сложения.

В статистическом исследовании очень часто бывает необходимо не только изучить вариации признака по всей совокупности, но и проследить количественные изменения признака по однородным группам совокупности, а также и между группами. Следовательно, помимо общей средней для всей совокупности необходимо просчитывать и частные средние величины по отдельным группам.

Различают три вида дисперсий: общая; средняя внутригрупповая; межгрупповая.

Общая дисперсия ( ) характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина определяется по формуле

где - общая средняя арифметическая всей исследуемой совокупности.

Средняя внутригрупповая дисперсия ( ) свидетельствует о случайной вариации, которая может возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от признака-фактора, положенного в основу группировки. Данная дисперсия рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным группам ( ), затем рассчитывается средняя внутригрупповая дисперсия :

где ni - число единиц в группе

Межгрупповая дисперсия (дисперсия групповых средних) характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле

где - средняя величина по отдельной группе.

Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:

Данное соотношение отражает закон, который называют правилом сложения дисперсий. Согласно этому закону (правилу), общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.

13.Показатели центра распределения.

Основные из них — математическое ожидание, среднее арифметическое, среднее геометрическое, среднее гармоническое, степенные средние, взвешенные средние, центр сгиба, медиана, мода.

Расчёт средних величин производится разными способами, и, соответственно, применение их тоже зависит от исследуемой совокупности.

У симметричного одномерного унимодального распределения математическое ожидание, медиана и мода одинаковы.

Математическое ожидание .

В зарубежной литературе применяется обозначение .

В статистике применяется выборочное среднее: .

Преимущества: если эксперимент повторяется многократно, а результаты суммируются (например, в страховании, азартных играх), математическое ожидание — естественный выбор.

Недостатки: не соответствует интуитивному пониманию «среднего»; меньшинство с аномальными значениями (долгожители, миллиардеры, бракованные изделия и т. д.) серьёзно смещают матожидание. В статистических расчётах рекомендуется отбрасывать такой «хвост».

Медиана

У одномерного распределения медиана — квантиль уровня 0,5. То есть, такое число m, что . (Или .)

Преимущества: Медиана согласуется с интуитивным пониманием «среднего». К тому же, даже очень «дикие» выбросы изменяют медиану незначительно. Например, если к сотне бедняков (доходы равномерно распределены от 0 до 1 $) добавить одного миллиардера (1 млрд $), среднее сместится от 0,5 $ до 10 млн $, в то время как медиана — от 0,5 $ до 0,505. Монотонная функция не изменяет медиану — для любой монотонной f(x) будет выполняться .

Недостатки: плохо работает для многомерных распределений со сложной взаимосвязью компонентов. Сложна в расчёте.

Мода

Мода — точка, в которой плотность распределения имеет локальный максимум. Распределение может иметь несколько мод.

Преимущества: позволяет работать с данными нечисловой природы.

Недостаток: не учитывает поведение распределения в других точках.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]