
- •ВВедение
- •Тема 1. Предмет и метод статистики. Организация статистики
- •1. Статистика как наука, специфические особенности ее предмета. Основные понятия.
- •Закон больших чисел
- •Тема 2. Абсолютные и относительные величины
- •Тема 3. Статистические таблицы и графики
- •Тема 4. Статистическое наблюдение
- •Тема 5. Группировка и сводка результатов статистического наблюдения
- •Тема 6. Средние величины
- •Тема 7. Статистическое изучение вариации
- •Тема 8. Выборочное наблюдение
- •Тема 9. Статистические ряды динамики
- •Тема 10. Индексы
- •Тема 11. Статистическое изучение взаимосвязей явлений
Тема 6. Средние величины
Сущность и значение средней величины. Виды средних величин.
Среднее значение признака, методы его расчета.
Структурные средние величины.
1. Сущность и значение средней величины. Виды средних величин.
Средняя величина – это один из самых распространенных приемов обобщений, в которых находят выражение действие общих условий, закономерность развития изучаемого явления. Средняя величина позволяет через единичное и случайное выявить общее в развитии общественного явления.
Средняя величина - это наиболее обобщенная характеристика совокупности по количественно-варьирующему признаку в расчете на единицу однородной совокупности.
Правило: средние величины должны исчисляться на основе массового обобщения фактов и применяться к качественно однородным совокупностям.
Средняя величина отражает то общее, типичное, что складывается в отдельном изучаемом явлении, поэтому она должна дополняться другими аналитическими показателями, так как за общими благополучными средними могут скрываться серьезные недостатки.
Каждая средняя величина характеризует совокупность только по какому-либо одному признаку. Чтобы получить полное представление об изучаемом явлении (совокупности по ряду признаков), надо рассчитать систему средних величин.
Средние величины измеряются в тех же единицах, что и признак.
В статистике выделяют следующие виды средних величин:
среднее значение признака,
структурные средние величины: мода,
медиана.
2. Среднее значение признака, методы его расчета.
Для расчета среднего значения признака в статистике применяются следующие методы расчета средних величин:
средняя арифметическая,
средняя гармоническая,
средняя квадратическая (применяется при исчислении показателей вариации)
средняя хронологическая (применяется для расчета среднего уровня ряда в моментных статистических рядах динамики с равными периодами времени между наблюдениями),
средняя геометрическая (применяется при исчислении средних темпов роста в статистических рядах динамики).
Средняя арифметическая – отношение объема варьирующего признака к числу единиц совокупности:
[1]
Используется две ее формы:
простая – когда объем варьирующего признака рассчитывается как сумма значений признака каждой единицы совокупности:
[2]
где
-
среднее значение признака,
å - знак суммы “сигма”,
x - значение признака (варианта)
åx – объем варьирующего признака,
n - число единиц совокупности.
Средняя арифметическая простая применяется в случаях, когда имеются значения признака по каждой единице совокупности, т.е. на индивидуальных данных.
взвешенная – когда объем варьирующего признака рассчитывается как сумма произведений значений признака на частоту (вес) (f) и тогда число единиц совокупности рассчитывается как сумма частот:
[3]
Средняя арифметическая взвешенная применяется в случаях, когда имеются значения признака (x) - качественная особенность единицы совокупности и частота (вес) (f) - число единиц совокупности, обладающих данным значением признака. Указанные характеристики выступают элементами статистического ряда распределения, а так как средняя величина - это наиболее обобщенная характеристика совокупности по количественно-варьирующему признаку, то - вариационного статистического ряда распределения.
Таким образом, сфера применения средней арифметической взвешенной – вариационные статистические ряды распределения. Которые делятся на два вида:
дискретные - если значения признака представлены отдельными (дискретными) числами. Тогда среднее значение признака рассчитывается непосредственно по формуле средней арифметической взвешенной,
интервальные - если значения признака представлены диапазонами, интервалами. Тогда для применения формулы средней арифметической взвешенной необходимо значения признака представить в виде дискретных чисел, т.е. перейти от интервального вариационного статистического ряда распределения к дискретному. Для этого по каждому интервалу значений признака рассчитывается среднее значение признака (как наиболее обобщенная характеристика совокупности по количественно-варьирующему признаку) по формуле средней арифметической простой:
[4]
где
- среднее значение признака в i-том
интервале,
xi max – верхняя граница i- го интервала,
xi min – нижняя граница i- го интервала.
При этом открытые интервалы (т.е. описанные только одной границей – верхней или нижней) закрывают по правилу:
- первый закрывают по длине второго,
- последний – по длине предпоследнего.
Свойства средней арифметической:
произведение среднего значения признака на число единиц совокупности равно объему варьирующего признака:
[5]
или
[6]
сумма отклонений значений признака от среднего значения признака равна нулю:
[7]
или
[8]
если все частоты разделить или умножить на какое-либо число, то средняя арифметическая от этого не изменится:
[9]
Средняя гармоническая (как частный случай средней арифметической) – используется в случаях, если известны значения варьирующего признака, и объем варьирующего признака (произведение признака на частоту – х*f), но нет информации о числе единиц совокупности. В практике чаще всего применяется в форме взвешенной:
[10]
Средняя квадратическая – корень квадратный из среднего квадрата значений признака (применяется как показатель вариации признака):
[11]
- в форме простой, если средний квадрат значений признака рассчитывался по формуле средней арифметической простой, т.е. на индивидуальных данных:
[12]
и тогда
[13]
- в форме взвешенной, если средний квадрат значений признака рассчитывался по формуле средней арифметической взвешенной:
[14]
Cредняя хронологическая – как отношение суммы половины первого и последнего значений признака и полных промежуточных значений признака к числу единиц совокупности, уменьшенному на единицу:
[15]
Средняя геометрическая – корень n-ой степени из произведения (П) значений признака (х1,х2,…,xn):
[16]
3. Структурные средние величины.
Структурные средние – мода и медиана – применяются для характеристики структуры изучаемой совокупности.
Мода (Мо) в статистике – это значение признака (варианта), которое чаще всего встречается в данной совокупности, то есть варианта, имеющая наибольшую частоту:
[17]
Таким образом, для определения моды необходимо наличие частот, т.е. мода рассчитывается только на вариационных статистических рядах распределения. При этом:
- в дискретных вариационных статистических рядах распределения мода определяется визуально,
- в интервальных вариационных статистических рядах распределения мода рассчитывается по специальной формуле. При применении формулы необходимо соблюдать следующее условие: длины всех интервалов должны быть равными.
В самой же формуле используются следующие допущения:
мода расположена в наиболее часто встречающемся интервале (т.е. интервале с наибольшей частотой) – модальном интервале,
значения признака в модальном интервале расположены равномерно,
мода в модальном интервале тяготеет к той его границе, где частота рядом лежащего интервала (предшествующего или последующего) больше:
[18]
где хМо – нижняя граница модального интервала,
iМо – длина модального интервала,
fМо-1 - частота интервала, предшествующего модальному,
fМо - частота модального интервала,
fМо+1 - частота интервала, следующего за модальным.
Медиана (Ме) – это значение признака (варианты), расположенного на середине ранжированного статистического ряда (ряда, в котором значения признака расположены в порядке возрастания или убывания), т. е. делит численность упорядоченного статистического ряда пополам,
для индивидуальных данных
[19]
При этом для данных с нечетным количеством единиц совокупности (обязательно расположенных в порядке возрастания или убывания значений признака) медианой будет значение признака (варианта), расположенная в центре ряда; с четным количеством - рассчитывается по формуле средней арифметической простой из двух центральных смежных вариант.
для вариационных статистических рядов распределения:
[20]
Медиана в дискретном вариационном статистическом ряду распределения и медианый интервал в интервальном находятся по данным о накопленных (суммированных) частотах. Так как медиана делит количество единиц совокупности пополам, значит, находится там, где накопленная (кумулятивная) частота составляет половину или больше половины суммы частот, а предыдущая накопленная частота меньше половины численности совокупности.
Затем, на интервальном вариационном статистическом ряду распределения она рассчитывается по формуле:
[21]
где хМе – нижняя граница медианного интервала,
iМе - длина медианного интервала,
åf – сумма частот,
SМе-1 - сумма частот, накопленных до медианного интервала,
fМе – частота медианного интервала.
Значение моды и медианы можно определить также графически: моду – при помощи построения гистограммы, медиану – при помощи построения кумуляты (графика накопленных частот).