- •Тема 1: Общая теория статистики как наука
- •Предмет статистики
- •Важнейшие категории статистики
- •Классификация признаков, характеризующих единицу статистической совокупности
- •Метод статистики
- •Статистическое наблюдение
- •Тема 2: Статистическое наблюдение
- •План статистического наблюдения
- •Программно-методологическая часть
- •Организационная часть
- •Ошибки наблюдения
- •Контроль данных наблюдения
- •Формы, виды и способы наблюдения Формы наблюдения
- •Виды статистического наблюдения
- •Тема 3: Метод группировок
- •Виды статистических группировок
- •Характеристика зависимости количества комментариев от
- •Тема 4: Статистическое представление информации
- •Статистические таблицы
- •Виды статистических таблиц
- •Основные требования, предъявляемые при составлении и оформлении таблиц
- •Статистические графики
- •Виды статистических графиков
- •Статистические графики
- •Статистические карты
- •Тема 5: Абсолютные и относительные величины
- •Абсолютные величины
- •Относительные величины
- •Виды относительных величин
- •Тема 6: Средние величины
- •Общая и групповые средние
- •Виды средних величин
- •Правило мажоритарности средних
- •Тема 7. Изучение вариации Показатели анализа вариационного ряда распределения
- •Оценка существенности асимметрии
- •Эксцесс распределения
- •Оценка существенности эксцесса
- •Тема 8. Нормальное распределение
- •Свойства нормального распределения
- •Косвенные расчеты показателей вариации
- •Критерий согласия к.Пирсона
- •Критерий согласия в. И. Романовского
- •Критерий согласия б.С.Ястремского
- •Критерий согласия а.Н.Колмогорова
- •Тема 9. Выборочный метод
- •7) Многоступенчатая;
- •Средняя и предельная ошибки выборки
- •Формулы численности случайной выборки при определении доли изучаемого признака
- •Малая выборка
- •Тема 10. Дисперсионный анализ
- •Принципиальная схема дисперсионного анализа
- •Тема 11. Статистическое изучение корреляционных взаимосвязей
- •Связь изучается между вариацией результативного и факторного признаков, а не между их отдельными величинами
- •Коэффициенты Фехнера и Спирмэна
- •Эмпирическое и теоретическое корреляционное отношение
- •Оценка тесноты связи нелинейной зависимости
- •Множественная корреляция
- •Тема 12. Анализ рядов динамики
- •Тема 13. Индексный метод
- •Формулы индексов
- •Г рафик Варзара
Правило мажоритарности средних
С увеличением показателя степени средних увеличивается и сама средняя величина
-
гарм
геом
арифм
квадр
куб
Применение степенных средних (зависит от характера имеющейся информации)
Вид степенной средней |
Область применения |
Гармоническая |
|
Геометрическая |
|
Арифметическая |
|
Квадратическая |
|
Кубическая |
|
Применение средних величин в экономике
В средних величинах отображаются важнейшие показатели товарооборота, товарных запасов, цен. Средними величинами характеризуются качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.
Например, обобщающим показателем доходов рабочих акционерного общества (АО) служит средний доход одного рабочего, определяемый отношением фонда заработной платы и выплат социального характера за рассматриваемый период (год, квартал, месяц) к численности рабочих АО. Для лиц с достаточно однородным уровнем доходов, например, работников бюджетной сферы и пенсионеров по старости (исключая имеющих льготы и дополнительные доходы) можно определить типичные доли расходов на покупку предметов питания. Так можно говорить о средней продолжительности рабочего дня, среднем тарифном разряде рабочих, среднем уровне производительности труда и т.д.
Средняя зарплата показывает, сколько получает один работник.
Зарплата индивидуального работника – это индивидуальная величина. Cумма начисленных средств всем работникам – суммарная величина, а средняя зарплата – средняя величина |
Средняя цена показывает, сколько в среднем стоит данный товар.
где товарооборот - выручка от реализации всего товара |
И т.п.
Тема 7. Изучение вариации Показатели анализа вариационного ряда распределения
|
|
Структурные характеристики |
||
Структурные средние |
|
Квантили |
|
|
|
|
||
|
|
|
|
||
|
||
Мода -
-
наиболее часто встречающееся значение
признака, т.е. тот вариант, который имеет
наибольшую частоту.
для дискретного: не требуется применения никакой формулы, модой будет максимально часто встречающееся значение признака
для интервального (непрерывный, равноинтервальный вариационный ряд) по формуле:
-
где
домодальный интервал,
послемодальный
интервал,
- мода,
-начальное
значение модального интервала,h – ширина, m – частота
Например: чаще всего за футбольный матч было забито 2 мяча - 71 раз (см.табл.). Модой является число 2.
Распределение футбольных матчей по числу забитых за матч обеими командами мячей
Число забитых мячей, х |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Итого |
Число матчей, fi |
30 |
56 |
71 |
59 |
49 |
24 |
12 |
3 |
0 |
2 |
306 |
Медиана
-
-
значение признака, приходящееся на
середину ранжированной совокупности.
Средняя величина,
центральный член ранжированного ряда.
Медиана не зависит
от значений признака на краях ранжированного
ряда. Она может быть рассчитана и в
дискретных, и в непрерывных вариационных
рядах
• для дискретного: |
• для интервального: |
|
|
Например, в таблице, отражающей урожайность, медианным является среднее из 143 значений, т.е. 72-е от начала ряда значение урожайности. Как видно из ряда накопленных частот, оно находится в четвертом интервале.
Группы хозяйств по урожайности, ц/га хj |
Число хозяйств fj |
Середина интервала, ц/га хj' |
x’j |
Накопленная частота f’j |
10- 15 |
6 |
12,5 |
75,0 |
б |
15-20 |
9 |
17,5 |
157,5 |
15 |
20-25 |
20 |
22,5 |
450,0 |
35 |
25 -30 |
41 |
27,5 |
1127,5 |
76 |
30-35 |
26 |
32,5 |
845,0 |
102 |
35-40 |
21 |
37,5 |
787,5 |
123 |
40-45 |
14 |
42,5 |
595,0 |
137 |
45 - 50 |
5 |
47,5 |
23-7,5 |
142 |
50-55 |
1 |
52,5 |
52,5 |
143 |
Итого |
143 |
|
4327,5 |
|
Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.
Если < < , то имеет место левосторонняя асимметрия ряда.
Если < < , то имеет место правосторонняя асимметрия ряда.
Если = = , то распределение нормальное.
Для выражения особенностей формы распределения рассчитываются ранговые характеристики и кривые распределения. Ранговые характеристики носят общее название квантили.
Квантили – значения признака, которые делят ряд распределения на равные части
Позволяют детально изучить вариационные ряды. Они подразделяются на «семейства»
|
|
Квартили - Аналогично медиане вычисляются значения признака, делящие ранжированную совокупность делят на четыре равные части. Ясно, что Q2 совпадает с Me
Первый (нижний) квартиль отсекает от совокупности ¼ часть единиц с минимальными значениями, а третий (верхний) отсекает ¼ часть единиц с максимальными значениями. С помощью квартилей мы определяем границы, где находятся 50% единиц, наиболее характерные для этой совокупности. При этом вторая квартиль является медианой.
Квинтили- ранжированную совокупность делят на пять равных частей
Квартили |
Квинтили |
Первая квартиль
|
Первый квинтиль
|
Третья квартиль
|
Четвертый квинтиль
|
Сикстили - ранжированную совокупность делят на шесть равных частей.
Децили - ранжированную совокупность делят на десять равных частей
Пример - децильный коэффициент дифференциации населения. Население делится на 10 частей по уровню дохода. Берут первые 10% и последние 10%. Считают, что средний доход последней группы не должен быть больше, чем в 10 раз среднего дохода первой группы. В России официально это превышение составляет 14-16 раз, неофициально – 20 и более раз
Перцентили (процентили) - ранжированную совокупность делят на сто равных частей
Сикстили |
Децили |
Перцентили |
|
|
|
|
|
|
Показатели вариации. С разной степенью точности дают оценку силе вариации
Признак |
||
Количественный |
Альтернативный |
|
Абсолютные показатели |
Относительные показатели |
Среднее квадратическое отклонение альтернативного признака |
Размах вариации |
Коэффициент осцилляции |
|
Среднее линейное отклонение |
Линейный коэффициент вариации |
|
Среднее квадратическое отклонение; |
Коэффициент вариации по среднему квадратическому отклонению |
|
Дисперсия |
||
Размах вариации - представляет разность между наибольшим и наименьшим значением варьирующего признака. Размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.
|
Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности, поэтому показателем силы вариации выступает среднее линейное отклонение.
Среднее линейное отклонение - представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариант от их средней арифметической величины (причем берется модуль отклонений)
Простая
|
Взвешенная
|
С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования.
Среднее квадратическое отклонение показывает насколько в среднем отклоняются варианты признака от его среднего значения
Простая
|
Взвешенная
|
Дисперсия- средний квадрат отклонений значений признака от их средней величины
(Среднее квадратическое отклонение в квадрате)
Простая
|
Взвешенная
|
Упрощенный способ расчета
|
Простая
|
Взвешенная
|
Относительные показатели вариации
Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации.
Коэффициент осцилляции: |
Линейный коэффициент вариации: |
Коэффициент вариации: |
|
|
|
Если коэффициент вариации больше 33%, то можно сделать вывод, что вариация сильная, а совокупность неоднородная; меньше 33% - вариация небольшая, совокупность однородная
Дисперсия альтернативного признака,
имеющего два взаимно исключающих
значения:
Наибольшая вариация совокупности
достигается в случаях, когда часть
совокупности, составляющая 50% от всего
объема совокупности, обладает признаком,
а другая часть совокупности, также
равная 50%, не обладает данным признаком,
при этом дисперсия достигнет максимального
значения при 0,25, т.е.
P = 0,5 G = 1- P = 1-0,5 = 0,5
Если статистическая совокупность разбита на группы, то возможно вычисление групповых дисперсий, средней из групповых дисперсий, межгрупповой дисперсии и общей дисперсии. Между ними существует связь, называемая правилом сложения дисперсии:
Виды дисперсий
В совокупности разделенной на части выделяют:
общую дисперсию
межгрупповую дисперсию
среднюю из внутригрупповых дисперсий
Правило сложения дисперсий:
Центральные моменты распределения
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели получили название центральных моментов распределения порядка, соответствующего степени, в которую возводятся отклонения, или просто моментов.
Показатели формы распределения
Асимметрия – Коэффициент асимметрии
характеризует асимметричность
(«скошенность») распределения признака
в совокупностиЭксцесс – Показатель эксцесса
представляет собой отклонение вершины
эмпирического распределения вверх или
вниз («крутость») от вершины кривой
нормального распределения
Асимметрия распределения
При =0 распределение считается нормальным.
При > 0 правосторонняя асимметрия.
При <0 левосторонняя асимметрия.
Если асимметрия более 0,5, то независимо от знака она считается значительной
Если асимметрия меньше 0,25, то она считается незначительной
Асимметрия распределения рассчитанная по формулам К.Пирсона: |
|
|
является приблизительной |
Расчет асимметрии распределения при помощи нормированного момента третьего порядка дает наиболее точный результат |
|
т.е.
- нормированный момент третьего порядка |
Показатель Пирсона зависит от степени асимметричности в средней части ряда распределения, а показатель асимметрии, основанный на моменте третьего порядка, - от крайних значений признака.
