- •Статистический анализ
- •1. Дескриптивный анализ
- •Средние величины
- •Средняя арифметическая
- •Квартили, децили, перцентили
- •2. Выводной анализ
- •Выборка
- •3. Анализ гипотез Введение в теорию гипотез
- •Уровни статистической значимости
- •Правило отклонения нулевой и принятия альтернативной гипотезы
- •Непараметрические критерии
- •4. Анализ связей
- •Применение метода анализа взаимосвязей между признаками в маркетинговых исследованиях
- •Классификация подходов и методов анализа парных взаимосвязей между признаками
- •Вариации качественных, но не альтернативных признаков
- •Вариации количественных и качественных признаков
- •Вариация количественных признаков
- •Взаимосвязь между двумя количественными признаками
- •Корреляционные отношения
- •Множественная многофакторная регрессия
- •Работа с многофакторной моделью
- •Совокупный коэффициент корреляции
- •Частные коэффициенты корреляции
- •Оценка существенности связи и принятие решений на основании уравнения регрессии (проверка адекватности модели)
- •5. Факторный анализ
- •Полная факторная матрица
- •Техники выделения факторов
- •6. Кластерный анализ
- •Методы кластеризации
- •7. Контент-анализ
Средние величины
Средняя арифметическая
а) для дискретного ряда:
б) для интервального ряда:
где х’ – середина соответствующего
интервала, вычисленная как средняя из
границ интервала:
2. Медиана соответствует варианту,
стоящему в середине совокупности.
Положение медианы определяется ее
номером:
,
где n – число единиц в
совокупности. Численное значение
медианы в ранжированном дискретном
ряду с нечетным количеством единиц
равно значению варьируемого признака,
соответствующего найденному номеру
(положению) медианы в ряду:
Если в дискретном ряду четное количество
единиц, то численное значение медианы
определяют как:
В интервальном ряду численной значение
медианы определяют с помощью накопленной
частоты:
где xMe – нижняя граница медианного интервала
i – величина медианного интервала
S(Me-1) - накопленная частота интервала, предшествующего медианному
fMe – частота медианного интервала
3. Мода - величина варьируемого
признака, чаще всего встречающаяся в
данном ряду распределения, то есть
имеющая наибольшую частоту. Численное
значение моды определяется значением
признака с наибольшей частотой – для
дискретного ряда, а для интервального
ряда следующим образом:
где xMo – нижняя граница модального интервала
fMo – частота модального интервала
f(Mo-1) – частота интервала, предшествующего модальному
f(Mo+1) – частота интревала, следующего за модальным
4. Среднее линейное отклонение:
Для не сгруппированных данных:
Для вариационного ряда:
Для интервального ряда:
5. Среднеквадратическое отклонение:
а) Для не сгруппированных данных:
Дисперсия:
б) Для вариационного ряда:
Дисперсия:
в) Для интервального ряда:
Дисперсия:
Существуют упрощенные формулы для расчета дисперсии:
а) по средним:
б) по частостям:
Для сравнительной оценки вариации и
характеристики однородности совокупности
применяют коэффициент вариации:
Совокупность считается однородной, если коэффициент вариации не превышает 33 %.
Квартили, децили, перцентили
Обобщающие характеристики центра распределения и степени вариации не дают представления о форме распределения, так как не вскрывают характера изменения частот.
Для выражения особенностей формы распределения применяются ранговые характеристики.
Ранговые характеристики – это варианты, занимающие в вариационном ряду определенное место.
К их числу относятся квартили, децили, перцентили.
Квартили – значения признака, которые делят ранжированный ряд на 4 равные по численности части.
Q1
Q2
Q3
Первая квартиль – Q1
Вторая квартиль (совпадает с медианой) - Q2
Третья квартиль - Q3
Вычисление квартилей аналогично вычислению медианы: сначала определяют положение (место) квартили в ряду.
Место первой квартили:
Место второй квартили:
Место третьей квартили:
Затем по накопленным частотам определяют численное значение по формуле:
где xQ – нижняя граница интервала, в котором находится квартиль
NQ – место квартили
S(Q-1) – накопленная частота интервала, предшествующего тому, где находится квартиль
fQ – частота интервала, в котором находится квартиль
Децили – значения признака, которые ранжированный ряд делят на 10 равных частей. Расчеты ведутся аналогично расчетам квартилей:
и так далее до
,
где n – общее число единиц
в совокупности
Численное значение определяется по формуле:
где xD – нижняя граница интервала, в котором находится дециль
ND – место децили
S(D-1) – накопленная частота интервала, предшествующего тому, где находится дециль
fD – частота интервала, в котором находится дециль
Перцентили – значения признака, делящие ранжированный ряд на 100 равных частей. Все вычисления аналогичны вычислениям децилей и квартилей.
Предварительная оценка рассеяния признака определяется с помощью размаха вариации:
Но, если критические значения признака не типичны для совокупности, то есть они являются аномальными значениями, то используют квартильный, децильный и перцентильный размах.
Квартильный размах:
Децильный размах:
Перцентильный размах:
С точки зрения применения для различных шкал:
а) коэффициент вариации вычисляется и имеет смысл только для шкал равных отношений
б) медиана рассчитывается только для порядковых шкал
в) Мода – только для номинальных шкал
г) Средняя арифметическая – для интервальных и шкал равных отношений
д) Все показатели вариации вычисляются только для интервальных шкал или шкал равных отношений.
