
Возраст (в8)
|
Частота |
Процент |
Валидный процент |
Кумулятивный процент |
|
Валидные |
18-22 |
129 |
8,6 |
8,6 |
8,6 |
23-32 |
246 |
16,4 |
16,4 |
25,0 |
|
33-42 |
265 |
17,7 |
17,7 |
42,7 |
|
43-52 |
287 |
19,1 |
19,2 |
61,9 |
|
53-62 |
239 |
15,9 |
16,0 |
77,8 |
|
63 и более |
332 |
22,1 |
22,2 |
100,0 |
|
Итого |
1498 |
99,9 |
100,0 |
|
|
Пропущенные |
Системные пропущенные |
2 |
,1 |
|
|
Итого |
1500 |
100,0 |
|
|
Среднее арифметическое не отражает точно распределение, кроме случаев с однородными результатами.
Искажение
Определить его позволяет средняя мера разброса
Для корректировки используется усечение 5% крайних значений
Чем меньше разброс, тем лучше ср ариф отражает мои значения (однородная совокупность)
Чем больше разброс, тем больше крайние значения влияют на неадекватность ср ариф
Статистические характеристики распределения
Показатели вариации (разброса)
(статистики, показывающие меру разброса – вариабельности – значений переменной. Используются для оценки однородности совокупности):
- размах вариации
- дисперсия
- квартильное отклонение (+ межквартильный размах)
- стандартное (среднеквадратическое) отклонение
- коэффициент вариации
Размах вариации (разброс выборки)
Чем больше величина (шире диапазон) тем сильнее варьирует изучаемый признак
Пример на БД «ФОМ ТВ 2»
Два раза кликнуть чтобы развернуть свернутую таблицу
Статистики
СКОЛЬКО ЛЕТ ВАМ ИСПОЛНИЛОСЬ?
N |
Валидные |
1498 |
Пропущенные |
0 |
|
Среднее |
45,08 |
|
Медиана |
44,00 |
|
Мода |
42 |
|
Размах |
71 |
|
Минимум |
18 |
|
Максимум |
89 |
Размах вариации = 89 – 18 = 71
Чем он меньше, тем адекватнее ср ариф
ДИСПЕРСИЯ
Чаще всего используется для оценки разброса
Рассчитывает среднее арифметическое квадратов отклонений значений переменной от ее среднего значения
S= сумма (Хi – X)* (Хi – X)/n -1
Извлечение корня из дисперсии – среднеквадратическое (стандартное) отклонение (СКО) О
Чем больше, тем больше значения переменной отличаются друг от друга, тем менее адекватно среднее арифметическое.
Стандартное отклонение:
70 1.7 2.89
75 6.7 44.89
60 -8.3 68.89
(сумма)116,67 (116,67/н-1 <=> 2) 58,30
Ср ариф: ?
Ср ариф - i
Ср ариф – i * Ср ариф - i
Закон Гаусса = нормальный закон распределения. Чем ближе к центру, тем больше будет количество значений, чем дальше от центра тем реже встречаются значения. В средней зоне буде лежать 68,3 % наших значений. Мода, медиана и ср ариф должны быть в одной точке (будут являться признаком нормального распределения), Бывают и отклонения, на них есть определенные причины.
Эмпирическое распределение – реальное
Теоретическое – закон Гаусса
КОЭФФИЦИЕНТ ВАРИАЦИИ
Величина относительной изменчивости переменной, представляющая собой отношение ее стандартного отклонения к ее среднему значению.
V= O/x * 100%