- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
8. Графическое представление данных
Существует три основных метода графического представления данных – гистограмма (столбиковая диаграмма), полигон частот и сглаженная кривая (огива).
Гистограмма представляет последовательность столбцов, каждый из которых опирается на один интервал группирования данных, а высота столбца соответствует количеству элементов выборки, попавших в этот интервал группирования. Для построения гистограммы по горизонтальной оси откладываются границы интервалов группирования данных, а по вертикальной оси частоты попадания наблюдений в интервалах.
Границы интервалов |
Частоты |
40-50 50-60 60-70 70-80 80-90 90-100 100-110 110-120 |
2 4 5 8 7 7 4 1 |
Частоты
8
7
6
5
4
3
2
1 Границы интервалов
40 50 60 70 80 90 100 110 120
Если в гистограмме будут часто провалы, значит вы много интервалов взяли.
Полигон частот – построение полигона частот во многом напоминает построение гистограммы, только в этом случае по горизонтальной оси откладываются значения середин интервалов группирования данных (по вертикальной то же самое). После этого на координатной плоскости наносятся точки. Первая координата, которая соответствует середине интервала группирования и вторая – частоте. Для окончательного построения полигона частот точки соединяются отрезками прямых. На компьютере – двухлинейчатая (только в качестве 1 столбца середины значений интервалов)
Частоты
7
6
5
4
3
2
1 Границы интервалов
5 5 65 75 85 95 105 115
Сглаженная кривая или огива иногда вместо гистограммы или полигона частот строят сглаженную кривую. Основное отличие в том, что она проводится по точкам таким образом, чтобы график не имел острых углов или зубцов. Для ее построения по горизонтальной оси всегда откладываются значения от 0 до 100 (они соответствуют процентам). По вертикальной оси откладываются границы интервалов группирования данных. После этого на координатной плоскости наносятся точки, вторая координата которой соответствует границе интервала, а первая координата накопленной частоте попадания, выраженной в процентах. Для окончательного построения нанесенные точки соединяются гладкой кривой.
В качестве исходных данных для построения огивы используется таблица, полученная после табулирования данных, но при этом второй столбец этой таблицы (частоты) мы должны преобразовать в накопленные частоты, а затем в проценты.
Границы интервалов |
Частоты |
Накопленные частоты |
Накопленные частоты в % |
40-50 50-60 60-70 70-80 80-90 90-100 100-110 110-120 |
2 4 5 8 7 7 4 1 |
2 2/38=0,05 (4+2)=6 4/38=0,1 (6+5)=11 19 26 33 37 38 |
5 15 28 48 65 83 95 100 |
38 учеников; 38 –100%; 2 – х%; х=2 100/38=2 2,5
Г раницы интервалов
110
100
90