
- •Занятие 2. Изучение возможностей программы spss по статистической обработке данных
- •Описание файла. Исследуемые переменные:
- •Определение статистических параметров переменных и поиск ошибок исходных данных
- •Очистка данных от ошибочных значений
- •Анализ влияния ошибочных и неудачных значений на результаты обработки.
- •Анализ зависимости заболеваемости язвой желудка от пола и возраста пациентов.
Анализ зависимости заболеваемости язвой желудка от пола и возраста пациентов.
Графический анализ.
5.1 Построить график типа Bar Simple для переменной vozrast.
Выводы по графику в отчет вместе с графиком.
5.2 Построить график типа Bar/ Stacked (с наложениями) по той же переменной, в качестве переменной, определяющей наложения, использовать переменную pol.
Выводы по графику в отчет вместе с графиком.
: мужчины болеют значительно чаще женщин, средний возраст заболеваемости у женщин выше, чем у мужчин.
Построить график типа гистограммы по всем пациентам, а также отдельно для мужчин и женщин. Выводы: получение частотных характеристик, точных значений числа пациентов, средних значений и среднеквадратичных отклонений.
Показатели зависимости.
Определить коэффициент корреляции для переменных pol – vozrast. Результат 0,293**. Вывод: пол и возраст достоверно связаны друг с другом.
Найти средние значения возраста для мужчин и женщин. Результат: 46 и 58 лет.
Определить, является ли это различие достоверным (проверить гипотезу о равенстве). Результат: sig = 0. Вывод: гипотеза о равенстве не принимается, различие достоверно.
Анализ зависимости систолического и диастолического давления.
Коэффициент корреляции получен ранее и равен 0,866**.
Построить график типа Scatter, ось Х – диастолическое, ось Y – систолическое давление. Вывод: на графике зависимость четко прослеживается, все точки лежат в относительно узком коридоре значений, который идет из левого нижнего в правый верхний угол графика.
Построить график линейной регрессии в тех же координатах (Analyze/Regression/Curve estimation). Параметры прямой регрессии подбираются таким образом, чтобы минимизировать сумму квадратов отклонений ее от каждой точки графика. Наклон прямой характеризует степень зависимости переменных. По коэффициентам b0 и b1, приведенных в результатах обработки, можно составить уравнение прямой:
y = b1*x + b0
где y и x – переменные, отложенные по осям Y и Х соответственно, b1 – тангенс угла наклона, b0 – ордината в точке пересечения с осью Х. Зная уравнение линейной регрессии можно предсказать значения переменных в тех областях, где нет экспериментальных точек.
Анализ зависимости диастолического давления от возраста (используется переменная ad_diast).
Найти коэффициент корреляции. Результат: 0,069. Вывод: достоверной зависимости не обнаружено, противоречие с жизненным опытом. Почему?
Построить график типа Scatter, ось Х – диастолическое давление, ось Y – возраст. Результат: точки более или менее равномерно размазаны по всей области графика. Вывод: не прослеживается зависимости давления от возраста, что соответствует близкому к нулю значению коэффициента корреляции.
Построить график линейной регрессии в тех же координатах. Результат: прямая регрессии имеет небольшой наклон. Вывод: зависимость отсутствует или очень слабая. Параметр b1, показывающий наклон прямой, равен 0,057.
Анализ зависимости общего состояния (sostob) от возраста.
Построить график типа Bar stacked, где основной переменной является возраст, а наложения определяются переменной sostob. Вывод: можно заметить, что по мере ухудшения состояния цветные столбики смещаются вправо, но визуально эффект слабо выражен.
Построить линейную регрессию, описывающую зависимость общего состояния от возраста.
Определить минимальные и максимальные возрасты для различных состояний (Analyze/Descriptive statistic/Crosstabs, по строкам возраст, по столбцам sostob). Вывод: определенных тенденций не выявлено.
Определение средних значений возраста для состояний различной тяжести. Результаты подтверждают визуальный анализ графика: по мере ухудшения состояния средний возраст пациентов имеет тенденцию к увеличению.
Проверить гипотезу о равенстве средних возрастов для последовательных состояний: 1 и 2, 2 и 3, 3 и 4.
Анализ зависимости общего состояния от систолического давления (по предыдущей схеме). Сделать выводы по кривым линейной и квадратичной регрессии.
График типа Bar stacked.
Линейная и квадратичная регрессия.
Минимальные и максимальные давления для различных состояний.
Средние значения давления для различных состояний.
Проверка гипотез о равенстве средних давлений для различных состояний.
Анализ зависимости частоты пульса от систолического давления.
Найти коэффициент корреляции. Результат: -0,432**. Вывод: зависимость достоверно установлена, при увеличении давления пульс уменьшается.
График типа Scatter. Вывод: визуально просматривается тенденция уменьшения пульса при увеличении давления. Минимальное давление 60, при этом пульс находится в районе 120, оба значения существенно отличаются от нормы. При увеличении давления пульс начинает уменьшаться, оба показателя начинают приближаться к норме. При превышении давлением значения 140 пульс начинает опять увеличиваться, опять оба показателя отклоняются от нормы.
Кривые линейной и квадратичной регрессии. Квадратичная регрессия более детально описывает зависимость. По графику видно, что оптимальное давление находится в районе 140, при этом пульс становится меньше 90, что можно считать самым благоприятным сочетанием показателей.
Контрольное задание.
Провести анализ зависимости рецидива от возраста. (Бар с наложениями, гистограмма возраста для различных рецидивов, средние значения возраста, проверка гипотезы о равенстве средних возрастов для различных рецидивов).
Провести анализ зависимости слабости от систолического давления.
Провести анализ зависимости пульса от пола.
Оформить результаты исследований в виде отчета в документе текстового редактора.