
- •Теоретическая часть
- •Практическая часть Вариант 18.
- •Определить, существует ли корреляционная взаимосвязь между показателями рождаемости и смертности в городе n (на 1000 человек).
- •Решение:
- •У 12 работающих на ультразвуковых установках изучалось содержание сахара в крови до работы и через 3 часа после работы. Результаты приведены в таблице.
- •Решение:
МИНИСТЕРСТВО ЗДРАВООХРАНЕНИЯ УКРАИНЫ
ГУ «КРЫМСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ
ИМ. С.И. ГЕОРГИЕВСКОГО»
кафедра медицинской физики и информатики
отделение медицинской информатики
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
Выполнила:
студентка 2-го курса
201 группы
1-го медицинского
факультета
Радкевич Я. А.
Преподаватель:
Ислямов Руслан Исметович
Симферополь, 2013 г.
Теоретическая часть
Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием). Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.
Практическое значение установления корреляционной связи – выявление возможной причинно-следственной связи между факторными и результативными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состоянием здоровья, при определении зависимости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и др.), а также – выявление зависимости параллельных изменений нескольких признаков от какой-то третьей величины (например, под воздействием высокой температуры в цехе происходят изменения кровяного давления, вязкости крови, частоты пульса и др).
Стандартный способ выявления взаимосвязи нескольких переменных, измеряемых в порядковой или интервальной шкалах, – подсчет коэффициента корреляции.
Степень выраженности линейной связи между двумя случайными величинами, имеющими нормальное распределение, обычно оценивают коэффициентом корреляции Пирсона, который расчитывается по выборкам.
В медико-биологических исследованиях часто встречаются случаи, когда характеристики взаимосвязанных структур представляются порядковыми переменными. При этом степень тесноты связи между такими рядами выражается ранговыми коэффициентами корреляции: показатель ранговой корреляции Спирмена, коэффициент ранговой корреляции Кендалла. Кроме этого, такой непараметрический подход применяется в случае, когда закон распределения изучаемых выборок отличается от нормального. Коэффициент ранговой корреляции Кендалла считается более строгой оценкой для оценки степени линейной связи в случае количественных данных, при определении степени связи между порядковыми признаками следует использовать коэффициент корреляции Спирмена.
Как и любая случайная величина коэффициент корреляции имеет ошибку определения. В этом случае необходимо обратить внимание на проверку статистической значимости отличия рассчитанного коэффициента корреляции от нуля. Коэффициент корреляции одним числом дает представление о ее направленности. По направлению связь может быть прямой или обратной. По силе связи коэффициенты корреляции колеблются от 1 (полная связь) до 0 (отсутствие связи). Коэффициент корреляции может иметь значение от –1 до +1, т.е. иметь отрицательное либо положительное значение. В этих случаях говорят об обратной или прямой корреляционной взаимосвязи. Величина коэффициента характеризует силу корреляционной взаимосвязи.
Чем ближе модуль коэффициента корреляции к единице, тем сильнее или глубже корреляционная взаимосвязь между двумя вариационными рядами. Модульное значение выше 0,8 характеризуют сильную взаимосвязь, в интервале 0,8-0,5 – выраженную взаимосвязь, 0,5-0,2 – слабую взаимосвязь, менее 0,2 (0,2 – 0) – отсутствие взаимосвязи.
Статистическая гипотеза – это некоторое утверждение относительно свойств данной генеральной совокупности объектов. Свойства совокупности объектов описываются признаками, которые подчиняются определенным законам распределения. Следовательно статистическая гипотеза содержит утверждение относительно значений параметров заданного распределения признака или о форме распределения этого признака.
Статистическая гипотеза дополняется альтернативной гипотезой. Принята следующая форма записи статистических гипотез:
1. Нулевая гипотеза Н0 – предположение, что разница между генеральными параметрами сравниваемых групп равна нулю и различия, наблюдаемые между выборочными характеристиками, носят исключительно случайный характер.
2. Альтернативная гипотеза Н1 – противоположная нулевой – гипотеза о существовании различий между генеральными параметрами сравниваемых групп.
Статистическую проверку гипотез проводят на основе выборки. Проверку гипотезы осуществляют с помощью критерия проверки. Критерий проверки является случайной величиной с известным законом распределения. Значения критерия, не противоречащие нулевой гипотезе принадлежат к области допустимых значений, остальные значения принадлежат критической области. В случае, когда значения критерия принадлежат критической области – нулевая гипотеза отклоняется и принимается альтернативная гипотеза..
Метод проверки статистических гипотез заключается в сравнении полученного значения р с принятым уровнем значимости:
если рассчитанное в статистическом тесте значение р оказывается больше принятого уровня значимости, то нулевую гипотезу Н0 не отклоняют и различия групп называются статистически незначимыми.
если значение р оказывается меньше уровня значимости, то нулевую гипотезу Н0 отклоняют, при этом следует принять альтернативную гипотезу Н1. В данном случае различия групп называют статистически значимыми (при р<0,05) или статистически высокозначимыми (при р<0,01).
t-критерий Стьюдента – общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках. Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.