
- •1. Типи комп’ютерних та медичних даних
- •Практична частина
- •Практична робота №2 Представлення результатів аналізу даних в наукових публікаціях
- •Теоретична частина
- •Загальні вимоги до представлення статистичних даних в наукових публікаціях
- •Опис програмного забезпечення, необхідного для виконання практичного завдання
- •Нумерація сторінок
- •Вставка колонтитулів
- •Вставка зносок
- •Форматування абзаців
- •Встановлення позицій табуляції
- •Створення багатошпальтового документа
- •Вставка графічних об'єктів
- •Редактор формул
- •Створення списків
- •Практична частина
- •Практична робота №3 Робота з найпростішими базами даних
- •Теоретична частина
- •Практична частина
- •Оцінка діагностичної ефективності медичних тестів
- •Практичні завдання
- •2. Основні статистичні терміни, що використовуються при медико-біологічних дослідженнях
- •Практичні завдання
- •Практична робота №6 Використання статистичних методів для обробки результатів медико-біологічних досліджень
- •Теоретична частина
- •1. Закони розподілу дискретних та неперервних величин.
- •2. Сучасна технологія статистичного аналізу медико-біологічних даних.
- •3. Визначення параметрів розподілу випадкових величин та перевірка гіпотез
- •3.Використання табличного процесора Ехсеl для елементарної статистичної обробки даних
- •Практичні завдання
- •Практична робота №7 Виявлення взаємозв'язків між вибірками. Кореляційний та регресійний аналіз
- •Теоретична частина
- •Практична робота №8 Моделювання медичних та біологічних об’єктів і явищ
- •Короткі теоретичні відомості
- •1. Поняття моделювання. Застосування та вимоги до моделей.
- •2. Класифікація моделей
- •3. Види моделювання
- •4. Медичні та біологічні моделі
- •4.1. Кінетичні моделі популяції клітин
- •4.2. Модель відкритої системи
- •4.3. Модель Вольтерра жертва-хижак
- •4.4. Статичні моделі серцево-судинної системи
- •Практична частина
- •Система адресації в Internet
- •Практичне завдання
3.Використання табличного процесора Ехсеl для елементарної статистичної обробки даних
У пакеті Ехсеl крім Мастера функций є набір інструментів для аналізу даних, що називається Пакет анализа, який може бути використаний для вирішення завдань обробки медичних даних. Для цього необхідно:
-встановити розділ Анализ даних в пакеті Ехсеl:
-в меню Сервис вибрати команду Надстройки;
-в списку, що з'явився, встановити прапорець Пакет анализа.
Введення даних. Для використання пакету аналізу досліджувані дані слід представити у вигляді таблиці, де стовпцями є відповідні показники. При створенні таблиці Ехсе1 інформація вводиться в окремі комірки. Сукупність комірок , що містять аналізовані дані, називається вхідним діапазоном.
Загальна послідовність обробки даних. Для використання статистичного пакету аналізу даних необхідно вибрати пункт меню Сервис→ Анализ данных→ Инструменты анализа. Ввести вхідний і вихідний діапазони і вибрати необхідні параметри. Якщо команда Анализ данных відсутня в меню Сервис, то необхідно встановити в Ехсеl пакет аналізу даних.
Практичні завдання
Завдання №1. Знаходження достовірності різниць між змінними
Наступним етапом після визначення основних статистичних характеристик є виявлення достовірності різниць між групами або змінними (перевірка статистичної гіпотези про рівність генеральних середніх).
Розглянемо дві групи хворих тахікардією, одна із яких (контрольна) отримувала традиційне лікування, інша (досліджувана) отримувала лікування по новій методиці. Нижче наведені частоти серцевих скорочень (ЧСС) для кожної групи (ударів в хвилину).
-
Контрольна
Досліджувана
162
135
156
126
144
115
137
140
125
121
145
112
151
130
155
116
142
122
Потрібно провести статистичний аналіз цих даних.
1.1. Знайти середнє значення.
1.2. Знайти стандартне відхилення
1.3.
За формулою (1) розрахувати значення
-критерію
Ст’юдента.
Обчислене значення
порівняти із табличним (див. додаток
№2) з врахуванням числа ступеней
вільності. Зробити відповідний висновок
про достовірність різниці між ЧСС
контрольної та досліджуваної групи.
1.4. Порівняти дані ЧСС досліджуваної групи з контрольною за допомогою -критерію Ст’юдента з використанням табличного процесора Ехсеl і зробити висновок про ефективність нового препарату.
Демонстраційний приклад
Для оцінки достовірності відмінностей по критерію Ст’юдента приймається нульова гіпотеза, що середні вибірок рівні між собою. Потім обчислюється значення ймовірності того, що події (ЧСС хворих в обох вибірках), що вивчаються, відбулися випадковим чином. Для цього табличний курсор встановлюється у вільну комірку. На панелі інструментів необхідно натиснути кнопку Вставка функції (fх). У діалоговому вікні, що з'явилося, за допомогою майстра функцій вибрати категорію Статистичні і функцію ТТЕСТ, після чого натиснути кнопку ОК. Ввести діапазон даних контрольної групи в поле Массив 1. У полі Масив 2 ввести діапазон даних досліджуваної групи. У полі Хвосты завжди вводиться з клавіатури цифра «2» а в полі Тип з клавіатури введемо цифру «3». Нажати кнопку ОК. В комірці появится значение шуканої ймовірності. Зробити висновок про достовірність різниці між двома вибірками.
При використанні -критерію можна виділити два випадки. У першому випадку його застосовують для перевірки гіпотези про рівність генеральних середніх двох незалежних, незв'язаних вибірок (так званий двохвибірковий -критерій). В цьому випадку є контрольна група і дослідна група, що складаються із різних пацієнтів, кількість яких в групах може бути різна. При заповненні діалогового вікна ТТЕСТ при цьому указується Тип 3.
У другому випадку, коли одна і та ж група об'єктів породжує числовий матеріал для перевірки гіпотез про середні, використовується так званий парний -критерій. Вибірки при цьому називають залежними, зв'язаними (при заповненні діалогового вікна ТТЕСТ указується Тип 1). Наприклад, вимірюється вміст лейкоцитів у здорових тварин, а потім у тих же самих тварин після опромінювання певною дозою випромінювання.
1.5. Виміряна температура двох груп хворих:
-
Контрольна
Досліджувана
37,3
37,1
37.3
37,2
37.4
37,3
37.5
37,4
37.6
37,5
Визначити достовірність різниці між групами у випадку:
1) групи складаються з різних хворих;
2) групи складаються з одних і тих же хворих, але перша - до прийому жарознижуючого, а друга - після.
Завдання №2. Порівняння частоти прояву ефекту з використанням z‑критерію.
2.1. Користуючись прикладом, приведеним в статті до практичної роботи №2, порівняти частоту виникнення небажаних побічних реакцій при лікуванні різними препаратами за результатами досліджень, запропонованих викладачем.
Демонстраційний приклад. Порівняємо частоту виникнення побічних ефектів в контрольній та експериментальній групі за результатами досліджень, приведених в таблиці 6.2 (див. статтю до практичної роботи №2). Для цього, в робочому листі Ехсеl сформуємо таблицю спряженості і введемо в неї початкові дані. Загальний вид робочого листа приведений на рис. 6.3.
Рис.6.3 Загальний вид робочого листа
2.2. Розрахуємо значення частоти виникнення побічних ефектів в двох групах. Результати розмістити в комірки Н5; Н6; Н7.
2.3. Розрахуємо значення z-критерію. Для цього в комірку G8 введемо відповідну формулу (див. текст статі практичної роботи №2).
2.4. Відповідним чином розрахувати вибіркову різницю, стандартну помилку різниці, ліву та праву границю довірчого інтервалу.
2.5. Задамо рівень значущості =0.05 (комірка G9).
2.6.
Знайдемо критичне значення
стандартного нормального розподілу
для рівня
.
Для цього в комірку G10
вставимо функцію НОРМСТОБР(1-G9/2).
2.7. Розрахуємо досягнутий рівень значущості. Для цього в комірку G15 вставимо функцію (1-НОРМСТРАСП(G8))*2.
2.8. Зробити висновок про ймовірність виникнення негативних побічних ефектів при лікуванні пацієнтів двох різних груп.
Практичне завдання №2
2.9. За результатами досліджень, запропонованих викладачем, порівняти частоту виникнення небажаних побічних реакцій при лікуванні різними препаратами.
Завдання №3 Порівняння відносних величини прояву досліджуваного ефекту в двох групах з використання критерію
Демонстраційний приклад.
Бувають
ситуації коли необхідно порівняти дві
відносні, чи виражені в процентах
величини. Наприклад у випадку перевірки
ефективності дії вакцини або двох
методів лікування. Як приклад застосування
критерію
-квадрат
розглянемо порівняння двох методів
лікування (експериментального і
контрольного) за допомогою зіставлення
частоти виникнення небажаних побічних
реакцій в експериментальній і контрольній
групах.
Нульовою гіпотезою (Н0), яку ми збираємося перевіряти, приймемо наступну: частота виникнення побічних реакцій не залежить від способу лікування і однакова для обох (контрольної і експериментальної) груп. З погляду математичної статистики це завдання перевірки незалежності двох ознак. Для використання згаданого критерію дані, отримані в результаті проведених досліджень, необхідно представити у вигляді чотирьохклітинної таблиці спряженості ознак. Для застосування даного критерію необхідно, щоб в кожній клітині даної таблиці очікувана частота була не нижча 0,05. Якщо дана умова не виконується, то необхідно застосовувати точний критерій Фішера для отримання досягнутого рівня значущості р, не використовуючи апроксимацію на основі розподілу -квадрат. Спостережуваною частотою в завданнях аналізу наявності зв'язку з використанням таблиць спряженості ознак називається частота, отримана на основі наявної вибірки. При аналізі таких таблиць, спостережувану частоту зіставляють з очікуваною і на основі різних критеріїв (наприклад -квадрат) роблять висновок про незалежність (або залежність) номінальних ознак. Їх також використовують для обчислення різних законів зв'язку між номінальними ознаками. Очікуваною називають частоту, яку слід розрахувати для кожної з чотирьох кліток таблиці у разі правильності нульової гіпотези. Якщо долі пацієнтів, у яких є ознаки (наприклад, побічні реакції) що нас цікавлять, в даних групах рівні, то загальну пропорцію таких пацієнтів можна оцінити за допомогою виразу:
(5)
Іншими
словами, якщо ми об'єднаємо обидві групи,
то це буде частка пацієнтів, що мають
ознаку, що цікавить нас, в об'єднаній
групі. У разі справедливості нульової
гіпотези частка таких пацієнтів в кожній
групі повинна бути рівна частці в
узагальненій вибірці (
).
На основі цього можна розрахувати для
кожної клітки чотирьохклітинної таблиці
значення частот, які очікуватимуться,
якщо нульова гіпотеза справедлива.
Розглянемо це на основі даних, приведених
в табл.
6.3.
Таблиця 6.3. Частота виникнення побічних реакцій у пацієнтів і їх доля у відповідних групах
Група (метод лікуваня) або вибірка |
Наявність побічних реакцій |
Сума (розмір вибірки) |
Пропорція/доля побічних реакцій |
|
ТАК |
НІ |
|||
Група 1 (експериментальна) |
24 |
142 |
166 |
0,145 |
Група 2 (контрольна) |
16( |
35 |
51 |
0,314 |
Сума |
40 |
177 |
217 |
0,184 |
Якщо ми
об'єднаємо обидві вибірки (експериментальну
і контрольну групи), то загальне число
пацієнтів буде рівне 217,
а
кількість пацієнтів, у яких були виражені
побічні реакції в обох підгрупах
становить 40 (
).
Тоді
в об'єднаній вибірці частка пацієнтів,
у яких відмічені побічні явища, складатиме
Відповідно, частка пацієнтів в об'єднаній
вибірці, у яких побічні явища не виявлені,
буде рівна 81,57%. Як вже наголошувалося
раніше, за умови справедливості нульової
гіпотези обчислені пропорції повинні
дотримуватися (або бути досить близькими)
в кожній групі окремо. Обчислимо ці
значення частот:
.
Іноді
очікувані частоти називають теоретичними.
У наступній таблиці приведені
спостережувані і очікувані частоти.
-
Група (метод
лікуваня)
або вибірка
Наявність побічних реакцій
Сума (розмір вибірки)
ТАК
НІ
Група 1 (експериментальна)
24/30,06
142/135,4
166
Група 2 (контрольна)
16/9,4
35/41,6
51
Сума
40
177
217
Як видно,
значення спостережуваних частот
відрізняються від очікуваних. Проте
необхідно з'ясувати, чи є ця відмінність
статистично значущою і чи можемо ми
розповсюдити отримані результати на
всю вибірку. Для цього застосуємо
критерій
-квадрат.
Його критеріальний вираз, якщо
спостережувану частоту в клітці таблиці
спряженості
позначити через
,
а очікувану -
через
,
матиме наступний вигляд:
(6)
Сумування проводиться по всіх клітках таблиці спряженості. Проте, враховуючи, що неперервний розподіл -квадрат використано для представлення дискретного розподілу вибіркової частоти, то Іейтс запропонував ввести у формул поправку на неперервність. З урахуванням цієї поправки формула (2) прийме наступний вигляд:
(7)
Включення у формулу поправки на неперервність сприяє більшій відповідності між ймовірностями в порівнянні з випадком, коли вона не використовується, і її рекомендується застосовувати завжди.
На практиці досить часто користуються іншим виразом критерію -квадрат, в якому не передбачений попередній розрахунок очікуваної (теоретичною) частоти:
(8)
де позначення, приведені в даній формулі, відповідають таким в табл. 7. Вирази (7) і (8) еквівалентні - за допомогою алгебраїчних перетворень з одного можна отримати інший.
Розраховане значення -квадрат порівнюється з процентною точкою теоретичного розподілу -квадрат при числі ступеней вільності, рівному одиниці, і заданому рівні значущості. Якщо розраховане значення даного критерію більше теоретичного, то нульова гіпотеза відхиляється і приймається альтернативна. У разі коли таблиця спряженості складається більш ніж з двох рядків або двох стовпців (наприклад можуть порівнюватися не дві групи, а більше, і кожна ознака, що цікавить нас, може мати більше двох станів), то критеріальне значення розраховується по формулі (6) (поправка Іейтса не враховується).
Обробимо дані приведеного вище прикладу. Для цього на робочому листі Ехсеl сформуємо таблицю спряженості і введемо в неї початкові дані. Загальний вид робочого листа приведений на рис. 6.4.
3.1. Приймемо гіпотезу H0: пропорції частоти виникнення побічних явищ в двох порівнюваних групах однакові; H1: пропорції частоти виникнення побічних явищ в двох порівнюваних групах статистично значущо розрізняються.
3.2. Задамо рівень значущості =0.05 (комірка Н11), який означає, що ми допускаємо ймовірність ухвалення нульової гіпотези не більше ніж в 5% випадків. Іншими словами, ми задаємо максимально допустиму для нас ймовірність справедливості нульової гіпотези.
Рис.6.4 Загальний вид робочого листа
3.3. Розрахуємо очікувані частоти згідно виразу (1), внісши до комірок робочого листа відповідні формули (комірки С8;Е8;D5;D6; F5;F6;H5;H6;H7).
3.4. Розрахуємо критеріальне значення використовуючи вираз (7). Для цього в комірку Е9 введемо відповідну формулу.
3.5. Розрахуємо досягнутий рівень значущості, використовуючи вбудовану в Ехсеl функцію розрахунку ймовірності розподілу -квадрат, враховуючи, що для чотирьохклітинних таблиць значущості число ступеней вільності для вказаного розподілу рівне 1. Для цього в комірку Е13 вставимо функцію ХИ2РАСП(Е9;Е10). Порівняємо розраховане критерійне значення з критичним значенням розподілу -квадрат узятим з таблиці. У Ехсеl є вбудована функція ХИ2ОБР(), що дозволяє розраховувати процентні точки даного розподілу, що відповідають табличним. Для цього в комірку Е12 помістимо необхідну функцію ХИ2ОБР(Е11;Е10).
3.6.
Рішення щодо ухвалення або відхилення
нульової гіпотези може залежати від
досягнутого рівня значущості і критичного
значення розподілу
-квадрат.
У нашому випадку досягнутий рівень
значущості р=0,012
значно менше рівня значущості
=0,05,
тому ми повинні відхилити нульову
гіпотезу. Якби для ухвалення рішення
ми використовували значення процентної
точки розподілу
-квадрат,
то при
=0,05
і
воно буде рівне 3.84, що значно менше
експериментального (6,34). Це також дає
нам повне право на заданому рівні
значущості відхилити нульову гіпотезу.
3.7. На підставі отриманих результатів можна зробити наступний висновок: існує статистично значуща відмінність в пропорціях частоти виникнення побічних реакцій у хворих експериментальної і контрольної груп. У пацієнтів контрольної групи частота виникнення побічних реакцій вища (31,4%) ніж в експериментальній (14,5%).
Практичне завдання №3.
3.8.Порівняти відносні величини прояву побічного ефекту в двох досліджуваних групах з використання критерію за результатами досліджень, запропонованих викладачем.