- •1. Типи комп’ютерних та медичних даних
- •Практична частина
- •Практична робота №2 Представлення результатів аналізу даних в наукових публікаціях
- •Теоретична частина
- •Загальні вимоги до представлення статистичних даних в наукових публікаціях
- •Опис програмного забезпечення, необхідного для виконання практичного завдання
- •Нумерація сторінок
- •Вставка колонтитулів
- •Вставка зносок
- •Форматування абзаців
- •Встановлення позицій табуляції
- •Створення багатошпальтового документа
- •Вставка графічних об'єктів
- •Редактор формул
- •Створення списків
- •Практична частина
- •Практична робота №3 Робота з найпростішими базами даних
- •Теоретична частина
- •Практична частина
- •Оцінка діагностичної ефективності медичних тестів
- •Практичні завдання
- •2. Основні статистичні терміни, що використовуються при медико-біологічних дослідженнях
- •Практичні завдання
- •Практична робота №6 Використання статистичних методів для обробки результатів медико-біологічних досліджень
- •Теоретична частина
- •1. Закони розподілу дискретних та неперервних величин.
- •2. Сучасна технологія статистичного аналізу медико-біологічних даних.
- •3. Визначення параметрів розподілу випадкових величин та перевірка гіпотез
- •3.Використання табличного процесора Ехсеl для елементарної статистичної обробки даних
- •Практичні завдання
- •Практична робота №7 Виявлення взаємозв'язків між вибірками. Кореляційний та регресійний аналіз
- •Теоретична частина
- •Практична робота №8 Моделювання медичних та біологічних об’єктів і явищ
- •Короткі теоретичні відомості
- •1. Поняття моделювання. Застосування та вимоги до моделей.
- •2. Класифікація моделей
- •3. Види моделювання
- •4. Медичні та біологічні моделі
- •4.1. Кінетичні моделі популяції клітин
- •4.2. Модель відкритої системи
- •4.3. Модель Вольтерра жертва-хижак
- •4.4. Статичні моделі серцево-судинної системи
- •Практична частина
- •Система адресації в Internet
- •Практичне завдання
Практичне завдання
1.Використовуючи пошукові системи Інтернету, знайти інформацію на теми: «Наукові досягнення в стоматології (медицині)» або «Новини стоматології (медицини)». Результати представити в текстовому форматі (Microsoft Word, 10-20 ст. з рисунками; шрифт 14п, Times New Roman). В списку літератури вказати посилання на сайти, інформація з яких була використана.
2.Підготувати презентацію доповіді на 5 хв. по вибраній темі з використанням програми PowerPoint.
О.В.Чубенко1 П.Н.Бабич2 1Інститут фармакології і токсикології АМН України, Київ 2Національний технічний університет "Київський політехнічний інститут"
|
Використання сучасних статистичних методів в практиці клінічних досліджень. Повідомлення Перше. Порівняння двох пропорцій |
Ключові слова: доказова медицина, клінічні дослідження, математична статистика, статистична обробка якісних даних, порівняння двох пропорцій |
Резюме. Мета цієї публікації полягає в тому, щоб ознайомити широку аудиторію врачів і дослідників з сучасною статистичною термінологією і методам обробки медико-біологічних даних. В даній публікації розглядаються питання порівняння частоти прояву ефекту, що нас цікавить в двох групах (експериментальній і контрольній) |
Додаток 1
ВСТУП
Необхідність правильного розуміння і інтерпретації деяких понять математичної статистики, що використовуються при аналізі даних клінічних досліджень і їх інтерпретації, важливі для ухвалення правильного рішення. У цьому і полягає основне завдання статистичних методів. Свого часу відомий американський математик Л. Вальд писав, що "статистика - це сукупність, методів, які дають нам можливість ухвалювати оптимальні рішення в умовах невизначеності". Статистичні методи дозволяють звузити інтервал невизначеності при ухваленні рішенні. Некоректне застосування статистичних методів, так само, як і прийом ліків, для лікування захворювання, при якому вони не показані, приводить до помилкових результатів. До неправильних висновків приводить також нерозуміння суті отриманих результатів статистичної обробки даних і, відповідно, їх неправильна інтерпретація.
Так, при інтерпретації результатів статистичної обробки даних завжди необхідно пам'ятати про їх імовірнісний сенс. Він полягає в тому, що не завжди отримані результати є точними, а лише статистичними оцінками дійсних значень. Крім того, при перевірці статистичних гіпотез необхідно пам'ятати про статистичну значимість, оскільки дослідження зазвичай проводяться лише на якійсь вибірці з генеральної сукупності (популяції).
За останніх 10-12 років в теоретичній і практической медицині відбулися кардинальні зміни в області контролю за лікарськими засобами. Зокрема, з'явився новий науковий напрям - доказова медицина. Доказова медицина розглядається не як самостійний розділ науки, оскільки в медицині вже давно і широко застосовують статистичні методи аналізу і оцінки результатів досліджень, а як новий підхід, напрямок або технологія збору, аналізу, узагальнення та інтерпретації наукової інформації. Основними поняттями доказової медицини є експеримент; стандартизація та метрологічна повірка приладів; використання сучасних науково обґрунтованих технологій; дотримання вимог рандомізації, статистичної обробки, критеріїв включення та виключення при проведенні наукових досліджень; правильне та об’єктивне використання наукової інформації; застосування загальноприйнятих стандартів діагностики та лікування; подвійні сліпі рандомізовані багатоцентрові дослідження; метааналіз; Кокранівське співробітництво.
Разом з тим, необхідно пам'ятати про те, що доказова медицина не є догмою. До певної міри доказова медицина сприяє деперсоналізації і лікаря, і пацієнта, але у жодному випадку не відміняє особистої відповідальності лікаря за ухвалені рішення. Схеми лікування, розроблені за допомогою принципів доказової медицини, можуть служити основою для ухвалення рішень, але не знімають з лікаря відповідальності і не повинні звужувати можливості лікування. Слід враховувати, що навіть при проведенні рандомізованих випробувань на найвищому рівні їх результати мають безперечне відношення тільки до тих груп хворих, які брали участь в даному дослідженні. Екстраполяція результатів досліджень на конкретного хворого може мати свої істотні обмеження.
Прогрес доказової медицини тісно пов'язаний з розвитком сучасних інформаційних технологій і використання методів математичної статистики.
СТАТИСТИЧНА ОБРОБКА ЯКІСНИХ ДАНИХ. ПОРІВНЯННЯ ДВОХ ПРОПОРЦІЙ (ДОЛЕЙ)
У даній публікації піднімаються питання статистичної обробки якісних (нечислових) даних1, зокрема порівняння частоти прояву ефекту, що нас цікавить, в двох групах (експериментальній і контрольній). При проведенні аналізу результатів клінічного дослідження часто виникає необхідність порівняти пропорції (долі) наявності або відсутності якої-небудь ознаки в двох групах, взятих з однієї генеральної сукупності. Наявність або відсутність ознаки, що нас цікавить, є якісним показником. Причому на різні групи впливають різними чинниками або рівень їх впливу є різний (лікування різними препаратами або одним препаратом в різних дозах). Наприклад, у разі порівняння двох методів лікування (експериментального і контрольного) можна зіставити частоту виникнення небажаних побічних реакцій в експериментальній і контрольній групах. У табл. 1 приведений приклад схеми складання таблиці, яка зручна для представлення таких даних. У комірках даної таблиці приведені позначення, які будуть використані надалі у формулах.
Для того, щоб визначити, чи є відмінності частоти виникнення побічних реакцій статистично значущими, як нульова гіпотеза (Н0) висувається припущення, що пропорції Р1, і Р2 (дійсні пропорції в генеральній сукупності) не розрізняються.
Таблиця 1.
Загальний вид представлення частот і їх пропорцій у вибіркових сукупностях
Група (метод лікуваня) або вибірка |
Наявність ознаки, що цікавить |
Розмір групи (вибірки) |
Пропорція/доля ознаки, що цікавить |
|
ТАК |
НІ |
|||
Група 1 (експериментальна) |
|
|
|
|
Група 2 (контрольна) |
|
|
|
|
Сума |
|
|
|
|
Примітка:В таблиці 1 крапка замість індексу означає сумування по цьому індексу
Для
визначення достовірності відмінності
пропорцій Р1
і Р2
(із заданою довірчою імовірністю
%
можна застосувати z-критерій,
критерійне значення якого розраховується
по формулі:
(1)
де
,
- вибіркова оцінка Р1,.
- вибіркова оцінка Р2.
Розраховане критеріальне значення z порівнюється з процентною точкою стандартного нормального розподілу2 для рівня значущості3 , оскільки даний критерій є двостороннім. Якщо обчислене значення перевищує критичне для заданого рівня значущості, то нульова гіпотеза відхиляється на користь альтернативної, згідно якої пропорції Р1, і Р2 розрізняються з довірчою імовірністю %.
Крім того, слід зазначити, що включений у формулу (1) вираз є поправкою Іейтса на неперервність. Це пов'язано з тим, що неперервний розподіл (у нашому випадку нормальний) використовується для представлення дискретного розподілу частот. Поправку Іейтса рекомендується застосовувати завжди, оскільки її включення у формулу (1) приводить до точнішої оцінки порівняння імовірності, ніж у разі, коли поправка не використовується.
Крім
того, можна обчислити досягнутий
рівень значущості р4
(іноді його в літературі називають
мінімальним або найменшим) і порівняти
його із заданим рівнем значущості
.
Традиційно приймають, що якщо
,
то це достатньо, щоб відхилити нульову
гіпотезу на заданому рівні значущості
і прийняти альтернативну. Дана ситуація
проілюстрована на рис. 1.
Я
кщо
в результаті використання z-критерію
було всановлено, що пропорції
Р1
і Р2
розрізніяються, то для їх різниці
корисно побудувати довірчий інтервал.
Довірчий інтервал – це інтервал,
відносно, якого із заданою імовірністю
можна стверджувати, що він містить
невідоме значення параметра:
:
, де
- довірча імовірність ;
- рівень значущості. Таким чином, за
допомогою довірчого інтервалу можна
оцінити в яких межах із заданою довірчою
імовірністю може знаходитися дійсне
значення параметра в генеральній
сукупності. Наприклад, значення
параметрів, отримані в результаті
проведення клінічних випробувань, на
вибірці відрізняються від дійсних
значень в генеральній сукупності
унаслідок впливу випадковості. Так,
95% довірчий інтервал означає, що дійсне
значення параметра, обчисленого на
основі вибіркових даних, з імовірністю
95% знаходиться в межах цього інтервалу.
На основі довірчого інтервалу можна
судити про клінічну значущість ефекту.
За допомогою довірчих інтервалів можна
перевіряти статистичні гіпотези.
Наприклад, для оцінки статистичної
значущості відмінностей існує наступне
правило: якщо
-процентний довірчий інтервал різниці
середніх не містить нуля, то відмінності
статистично значимі
і,
навпаки, якщо цей інтервал містить
нуль, то відмінності статистично
незначущі
.
Слід враховувати, що ширина довірчого
інтервалу також характеризує ступінь
нашого незнання: дуже широкий довірчий
інтервал може служити лише вказівкою
на те, що слід зібрати більше даних.
Довірчі інтервали дають більше інформації
про параметр, чим проста точкова оцінка,
оскільки відмежовують відразу цілу
сукупність допустимих значень. Для
побудові довірчого інтервалу спочатку
необхідно обчислити оцінку стандартної
похибки різниці
(
)
використовуючи наступну формулу:
(2),
де
і
.
У випадку коли
і
достатньо великі то
%
довірчий
інтервал для
різниці Р2-Р1
визначається наступним виразом:
(3)
де
-
процентна точка стандартного нормального
розподілу.
Побудований на основі виразу (3) інтервал включатиме дійсну різницю пропорцій приблизно в % випадків. Якщо довірчий інтервал включає значення 0, то це свідчить про те, що пропорції Р1 і Р2 розрізняються статистично незначущо (при заданому рівні значущості).
Приклад
Порівняємо частоту виникнення небажаних побічних реакцій в експериментальній і контрольній групах, початкові дані для яких приведені в табл. 2. Поряд з даними в дужках вказані позначення, які відповідають використовуваним у вищенаведених формулах. Для розрахунків скористаємося електронним таблицями MS Excel. Вид початкових даних і отриманих результатів на робочому листі MS Excel приведений в таблиці 3.
Відповідно до отриманих результатів можна зробити наступні висновки:
Таблиця 2. Частота виникнення побічних реакцій і їх доля в відповідних групах
Група (метод лікуваня) або вибірка |
Побічні реакції |
Розмір групи (вибірки) |
Пропорція/доля ознаки, що цікавить |
|
Виникли ТАК |
Не виникли НІ |
|||
Група 1 (експеримента-льна) |
24( ) |
142( ) |
166 |
0.145 |
Група 2 (контрольна) |
16( ) |
35( ) |
51 |
0.314 |
Сума |
40 ( )
|
177
|
217 |
0.184 |
1.Оскільки розраховане значення z-критерію (2.5182) більше критичною значення стандартного нормального розподілу при рівні значущості 0,05 (1,96) (за умови, що критерій двосторонній), то нульова гіпотеза відхиляється і приймається альтернативна, яка припускає, що з довірчою вірогідністю 95% пропорції
Таблиця №3.
Вихідні дані і результати обчислень за допомогою табличного процесора MS Exel
Група (метод лікування) |
Частота виникнення побічних реакцій |
Сума (розмір вибірки) |
Пропорція |
|||
Виникли (Так) |
Не виникли (НІ) |
доля |
||||
|
|
|
|
|
||
Группа 1 (експериментальна) |
24 |
142 |
166 |
0,145 |
||
Группа 2 (контрольна) |
16 |
35 |
51 |
0,314 |
||
Сума |
40 |
177 |
217 |
0,164 |
||
Розраховане значення z-критерію |
2,5812 |
|
||||
Заданий рівень значущості альфа |
0.0500 |
|
||||
Критичне значення стандартного нормального розподілу при рівні значущості |
1,96 |
|
||||
Вибіркова різниця Р1-Р2 |
0,169 |
|
||||
Стандартна помилка (Р2-Р1) |
0,07 |
|
||||
Ліва границя довірчого інтервалу |
0,0182 |
|
||||
Права границя довірчого інтервалу |
0,3201 |
|
||||
Досягнутий рівень значущості |
0,012 |
|
||||
Р1 і Р2 розрізняються. Іншими словами, можна стверджувати, що імовірність розвитку небажаних побічних явищ/реакцій при лікуванні пацієнтів першим методом статистично значущо менша, ніж при лікуванні другим методом.
2.
Величина значення р
рівна 0,012 (досягнутий рівень значущості
менше заданого рівня значущості
,
що також дозволяє
відкинути
нульову гіпотезу на користь альтернативної.
3. Стандартна помилка різниці оцінок пропорцій Р1 і Р2 рівна 0,07.
4.
Довірчий інтервал для різниці пропорцій
Р1
і Р2,
отриманий з використанням виразу (3),
має наступний вигляд:
.
Таким
чином, можна стверджувати, що дійсна
різниця пропорцій Р1
і
Р2
приблизно в 95% випадків потраплятиме
в даний довірчий інтервал. Оскільки
довірчий інтервал не включає значення
0 при заданому рівні імовірності, то це
також підтверджує зроблені в п.1 виводи.
Література
Большев Л.Н., Смирнов Н.В. (1983) Таблицы математической статистики. Наука, Москва, 416 с.
Лапач С.Н., Чубенко А.В., Бабич П.Н. (2002) Основные принципы применения статистических методов в клинических испытаниях. МОРИОН, Киев, 160 с.
Лапач С.Н.,Чубенко А.В., Бабич П.Н.(2002) Статистика в науке и бизнесе. МОРИОН, Киев, 640с.
Пегрн А., Сэбин К. (2003) Наглядная статистика в медицине (Пср.с англ.). ГЭОТАР-МЕЛ. Москва, 144с.
Фленс Дж. (1989) Статистические методы для изучения таблиц долей и пропорций (Пер. с англ.). Финансы и статистика, Москва, 319 с.
Чубенко А.В., Бабич П.II., Лапач С.Н., Ефимцева Т.К., Мальцев В. И. и др. (2003) Принципы применения статистических методов при проведении клинических испытаний лекарственных средств. Методические рекомендации. Издательский дом «Авиценна», Киев, 60 с.
APPLICATION OF MODERN STATISTICAL METHODS IN CLINICAL TRIALS. PART 1. COMPARISON OF TWO PROPORTIONS
A. V. Chubenko, P.N. Babich, S.N. Laрасh, Т.К. Efimtseva
Summary. А series oj articles devoted to correct application of modern mathematical methods of statistical data analysis of clinical trials are begins with given publication. The purpose of these publications is to acquaint a broad audience of doctors and researches with a modern statistical nomenclature and methods of data analysis in the correspondence with requests of Good Statistical Practice. As a Microsoft Excel application installed practically on each computer of the domestic user, the material will be presented with orientation on this software product. Given publication consider the questions on the comparison of frequencies of the study effect in two groups (treatment and control).
Key words: evidence-based medicine, clinical trials, Good Statistical Practice, mathematical statistics,statistical analysis of qualitative data, comparison of two proportions.
1 Якісні дані - дані, що містять якісну характеристику певної ознаки (наприклад, тиск: високий, низький, нормальний).
2Значення процентної точки береться із статистичних таблиць
3 Рівнем значущості називають максимально прийнятну імовірність відкинути нульову гіпотезу якщо вона вірна (його називають також «альфа-рівень» і позначають грецькою буквою ). Вибір величини рівня значущості залежить від зіставлення втрат у разі помилкових висновків в ту або іншу сторону: чим вагоміші втрати від помилкового відхилення нульової гіпотези, тим меншою вибирається величина значення . Зазвичай, на практиці, значення а приймається рівним 0,I; 0,05; 0,025; 0,01; 0,005; 0,001. Найчастіше використовується а=0,05, яке означає, що при користуванні певним статистичним критерієм, в середньому в п'яти випадках із ста статистична гіпотеза, що перевіряється, буде відхилена помилково.
4 Досягнутий рівень значущості ( р-значення, мінімальний рівень значущості) - це імовірність того, що значення критерію опиниться не менше критичного значення за умови справедливості нульової гіпотези про відсутність відмінностей між группами. Іншими словами, р є імовірністю помилково відхилити нульову гіпотезу про відсутність відмінностей. Іноді говорять, що р це імовірність справедливості нульової гіпотези.
