
- •«Ведення медичної статистики засобами ет Excel»
- •2. Статистична сукупність (генеральна, вибіркова), її основні властивості та критерії.
- •Види відносних величин:
- •Основні види середніх величин
- •1) Середня арифметична величина (позначається латинською літерою „м” від слова – Media)
- •7. Оцінка достовірності результатів статистичного дослідження.Основи доказової медицини.
- •Доказова медицина – це інформаційна технологія вибору оптимального варіанту медичної діяльності.
- •8. Кореляційний аналіз. Стандартизація показників.
- •Стандартизація
- •1) Прямий. 2) Непрямий. 3) Зворотній.
- •Залежність точності результатів дослідження від числа
- •Розподіл ознаки в статистичній сукупності
- •Організація статистичного дослідження і його етапи
- •Приклад питань, відповідей і шифру
- •Розподіл хворих гіпертонічною хворобою по стадіях захворювання, віку і статі (макет)
- •Intercept Повертає координату перетину осі з лінією лінійної регресії.
- •3.4. Орієнтовна карта для самостійної роботи з літературою по темі.
Розподіл хворих гіпертонічною хворобою по стадіях захворювання, віку і статі (макет)
Стадії гіперто-нічної хвороби |
Вік в роках |
Всього |
||||||||
до 30 |
30-39 |
40-49 |
50 і старше |
|||||||
чоловіки |
жін ки |
чоловіки |
жін ки |
чоловіки |
жін ки |
чоловіки |
жін ки |
чоловіки |
жін ки |
|
І ІІ ІІІ |
|
|
|
|
|
|
|
|
|
|
Разом... |
|
|
|
|
|
|
|
|
|
|
Приведені приклади макетів таблиць різного типу показують різну їх інформативність відносно можливості виявлення закономірностей. У макетах таблиць ще до розробки зібраного матеріалу вже представлені основні напрями дослідження і аналізу (програма розробки даних).
Таким чином, програма наукового дослідження складається з програми збору матеріалу, програми розробки і програми аналізу, які складають основу (базис) всієї роботи.
План дослідження передбачає організаційні елементи роботи.
У плані перш за все слід вказати об'єкт дослідження, тобто сукупність явищ, предметів про які повинні бути зібрані статистичні відомості. Об'єктом дослідження соціальної медицини може бути все населення області, міста, району або окремі його групи, хворі особи, кадри, установи охорони здоров'я і ін. Об'єкт дослідження (сукупність) повинен бути чітко визначений в просторі (територія), в часі (період), в об'ємі (число) спостережень (n).
У плані обов'язково слід вказати, яким чином формуватиметься об'єкт дослідження (статистична сукупність). По повноті обхвату розрізняють суцільні і вибіркові спостереження; за часом спостереження - одночасні і поточні, за способом отримання інформації можуть бути безпосередні і анамнестичні (опитування, складання анкет), нарешті, необхідні відомості можуть бути отримані при викопіюванні даних. Організація суцільного спостереження повинна передбачити реєстрацію всіх одиничних випадків, що складають генеральну сукупність. Суцільним методом збирають відомості про число тих, що народилися, померлих, тих, що звернулися в поліклініку, інфекційні захворювання в цілому по країні (або по іншій території), а також дані про чисельність лікарень, лікарів, середнього персоналу і ін.
Організація вибіркового спостереження. Вище було відмічено, що при вибірковому спостереженні відбирають частину (вибіркову сукупність) з генеральної сукупності.
Основні компоненти вибіркового методу:
– розрахунок об'єму вибіркової сукупності (n);
– способи спеціального відбору необхідної частини одиниць з генеральної сукупності (випадковий, механічний, типологічний, серійний, парно-спряжений, направлений, когортний);
– оцінка репрезентативності вибіркових параметрів.
До вибіркового методу звертаються в тих випадках, коли необхідно провести поглиблене дослідження, дотримуючись економії сил, засобів, часу. Цей метод зазвичай застосовують, здійснюючи пробні, пошукові роботи, а також при вибірковій перевірці результатів дослідження, отриманих суцільним методом. Вибірковий метод при правильному його застосуванні дає достатньо вірні результати, придатні для їх використання в практичних і наукових цілях.
Таблиця 7
Способи розрахунку числа спостережень (n), необхідного для отримання достовірних середніх і відносних величин (планування експерименту)
Середня величина (М) |
Відносна величина (Р) |
, де n - необхідне число спостережень; t - критерій достовірності (при р = 95,0%, t = 2); σ - середнє квадратичне відхилення (береться з літературних даних, якщо подібні дослідження проводилися, або на підставі даних, отриманих при проведенні пробного дослідження); ∆ - довірчий інтервал (гранична помилка - tm) |
, де n - необхідне число спостережень; t - критерій достовірності (при р = 95,0%, t = 2); Р - показник поширеності явища (з літератури); якщо Р у відсотках, то q = 100 - Р і т.д. У тих випадках, коли немає можливості визначити величину Р, слід прийняти Р = q = 50%. Це дає максимально можливий добуток Р × q (50,0 × 50,0 = 2500); ∆ - довірчий інтервал (гранична помилка - tm %) |
Приклад. Для визначення середнього числа дихань в хвилину у жінок необхідно розрахувати достатнє число спостережень - n = ? |
Приклад. Визначаючи частоту рецидивів інфаркту міокарду серед осіб, що його перенесли, необхідно наперед розрахувати достатню чисельність цих хворих, які повинні бути під спостереженням 3 року, - n = ? |
При розрахунку n використовуються початкові дані М, σ, ∆, Р, q, які отримані з літератури або з пробних досліджень. |
|
На підставі пробних вимірювань числа дихань в хвилину у жінок отримані наступні дані: М =31', σ = ± 3. Потім дослідник намічає орієнтовну граничну помилку середньої ∆. У даному прикладі ∆ = ± 1'. За умови, якщо вірогідність безпомилкового прогнозу р = 95%, критерій t = 2. Початкові дані підставляємо у формулу:
|
Якщо в літературі початкових даних немає і закономірності даного явища не вивчені, пробне дослідження провести важко, то допускають, що частота хворих з рецидивами (Р) і без рецидивів (q) буде однаковою (Р = q), отже, Р = 50%, q = 100- 50 = 50%. Потім орієнтувно намічають ∆ - граничну помилку показника. Припустимо, ∆ = 10%. При вірогідності безпомилкового прогнозу р = 95%, критерій t = 2. Початкові дані підставляємо у формулу:
|
Висновок: для визначення середнього числа дихань у жінок досить провести вимірювання у 36 жінок. |
Висновок: для визначення частоти рецидивів інфаркту міокарду досить взяти під спостереження 100 хворих, що перенесли інфаркт міокарда, і простежити за віддаленими наслідками їх лікування протягом трьох років. |
Визначення необхідного числа спостережень (n) для вибіркової сукупності здійснюється по формулах, які отримані при перетворенні вище приведених формул, що використовуються при розрахунку помилок репрезентативності (m) середніх арифметичних і відносних величин (табл. 7).
У плані необхідно передбачити спосіб відбору одиниць для вибіркової сукупності: випадковий, механічний, типологічний, серійний.
Випадковий відбір- це такий відбір, коли всі одиниці генеральної сукупності мають рівну можливість потрапити у вибірку. Найбільш поширеним способом такого відбору є метод жеребкування, який полягає в тому, що на кожну одиницю спостереження заготовлюють невелику картку, в якій відзначають порядковий номер за списком. Всі картки повинні мати однаковий вигляд; їх перемішують в закритому ящику і потім у випадковому порядку відбирають для даного спостереження певну кількість карток.
Механічний відбір проводиться за якою-небудь ознакою (перша буква прізвища, номер історії хвороби або за іншою ознакою), від якої залежать результати дослідження.
При механічному відборі одиниці сукупності спочатку розташовуються в якому-небудь порядку (за абеткою або за номером історії хвороби). Після цього проводиться механічний відбір одиниць через який-небудь інтервал (кожну 4-у або кожну 10-у історію хвороби). Інтервал при механічному відборі заздалегідь розраховується. Для цього загальне число одиниць сукупності слід розділити на число одиниць, які треба відібрати. Наприклад, з 3000 історій хвороб потрібно відібрати 300. В цьому випадку величина інтервалу для відбору історій хвороби буде рівна 10 (), що означає необхідність відбору однієї через кожні 10 історій хвороб
Такий спосіб відбору є найбільш поширеним. Проте в деяких випадках застосування його стає обмеженим із-за трудомісткості. Наприклад, при вивченні захворюваності населення за декількома джерелами необхідна попередня суцільна їх алфавітизация, яка усуває дублювання і дозволяє отримати випадки захворювання на одну особу.
Типологічний відбір (типологічна, типова вибірка) дозволяє проводити вибір одиниць спостереження з типових груп всієї генеральної сукупності. Для цього спочатку усередині генеральної сукупності всі одиниці групуються за якою-небудь ознакою в типові групи (наприклад, за віком). З кожної такої групи проводять відбір (випадковим або механічним способом) необхідного числа одиниць так, щоб співвідношення розмірів вікових груп у вибірковій сукупності зберігалося таке ж, як і в генеральній сукупності.
Серійний відбір (серійна, кублова вибірка) передбачає вибір з генеральної сукупності не окремих одиниць, а вибір серій (кубел). Для цієї мети вся генеральна сукупність розбивається на відносно однорідні серії (кубла). Відбір серій здійснюється шляхом випадкової або механічної вибірки. При цьому відбір повинен проводитися так, щоб кожній серії генеральної сукупності була забезпечена однакова можливість бути відібраною у вибіркову сукупність. У кожній відібраній серії обстежуються всі складові її одиниці спостереження.
В деяких випадках вибіркова сукупність формується в порядку комбінування різних способів відбору.
Деякі особливості мають вибіркові сукупності, які використовуються для порівняння (як контрольні, так і дослідна групи) при визначенні ефективності тих або інших методів профілактики, діагностики, лікування або іншої дії. Існують різні способи формування дослідної і контрольної груп. Найважливішим принципом цього процесу є те, щоб дві групи були максимально схожі у всьому, окрім одного - чинника дії, що вивчається (наприклад, методу лікування).
Одним із способів, що задовольняють цим вимогам, є парно-зв'язаний відбір або метод урівноваження груп. Сенс цього методу полягає в наступному: кожній одиниці спостереження в досліджуваній групі підбирають копію, тобто пару в контрольній групі. Використання принципу парної зв'язаності у вибірці допоможе дослідникові на порівняно невеликому матеріалі провести поглиблені дослідження. Такий метод відбору дозволяє сформувати контрольна і дослідна групи, рівні за чисельністю і однорідні поодинці або декільком ознакам. Принцип відбору зв'язаних пар давно застосовується в експериментах на тваринах, частково - в клінічних дослідженнях.
Для того, щоб поглиблено досліджувати взаємозв'язки менш вивчених ознак при виключенні ознак, вплив яких відомий, формування вибіркової сукупності можна здійснювати по комплексу ознак, тобто застосовувати метод направленого відбору. Наприклад, залежність поширеності гіпертонічної хвороби від віково-статевого складу населення загальновідома, тому при поглибленому дослідженні необхідно передбачити аналіз сукупності осіб одного віку і статі, тобто вона повинна бути однорідною за цими загальновідомими ознаками. Допустимо, у жінок 20-24 років, що проживають в місті Н., вивчається вплив характеру харчування і умов праці на стан серцево-судинної системи. Дослідження, проведене на такій сукупності (жінки 20-24 років, проживаючі в місті Н.), завдяки однорідності її віково-статевого складу дозволяє усунути ряд методичних труднощів і отримати нову інформацію.
Направлений відбір визначає межі сукупності і забезпечує можливість поглибленого вивчення окремих груп населення.
Однорідність таких груп по ряду ознак дозволяє зменшити чисельність спостережень при організації вибіркових досліджень і отримати обгрунтовані висновки.
У ряді випадків направлений відбір одиниць спостереження здійснюється не поодинці, а одночасно по двох або декільком ознакам.
Одним з видів направленого відбору є когортний метод, який дозволяє зробити свого роду зріз в тому місці явища, що вивчається, в якому найяскравіше виявляються ті або інші закономірності.
Когортою прийнято називати статистичну сукупність, яка складається з однорідних елементів, об'єднаних настанням певної ознаки і прослідковуєтья за один і той же інтервал часу. Наприклад, для визначення чисельності дітей, народжених в сім'ї (або кількості вагітностей, пологів, абортів) за певний інтервал подружнього життя, досліджується когорта осіб, що мають однаковий термін одруження і однакову тривалість періоду подружнього життя. Узявши за одиницю спостереження молодого (до 30 років) подружжя, що проживає на території одного міста, які вперше одружилися протягом певного року і простежуючи дітородну функцію за п'ять років їх подружнього життя, отримаємо когорту, що складається з одиниць спостереження, однорідних відразу за п'ятьма ознаками.
Можна стверджувати, що багато досліджень не було б зроблено, якби ми не користувалися вибірковим методом. При правильній організації вибіркового дослідження отримані результати лише трохи відрізняються від результатів, які були б отримані при вивченні даного явища суцільним методом.
За часом спостереження формування сукупності здійснюється шляхом поточного або одномоментного спостереження. При поточному спостереженні статистичні дані збирають шляхом реєстрації кожного окремого випадку у міру його виникнення за певний проміжок часу. Таким шляхом вивчають народжуваність, смертність, захворюваність, навантаження лікарів і багато інших явищ.
В порядку поточної реєстрації вивчаються ті явища, які залежать від часу спостереження.
Друга форма збору даних носить назву одномоментного спостереження. При одноразовому спостереженні реєстрацію даних приурочують до якогось моменту часу - збір всіх спостережень здійснюється одночасно. Одноразове спостереження відображає стан явища, що вивчається, на певний момент. Прикладом одноразового спостереження є перепис населення, медичні огляди населення, санітарні обстеження об'єктів, узяття якихось проб і т.д.
В результаті переписів визначають чисельність і склад населення, кількість лікарень, медичного персоналу і т.д.
При медичних оглядах окремих контингентів збирають матеріал про стан здоров'я певних груп населення. Відомості про фізичний розвиток також отримують шляхом одномоментного спостереження: антропометричними вимірюваннями охоплюють одночасно певну групу населення.
Збір відомостей розрізняється також за способом спостережень: безпосередній, викопіювання, анкетний, опитування.
Спосіб безпосереднього спостереження передбачає реєстрацію відомостей при безпосередньому огляді хворої або здорової людини, а також при санітарно-гігієнічному обстеженні якого-небудь об'єкту. До безпосереднього спостереження відноситься запис даних проб, аналізів і ін.
Спосіб викопіювання - досить поширений метод в соціально-гігієнічних дослідженнях. Наприклад, нерідко проводиться викопіювання відомостей з історій хвороб. Джерелом статистичної інформації, крім історії хвороби, можуть бути і інші облікові медичні документи (журнали, картки, протоколи і ін.). що ведуться лікарями в поліклініці, стаціонарі, диспансері, лабораторії. При викопіюванні з цих документів беруться лише необхідні дані, які відповідають цілі дослідження і передбачені його програмою. Іноді викопіювання з документів проводять на так звану фішку. Звичайно це маленький листок щільного паперу, куди викопійовуються дві-три ознаки з якого-небудь медичного документа. Наприклад, головному лікареві терміново необхідні зведення про тривалість непрацездатності хворих, спостережуваних різними дільничними лікарями; в цьому випадку викопійовуются з амбулаторних карт на фішку номер лікарської ділянки, діагноз, дні непрацездатності.
У соціально-гігієнічних дослідженнях широко застосовується анамнестичний спосіб отримання інформації. Цей спосіб заснований на реєстрації відомостей, отриманих від хворого або його близьких родичів, спогадів про події, які раніше були в їх житті і могли служити причиною захворювання. Анамнестичний метод може здійснюватися двома способами: анкетним методом і методом опитування. Анкетний метод передбачає надання відомостей про себе кожним з обстежуваних осіб, які заповнюють спеціально складений бланк з питаннями - анкету. При цьому способі можливі помилки у зв'язку з тим, що обстежувані можуть не зрозуміти питання або свідомо спотворити відповідь.
Методом опитування зведення отримують шляхом бесіди лікаря з обстежуваною особою на певне коло запитань. Використання того або іншого способу залежить від мети і змісту роботи.
Анкетний метод доцільно застосовувати в тих випадках, коли необхідно отримати об'єктивні відомості про глибоко особисті, інтимні сторони життя (взаємини в сім'ї, на роботі, статеве питання, дані про аборти і т. д.). Анкета в цих випадках повинна бути, як правило, без вказання прізвища, тобто анонімна.
Для використання методу опитування необхідною умовою є довіра опитуваного.
Окрім визначення об'єкту вивчення і способів формування сукупності, в плані статистичного дослідження слід вказати прийоми розробки матеріалу (ручний або за допомогою ЕОМ), передбачити терміни роботи на окремих етапах і операціях, вказати виконавців роботи, відповідальних за кожен етап і елемент роботи, а також фінансові розрахунки (кошторис витрат) і, нарешті, скласти загальну інструкцію по методиці виконання роботи.
Другий етап статистичного дослідження - збір матеріалу. Цей етап дослідження полягає в зборі матеріалу, в здійсненні статистичного спостереження.
Під статистичним спостереженням розуміється сам процес реєстрації, заповнення розроблених карт (програма збору матеріалу). Збирання матеріалу (статистичне спостереження) проводять строго за наперед складеною програмою і планом дослідження. Про різні способи і методи цієї роботи було сказано вище.
В процесі статистичного спостереження необхідно не відхилятися від єдиних правил, щоб не спотворити результати дослідження.
Третій етап статистичного дослідження - розробка матеріалу. Після того, як матеріал зібраний, приступають до його розробки, яка складається з декількох послідовних операцій (стадій): 1) контроль; 2) шифровка (кодування); 3) розкладка карт по групах для підрахунку; 4) складання зведення; 5). обчислення статистичних показників; 6) графічне зображення показників.
Перед розробкою необхідно провести попередній контроль за правильністю і повнотою відомостей.
Шифровка (кодування) проводиться шляхом проставляння умовного знаку, що позначає кожну ознаку і його градацію. Шифровка проводиться з метою полегшення подальших операцій по розробці матеріалу. Шифрувати треба великими яскравими цифрами або буквами. Далеко не завжди шифровку можна передовіряти технічному працівникові. Наприклад, при шифровці захворювань необхідна достатньо висока лікарська компетенція, щоб правильно визначити, до якої групи відноситься те або інше захворювання, як його зашифрувати. Тому шифровку такої ознаки, як захворювання, повинен здійснювати тільки лікар.
Як було відмічено вище (у розділі програми дослідження), шифровка може проводитися одночасно з реєстрацією даних на стадії збору матеріалу. Якщо при організації дослідження це було передбачено, то значно скорочується час, що витрачається на розробку. Але завжди при цьому треба пам'ятати про якість отримуваних відомостей.
Після шифровки матеріалу на наступній стадії карти розкладають по групах (по шифрах); потім підраховують карти в кожній групі і результати підрахунку заносять в таблиці (складають зведення). На наступному етапі обчислюють статистичні показники. Для наочного зіставлення результатів дослідження доцільно дати графічне зображення отриманих даних. На цьому закінчується третій етап розробки.
Етап розробки статистичного матеріалу є одним з найбільш трудомістких процесів. Дійсно, якщо є масив в 1000 або декілька тисяч спостережень, а іноді і більше, то дослідникові доводиться при шифровці даних, групуванні і підрахунку результатів перебирати кожну карту по декілька десятків разів.
Четвертий етап - аналіз, висновки, пропозиції, впровадження в практику. Цей етап є кінцевим при будь-якому дослідженні. Він полягає в осмисленні отриманих результатів, показників, зіставленні даних, виявленні закономірностей, в узагальненні результатів.
Закінчуючи дослідження, необхідно представити стисло і чітко сформульовані висновки і конкретні пропозиції по впровадженню його результатів в практику охорони здоров'я.
При статистичному аналізі спостерігаються і виявляються два види помилок: методичного і логічного характеру.
До методичних помилок перш за все відноситься неправильний вибір об'єкту дослідження. Так, наприклад, в завдання дослідження входило показати особливості захворюваності населення по вікових групах, а вивчалися лише контингенти хворих і не враховувалися дані про чисельність населення в окремих вікових групах. В результаті автор міг оперувати тільки екстенсивними показниками (частка хворих різного віку серед всіх хворих), а не інтенсивними показниками, що характеризують частоту захворювань в конкретній віковій групі населення.
Методичною помилкою є також використання неправильних групувань. Ці помилки виникають із-за нерозуміння суті самого предмету дослідження, незнання механізмів тих або інших процесів.
Методичні погрішності при аналізі виражаються в неправильному використанні або інтерпретації статистичних показників.
Великі труднощі виникають при зайвій деталізації групувань, особливо при невеликому числі спостережень. Такі роздроблені дані стають малодостовірними і не дозволяють виявити основні закономірності явища, що вивчається.
Другий вид помилок аналізу - логічного характеру і полягає в допущенні формалізації оцінок цифрових даних без глибокого якісного аналізу суті явища.
Надмірна «математизація» - необґрунтоване використання різних статистичних критеріїв - також великий дефект і відбивається на логічній стороні аналізу, приводить до спотворення суті результатів дослідження.
До категорії Статистичні віднесено 71 функцію, що дає змогу виконувати різноманітні розрахунки.
AVEDEV Повертає середнє абсолютних значень відхилень точок даних від середнього.
AVERAGE Повертає середнє арифметичне аргументів.
AVERAGEA Повертає середнє арифметичне аргументів, враховуючи числа, текст і логічні значення.
BETADIST Повертає інтегральну функцію щільності бета-розподілу.
BETAINV Повертає обернену функцію до інтегральної функції щільності бета-розподілу.
BINOMDIST Повертає окреме значення біноміального розподілу.
CHIDIST Повертає однобічну ймовірність розподілу хі-квадрат.
CHIINV Повертає обернене значення однобічної ймовірності розподілу хі-квадрат.
CHITEST Повертає тест на незалежність.
CONFIDENCE Повертає довірчий інтервал для середнього значення в генеральної сукупності.
CORREL Повертає коефіцієнт кореляції між двома сукупностями даних.
COUNT Підраховує кількість чисел у списку аргументів.
COUNTA Підраховує кількість значень у списку аргументів.
COUNTBLANK Підраховує кількість пустих клітинок у діапазоні.
COUNTIF Підраховує кількість непустих клітинок у діапазоні, які відповідають указаній умові.
COVAR Повертає коваріацію — середнє значення добутків відхилень для кожної пари точок.
CRITBINOM Повертає найменше значення, для якого біноміальна функція розподілу менше або дорівнює вказаному значенню.
DEVSQ Повертає суму квадратів відхилень.
EXPONDIST Повертає експоненційний розподіл.
FDIST Повертає F-розподіл імовірності.
FINV Повертає обернене значення для F-розподілу ймовірності.
FISHER Повертає перетворення Фішера.
FISHERINV Повертає обернене перетворення Фішера.
FORECAST Повертає значення за лінійним трендом.
FREQUENCY Повертає розподіл частот у вигляді вертикального масиву.
FTEST Повертає результат F-тесту.
GAMMADIST Повертає гамма-розподіл.
GAMMAINV Повертає обернений гамма-розподіл.
GAMMALN Повертає натуральний логарифм гамма-функції, Γ(x).
GEOMEAN Повертає середнє геометричне.
GROWTH Повертає значення за експоненційним трендом.
HARMEAN Повертає середнє гармонічне.
HYPGEOMDIST Повертає гіпергеометричний розподіл.