
- •Генеральная и выборочная статистическая совокупность.
- •Статистика
- •Точечные и интервальные оценки параметров распределения по данным выборки.
- •Вычисление случайных погрешностей измерений
- •Проверка статистических гипотез о законах распределения
- •Общие принципы анализа медицинских данных
- •Программные средства обработки и анализа медицинских данных
- •Системы искусственного интеллекта
- •Медицинские информационные системы
- •Медицинские приборно-компьютерные системы (мпкс)
- •Компьютерные вирусы
- •Моделирование эпидемий
Вычисление случайных погрешностей измерений
Случайными называются погрешности, которые при многократных измерениях в одинаковых условиях изменяются непредсказуемым образом. Случайны погрешности формируются множеством независимых факторов и не могут быть ликвидированы полностью, однако их можно учесть при измерении.
Измерения бывают:
Прямые измерения – результат получается с помощью измерительного прибора
Косвенные измерения – результат получают с помощью расчетов (измерение объемов площадей)
Оценка случайных погрешностей прямых измерений (серия измерений)
Серия измерений проводится в одних и тех же условиях. Число измерений в серии обозначим n. Тогда наилучшей точечной оценкой истинного значения измеряемой величины Х является среднее арифметическое всех измерений.
Наилучшая интервальная оценка истинного значения дается в таком виде:
Хистинное =
Определение полуширины интервала дельта Х:
ΔХ = tгамма (f) * Sх (среднее) – формула Стьюдента
ΔХ называется абсолютная погрешность измерений.
Порядок вычисления интервальной оценки для истинного значения Х:
Дать точечную оценку истинного значения Х (среднее)
Определить полуширину интервала дельта Х
Дать интервальную оценку
Хистинное = ± ΔХ
Пример: с доверительной вероятностью гамма = 0,95 дать интервальную оценку истинной массы вещества, содержащегося в одной капсуле, если в результате измерений этой массы были получены следующие значения: 10, 11, 12, 11 мг.
Х = (10+11+12+11) /4=11
Sx=0,408
f = n -1 = 4-1 = 3
t0,95 (3) = 3,182
ΔХ = t0,95 (3) * 0,408 = 3,182 * 0,408 = 1,298
Х = 11 ± 1,298
Оценка случайных погрешностей косвенных измерений:
Наилучшая точечная оценка истинного значения Y – это среднее значение Y, вычисленное от средних значений Х.
Значения среднего квадратического отклонения для Y (среднее):
Sy (среднее) = (сумма частных производных * Sx (среднее))2
Вычисления абсолютной погрешности для переменной Y ведется по формуле Стьюдента:
Δy = tгамма (f) Sy (среднее)
Пример: проведем обработку результатов эксперимента по измерению ускорения свободного падения g. В ход эксперимента выполнено прямое измерение времени падения t стального шарика с высоты h. Оба измерения являются многократными (n=20) прямыми измерениями. После их обработки были получены следующие данные:
Даем точечную оценку для среднего значения g.
Вычисление относительной погрешности y:
E = (Δy * 100%)/y
Е = 1,86/9,8 * 100% = 20%
По величине относительной погрешности можно судить о качестве измерений.
Проверка статистических гипотез о законах распределения
Статистическая гипотеза – предположение о виде или параметрах закона распределения вероятности. Различают параметрические и не параметрические гипотезы:
Параметрические гипотезы относятся к оценке параметров распределения (мат. ожидание, дисперсия и т.д.)
Не параметрические гипотезы относятся к виду закона распределения
Понятие нулевой и альтернативной гипотезы:
Нулевая гипотеза (Н0) – основное проверяемое предположение об отсутствии различий, отсутствии влияния фактора, эффекта, равенство нулю, значение выборочных характеристик.
Конкурирующая или альтернативная гипотеза (Н) – выдвигает предположения о наличии различий или действующего эффекта.
Статистическую гипотезу никогда нельзя доказать по результатам выборки, всегда возможны ошибочные решения двух видов:
Ошибка первого рода – гипотеза Н0 отвергается в том случае, когда она верна. Допустимой вероятностью такой ошибки традиционно считают 5%.
Ошибки второго рода состоят в принятии гипотезы Н0 в том случае, когда она в действительности неверна.
Альтернативные гипотезы принимаются или отвергаются тогда и только тогда, когда опровергнута нулевая гипотеза.
Уровень значимости – вероятность ошибки первого рода при принятии решения.
Общие принципы проверки статистических гипотез: процедура проверки нулевой гипотезы включает следующие этапы:
Задается допустимая вероятность ошибки первого рода (уровень значимости)
Выбирается статистика критерия
Ищется область допустимых значений
По исходным данным вычисляется экспериментальное значение статистики критерия
Если экспериментальная статистика критерия принадлежит к области принятия нулевой гипотезы, то нулевая гипотеза принимается. В обратном случае проявляется альтернативная гипотеза.
Выдвижение нулевой гипотезы при проверке законов распределения:
Сначала проводится предварительная оценка параметров эмпирического распределения:
Построить вариационный ряд частот
Построить гистограмму плотности относительных частот
Построить статистическую функцию распределения относительных частот
Оценить эмпирические параметры распределения (мат. ожидание, дисперсия, сигма)
На основании полученных оценок выдвинуть и проверить гипотезу о характере распределения с помощью критериев согласия
Критерием согласия называют величину, с помощью которой оценивается различие между другими величинами и свойства которой известны.
Рассмотрим критерии Пирсона (хи-квадрат), которые часто используются для проверки закона распределения случайной величины.
Распределением хи-квадрат с k степенями свободы называется распределением суммы квадратов k независимых случайных величин, распределенных по стандартному нормальному закону.
Какова процедура использования критерия хи-квадрат?
Определяем хи-квадрат критическое по стат. Таблицам
Сравниваем хи-квадрат наблюдаемое и хи-квадрат критическое по следующим правилам:
Если хи-квадрат наблюдаемое меньше, чем хи-квадрат критическое, тогда нулевая гипотеза принимается, различия считаются незначительными, а эффект отсутствующим.
Если хи-квадрат наблюдаемое больше, чем хи-квадрат критическое, тогда принимается альтернативная гипотеза, различия в данных считаются значительными и не согласующимися с предполагаемым видом распределения.
Для перевода числа из десятичной системы счисления нужно разделить его на основание и продолжать делить его, пока частное не станет равно нулю. Значение получившихся остатков, взятые в обратной последовательности, образуют искомое число.
Архитектура ЭВМ: большинство современных компьютеров построены с использованием принципов Фон Неймана.
Принципы:
Компьютер состоит из нескольких основных устройств, связанных между собой.
Принцип двоичного кодирования – символы нуль и один, которые соответствуют двум состояниям ячейки памяти (заряжено, разряжено)
Принцип однородности памяти (принцип хранимой программы) – и программы и данные могут храниться в одной и той же памяти, над командами можно осуществлять одни и те же действия, что и над данными
Принцип адресуемости памяти – условно можно считать, что память состоит из пронумерованных ячеек и в любой момент времени доступна любая ячейка памяти. Блоком ячеек так же можно присваивать имена.
Принцип последовательного программного управления – программа состоит из команд, которые последовательно выполняются друг за другом
Принцип условного перехода – с помощью команды условного перехода можно менять последовательность выполнения команд в зависимости от значения данных
Архитектура ЭВМ, основанная на принципах фон Неймана.
Совокупность технических устройств компьютера называют аппаратным обеспечением.
Блоки компьютера находятся в системной блоке (железный ящик), память, процессор, периферийные устройства. Процессор – главная микросхема компьютера. Основой современных компьютеров является магистрально-модульный принцип организации. Модульный принцип позволяет пользователю комплектовать нужную конфигурацию компьютера, модульная организация опирается на магистральный принцип обмена информации между устройствами. Магистраль (системная шина) – система связей, соединяющих все устройства компьютера, представляет собой много проводную линию, выполненную на материнской плате компьютера. Магистраль включает в себя три многоразрядные шины:
Шина данных – передает данные в любом направлении между различными устройствами
Шина адреса – передает адреса, используемых устройств, и активирует работу всех внешних устройств по команде процессора. Сигналы передаются только от процессора к устройствам.
Шина управления – передает сигналы, определяющие характер обмена информацией, то есть сигналы управления (команды насчитывания или запись информации)
Системная плата – основной аппаратный компонент компьютера. На ней смонтированы:
Магистраль обмена информацией
Разъемы для установки процессора памяти и других микросхем
Разъемы для установки контроллеров внешних устройств
Быстродействие всех этих устройств может сильно различаться, поэтому на системной плате устанавливаются специальные микросхемы, включающие в себя контроллер оперативной памяти (северный мост) и контроллер периферийных устройств (южный мост), которые согласуют работу этих устройств. Северный мост обеспечивает обмен информацией между процессором и оперативной памятью по системной шине. К нему подключаются шины, обеспечивающие обмен информацией с видеокартами. Южный мост обеспечивает обмен информацией между северным мостом и портами для подключения периферийного оборудования (контроллеры жестких дисков, звуковые карты, шины USB, мышь, клавиатура и т.д.).
Обозначения шин и портов подключения:
Шина взаимодействия периферийных устройств
Ускоренный графический блок
Шина подключения памяти
Последовательные порты
Параллельный порт
Универсальная последовательная шина
Базовая система ввода-вывода – обеспечивает первоначальную загрузку программ компьютера и тестирует аппаратное обеспечение компьютера. Ее наличие позволяет запустить операционную систему.
Закон Мура – удвоение сложности микропроцессоров происходит приблизительно каждые два года.
Оперативное запоминающее устройство содержит программы, которые выполняются в данный момент и данные, используемые этими программами. После выключения компьютера вся эта информация пропадает, если не была сохранена в постоянном запоминающем устройстве.
Жесткий диск – ПЗУ, которая обычно содержит программы операционной системы, информацию, необходимую для загрузки компьютера и любые другие данные. Каждый логический диск, создаваемый на жестком диске имеет свое имя.
Поколение ЭВМ:
1940-60 гг., вычислительный элемент – электронные лампы, быстродействие (10-20 тыс. операций в секунду), наиболее распространенный язык – ассемблер.
1960-64 гг., вычислительный элемент – транзисторы, быстродействие (1, 2 миллиона оп-ций в секунду), появилась внешняя память на магнитных баранах и магнитных лентах. Были разработаны языки программирования высокого уровня.
1964-72 гг., вычислительный элемент – интегральные схемы, быстродействие (до 300 миллионов операций в секунду), появились первые микро ЭВМ, предназначенные для одного пользователя. Появились первые операционные системы.
1974 по настоящее время, вычислительный элемент – микропроцессоры, быстродействие (миллиарды операций в секунду), появились доступные по цене персональные ЭВМ с жестким диском.
Настоящее время; основаны на использовании нано технологий. Используются нейросетевые модели. Происходит отказ от Фон Неймоновской архитектуры.