
- •Генеральная и выборочная статистическая совокупность.
- •Статистика
- •Точечные и интервальные оценки параметров распределения по данным выборки.
- •Вычисление случайных погрешностей измерений
- •Проверка статистических гипотез о законах распределения
- •Общие принципы анализа медицинских данных
- •Программные средства обработки и анализа медицинских данных
- •Системы искусственного интеллекта
- •Медицинские информационные системы
- •Медицинские приборно-компьютерные системы (мпкс)
- •Компьютерные вирусы
- •Моделирование эпидемий
Генеральная и выборочная статистическая совокупность.
В. И. Чернов «Медицинская информатика»
Inf.e-alekseev.ru
Статистика
Термин «статистика» происходит от лат. «status», то есть «состояние» и первоначально связывался с системой описания фактов, характеризующих состояние государства.
Статистика – раздел математики, посвященный математическим методам, систематизации, обработки и использованию данных.
Классификация разделов статистики:
Сбор статистических сведений
Статистическое исследование – данные анализируются для выяснения закономерностей, которые могут быть установлены лишь на основе массовых наблюдений
Разработка приемов статических наблюдений и анализа статистических данных (математическая статистика)
Основные методы математической статистики относятся к двум разделам:
Теория статистического оценивания параметров распределения
Теория проверки статистических гипотез
Основные понятия статистики:
Статистические данные – сведения об объектах из достаточно большой совокупности, обладающих определенным набором признаков.
Типы признаков:
Количественные признаки – могут быть измерены для каждого объекта числом (возраст, вес, давление и др.). Большинство статистических методов разработано именно для таких признаков.
Качественные признаки – не могут быть измерены количественно, как правило, они указывают в текстовой форме категорию, к которой относится объект. Качественные признаки так же допускают измерение: можно подсчитать количество объектов, попадающих в каждую категорию признака (найти частоту встречаемости этой категории). Только на уровне совокупности происходит превращение качества в количество.
Статистическая совокупность – множество объектов, характеризуемых некоторым количественным или качественным признаком.
Генеральная статистическая совокупность – это статистическая совокупность, состоящая из всех объектов, характеризующихся выбранным признаком.
Выборочная статистическая совокупность (выборка) – статистическая совокупность, состоящая из некоторого количества объектов случайным образом, выбранная из генеральной статистической совокупности. Случайность необходима для репрезентативности (представительности) выборки, то есть свойства выборочной совокупности должны соответствовать генеральной совокупности.
Выборка – множество значений Х1, Х2, Х3, Хn из всех значений Х. Свойства выборки являются приближенными оценками свойств генеральной статистической совокупности.
Оценка свойств генеральной совокупности по выборке
Структура выборочного метода:
Создание выборки
Выявление свойств выборочной статистической совокупности и получение оценок ГС
Определение величины ошибки, в полученных оценках ГС
Дискретные интервальные вариационные ряды – используются для систематизации сведений о выборки и для построения эмпирической функции распределения.
Количественно изменяющийся признак Х носит название варьирующего признака, а его конкретные значения называются вариантами.
Х1, Х2 … Хk – варианты
Числа, показывающие, как часто встречается тот или иной вариант в составе данного ряда, называются частотами.
m1, m2 … mk
Ряд, в котором сопоставлены варианты и соответствующие им частоты, называются вариационным рядом.
m1 + m2 + … mk =∑ mi= n
Относительная частота элемента:
Pi = mi / n
Формы представления вариационного ряда:
Табличная форма
Графическая форма
Результаты наблюдений, представленные в такой таблице, называют статистическим дискретным рядом распределения. Его изображением является полигон частот; для его построения откладываются точки с координатами Х и m и соединяются отрезками.
В случае если количество вариантов очень большое или Х является непрерывной случайной величиной с неизвестной плотностью вероятности, то результаты можно представить в виде статистического интервального ряда распределения.
Построения интервального ряда распределения:
Всю область значений признака Х разбивают на небольшое количество интервалов
Определяют количество значений Х, попадающих в каждый интервал (частоту интервала)
Рассчитываем относительные частоты
Статистическим интервальным рядом распределения называется таблица, в которой первая строка содержит границы интервалов, вторая строка значения частот m или p. Графическим изображением такого ряда является гистограмма относительных частот. Гистограмма состоит из прямоугольников, основаниями которых служит значение дельта Х (ширина интервала), а высотами плотности частот. Огибающая этого графика имеет смысл эмпирической плотности вероятности распределения.