Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_po_informatike.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
53.74 Кб
Скачать

Генеральная и выборочная статистическая совокупность.

В. И. Чернов «Медицинская информатика»

Inf.e-alekseev.ru

Статистика

Термин «статистика» происходит от лат. «status», то есть «состояние» и первоначально связывался с системой описания фактов, характеризующих состояние государства.

Статистика – раздел математики, посвященный математическим методам, систематизации, обработки и использованию данных.

Классификация разделов статистики:

  1. Сбор статистических сведений

  2. Статистическое исследование – данные анализируются для выяснения закономерностей, которые могут быть установлены лишь на основе массовых наблюдений

  3. Разработка приемов статических наблюдений и анализа статистических данных (математическая статистика)

Основные методы математической статистики относятся к двум разделам:

  1. Теория статистического оценивания параметров распределения

  2. Теория проверки статистических гипотез

Основные понятия статистики:

Статистические данные – сведения об объектах из достаточно большой совокупности, обладающих определенным набором признаков.

Типы признаков:

  1. Количественные признаки – могут быть измерены для каждого объекта числом (возраст, вес, давление и др.). Большинство статистических методов разработано именно для таких признаков.

  2. Качественные признаки – не могут быть измерены количественно, как правило, они указывают в текстовой форме категорию, к которой относится объект. Качественные признаки так же допускают измерение: можно подсчитать количество объектов, попадающих в каждую категорию признака (найти частоту встречаемости этой категории). Только на уровне совокупности происходит превращение качества в количество.

Статистическая совокупность – множество объектов, характеризуемых некоторым количественным или качественным признаком.

Генеральная статистическая совокупность – это статистическая совокупность, состоящая из всех объектов, характеризующихся выбранным признаком.

Выборочная статистическая совокупность (выборка) – статистическая совокупность, состоящая из некоторого количества объектов случайным образом, выбранная из генеральной статистической совокупности. Случайность необходима для репрезентативности (представительности) выборки, то есть свойства выборочной совокупности должны соответствовать генеральной совокупности.

Выборка – множество значений Х1, Х2, Х3, Хn из всех значений Х. Свойства выборки являются приближенными оценками свойств генеральной статистической совокупности.

Оценка свойств генеральной совокупности по выборке

Структура выборочного метода:

  1. Создание выборки

  2. Выявление свойств выборочной статистической совокупности и получение оценок ГС

  3. Определение величины ошибки, в полученных оценках ГС

Дискретные интервальные вариационные ряды – используются для систематизации сведений о выборки и для построения эмпирической функции распределения.

Количественно изменяющийся признак Х носит название варьирующего признака, а его конкретные значения называются вариантами.

Х1, Х2 … Хk – варианты

Числа, показывающие, как часто встречается тот или иной вариант в составе данного ряда, называются частотами.

m1, m2 … mk

Ряд, в котором сопоставлены варианты и соответствующие им частоты, называются вариационным рядом.

m1 + m2 + … mk =∑ mi= n

Относительная частота элемента:

Pi = mi / n

Формы представления вариационного ряда:

  1. Табличная форма

  2. Графическая форма

Результаты наблюдений, представленные в такой таблице, называют статистическим дискретным рядом распределения. Его изображением является полигон частот; для его построения откладываются точки с координатами Х и m и соединяются отрезками.

В случае если количество вариантов очень большое или Х является непрерывной случайной величиной с неизвестной плотностью вероятности, то результаты можно представить в виде статистического интервального ряда распределения.

Построения интервального ряда распределения:

  1. Всю область значений признака Х разбивают на небольшое количество интервалов

  2. Определяют количество значений Х, попадающих в каждый интервал (частоту интервала)

  3. Рассчитываем относительные частоты

Статистическим интервальным рядом распределения называется таблица, в которой первая строка содержит границы интервалов, вторая строка значения частот m или p. Графическим изображением такого ряда является гистограмма относительных частот. Гистограмма состоит из прямоугольников, основаниями которых служит значение дельта Х (ширина интервала), а высотами плотности частот. Огибающая этого графика имеет смысл эмпирической плотности вероятности распределения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]