Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
11111111111111111111111111111111112.docx
Скачиваний:
2
Добавлен:
24.09.2019
Размер:
152.12 Кб
Скачать

Полигон частот. Выборочная функция распределения и гистограмма.

Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xiоткладываются на оси абсцисс, а ni– на оси ординат. Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот (рис.1 Для непрерывного признака графической иллюстрацией служит Гистограмма – графическое приближенное представление плотности

распределения вероятностей случайной величины, построенное по выборке

конечного объема. Рис.2.

Формула Стерджесса

Оценка оптимального количества групп с равными интервалами для нормальных распределений по формуле Стерджесса: n = 1 + 3,322 lg ( N ) Для MS Excel: n =1+3,322*LOG(N),где:n - количество интервалов;N - число единиц совокупности. Результат, получаемый по формуле Стерджесса округляется до целого числа в большую сторону и имеет всего лишь оценочный характер, поскольку все зависит от условий конкретной ситуации и всегда решается отдельно.Формула Стерджесса пригодна при условии, что распределение единиц совокупности по заданному признаку приближается к нормальному, и при этом применяются равные интервалы в группах.Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления. Интервалы могут быть равные и неравные.При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие или прогрессивно убывающие) интервалы.Например, по численности работающих промышленные предприятия могут быть разбиты на группы: до 100 человек, 100 - 200, 200 - 300, 300 - 500, 500 - 1000, 1000 и более человек.Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50-100 человек имеет существенное значение для мелких предприятий, а для крупных - не имеет.

37оценка параметров генеральной совокупности

Числовые характеристики, описывающие генеральную совокупность, называются параметрами. Те же самые характеристики, но рассчитанные для выборки, называются статистиками. Таким образом, статистический вывод – это утверждение о параметрах генеральной совокупности на основании изучения статистики. Такие утверждения носят вероятностный характер и подразделяются на три вида: статистическое оценивание точечное, статистическое оценивание интервальное и проверка гипотез.

Статистическое оценивание заключается в том, что исследователь ищет по выборке показатель, наиболее близкий к исследуемому параметру, или интервал в котором с большой вероятностью лежит этот параметр.

Под оценкой понимается любое число, рассчитанное по выборке и характеризующее параметр.

Точечная и интервальная оценка параметра генеральной совокупности.

Предположим, что по выборке нужно найти не интервал, в котором находится параметр, а одно число которое ближе всего к параметру. Под оценкой понимается любое число, рассчитанное по выборке и характеризующее параметр.

Свойства точечной оценки:

  • Несмещенность – среднее выборочного распределения оценки равно величине параметра.

  • Состоятельность – при увеличении объема выборки оценка приближается к значения измеряемого параметра.

  • Эффективность – чем ниже дисперсия, т.е. чем меньше отличаются оценки, полученные в разных выборках, тем выше эффективность.

Интервальная оценка

Интервальная оценка включает в себя два компонента:

    • Интервал в котором ожидается обнаружить оцениваемый параметр генеральной совокупности;

    • Вероятность обнаружения параметра в данном интервале.

1. Определить какой статистикой необходимо пользоваться и найти соответствующую таблицу.

2. Задавшись некоторой доверительной вероятностью, по выбранной таблице для заданной вероятности определить такое Дельта, чтобы в пределах Альфа +- дельта лежало 95% площади кривой.

3. Из ген совокупности извлекается случайная выборка и вычисляется значение статистики А. таким образом А +- Дельта и есть искомый 95%-й доверительный интервал.

№38

Доверительный интервал и доверительная вероятность

Наряду с точечными широко применяют интервальные оценки числовых характеристик случайных величин, выражающеся границами интервала, внутри которого с определенной вероятностью заключено истинное значение результата измерения. Вероятность того, что погрешность не выйдет за границы некоторого интервала, определяется по площади, ограниченной кривой распределения и границами этого интервала, отложенными по оси абсцисс (квантилями), что показано на рис. 1.10.

Рис.1.10.Таким образом, интервал , за границы которого погрешность не выйдет с некоторой вероятностью, называется доверительным интервалом, а характеризующая его вероятность - доверительной вероятностью. Границы этого интервала называются доверительными значениями погрешности. При измерениях можно задаваться доверительным интервалом и по нему определять доверительную вероятность, либо, наоборот, по доверительной вероятности подсчитывать доверительный интервал. Чем больше доверительная вероятность, тем шире доверительный интервал; поэтому на практике обычно выбирают доверительную вероятность 0,95 и даже 0,90.Доверительный интервал обычно выражают через относительную величину  в долях среднего квадратического отклонения (“кратность”) . Для нормального закона доверительную вероятность  определяют по значениям интеграла вероятности (функции Лапласа), который в математи ческой справочной литературе обозначается  и определяетсяЗная доверительные границы  и  можно определить доверительную вероятность

Если значения доверительных границ  и  симметричны, т.е.

, то  и .

Тогда

При нормальном законе распределения доверительный интервал  имеет доверительную вероятность =0,9973, что означает, что из 370 случайных погрешностей только одна по абсолютному значению будет больше . На основании этого основан один из критериев грубых погрешностей, когда остаточная погрешность какого-либо результата измерения превышает значение   , то этот результат считается промахом и исключается из ряда измерений.

39 Дисперсионный анализ — это статистический метод оценки связи между факторными и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (разнообразия) значений признаков. В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берется дисперсия (В)— средний квадрат отклонений. Отклонения, вызываемые воздействием факторного признака (фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые факторным признаком, более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результативный признак.

Для того, чтобы вычислить дисперсию значения отклонений каждой варианты (каждого зарегистрированного числового значения признака) от среднего арифметического возводят в квадрат. Тем самым избавляются от отрицательных знаков. Затем эти отклонения (разности) суммируют и делят на число наблюдений, т.е. усредняют отклонения. Таким образом, получают значения дисперсий.

Важным методическим значением для применения дисперсионного анализа является правильное формирование выборки. В зависимости от поставленной цели и задач выборочные группы могут формироваться случайным образом независимо друг от друга (контрольная и экспериментальная группы для изучения некоторого показателя, например, влияние высокого артериального давления на развитие инсульта). Такие выборки называются независимыми.

Нередко результаты воздействия факторов исследуются у одной и той же выборочной группы (например, у одних и тех же пациентов) до и после воздействия (лечение, профилактика, реабилитационные мероприятия), такие выборки называются зависимыми.

Дисперсионный анализ, в котором проверяется влияние одного фактора, называется однофакторным (одномерный анализ). При изучении влияния более чем одного фактора используют многофакторный дисперсионный анализ (многомерный анализ).

Факторные признаки — это те признаки, которые влияют на изучаемое явление. Результативные признаки — это те признаки, которые изменяются под влиянием факторных признаков.

Для проведения дисперсионного анализа могут использоваться как качественные (пол, профессия), так и количественные признаки (число инъекций, больных в палате, число койко-дней).