Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kurs_Theor.doc
Скачиваний:
8
Добавлен:
22.12.2018
Размер:
1.86 Mб
Скачать
    1. Первичный статистический анализ

В этой главе приводятся описания первых трех заданий. Рассматриваемые здесь процедуры предваряют, как правило, любую статистическую обработку данных.

Задание 1. Выборочные характеристики.

Постановка задачи.

Вычислить основные статистические характеристики выборочных данных:

        1. Среднее арифметическое.

        2. Дисперсию.

        3. Стандартное отклонение.

        4. Коэффициент асимметрии.

        5. Коэффициент эксцесса.

Теоретические основы.

Статистический анализ выборочных данных начинают обычно с вычисления выборочных моментов.

Среднее

(читается “икс с чертой”) – несмещенная и состоятельная оценка истинного среднего значения . Величина характеризует расположение наблюдаемой с.в. X. Очень часто сравнение различных совокупностей производят как раз по среднему. Однако, надо иметь в виду, что это имеет смысл только в случае, если, во-первых, плотность распределения X имеет один локальных максимум и, во-вторых, дисперсии наблюдаемых с.в. (см. ниже) во всех группах “почти” одинаковы.

Дисперсия

– состоятельная и “почти несмещенная” оценка истинной дисперсии 2. Служит мерой разброса с.в. около её среднего . По известному правилу трех сигм с вероятностью, большей 90%, следует ожидать значение с.в. в пределах . Интересно, что нормальная с.в. с вероятностью, большей 95%, принимает значения в интервале .

Дисперсия измерительного прибора характеризует его точность.

Наряду с дисперсией, всегда вычисляется

стандартное отклонение .

Забегая вперед, скажем, что точность доверительного интервала для истинного значения среднего прямо пропорциональна . Грубо говоря, истинное лежит где-то в пределах от выборочного среднего .

Коэффициент асимметрии

– состоятельная, но смещенная оценка истинного коэффициента асимметрии . Несет информацию о симметричности расположения данных относительно центра . При больших положительных значениях распределение с.в. будет иметь более “тяжелый” правый “хвост”. Если график плотности такого распределения “насадить” на вертикальный штырь в точке достижения максимума, то график “упадет” вправо.

Выборочный коэффициент можно использовать для проверки согласия данных выборочного обследования с нормальной моделью распределения. Большие абсолютные значения будут свидетельствовать против гипотезы нормальности распределения, каковое, как известно, симметрично. При объеме выборки , близком к 100, и уровне значимости гипотезу нормальности следует отвергать, если выборочный коэффициент асимметрии не попадает в интервал (-0,389; 0,389) (см. сборник таблиц [1], стр.258). Границы этого интервала построены так, чтобы вероятность ошибки 1-ого рода, то есть вероятность отвержения гипотезы нормальности в случае, когда она верна, не превосходила заданного уровня .

Коэффициент эксцесса

– состоятельная, но смещенная оценка истинного коэффициента эксцесса . Служит мерой сосредоточенности данных около среднего. У нормального распределения (для этого и вычитается тройка). При положительных зна­че­ниях плотность распределения будет иметь более острый, чем у нормального распределения, пик около среднего. Соответственно, при отрицательных пик будет более плоским. Иногда, по аналогии с видом нормальной функции плотности, коэффициент называют коэффициентом “колоколообразности”.

На этом рисунке приведены графики трех плотностей:

1) нормального распределения – ,

2) треугольного распределения – , и

3) двухстороннего экспоненциального распределения – .

Выборочный коэффициент также можно использовать для проверки гипотезы нормальности. При объеме выборки , близком к 100, и уровне значимости гипотезу нормальности следует отвергать, если коэффициент эксцесса не попадает в интервал (-0,65; 0,77) (см. сборник таблиц [1], стр.259).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]