
- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
2.3 Эмпирическая плотность распределения
Если при составлении
интервального распределения выборки
взяты промежутки неравной длины с
шагами,
то большая высота столбца в гистограмме
частот может появиться за счет большей
длины данного промежутка и не показывать
реальную вероятность нового значения
попасть в этот промежуток. Данный
недостаток помогает исправить
дополнительное построение эмпирической
плотности распределения.
Эмпирическая
(выборочная) плотность распределения– ступенчатая функцияf*(x),
где высота ступени на промежутке с
номеромiберется из
условия, что площадь прямоугольника
на этом участке равна относительной
частотепопадания в такой промежуток. Тем самым
и значение эмпирической плотности
на данном промежутке вычисляется по
правилу
,
гдеi− номер
промежутка.
Добавка «эмпирическая»
переводится как «наблюдаемая» и может
быть заменена на «выборочная». Значение
показывает относительную частоту,
приходящуюся на единицу длины промежутка
с номеромi. Чем больше
высота ступениf*(x)
на промежутке с номеромi, тем больше относительная частота
попадания в малый участок этого
промежутка.
При сжатии промежутка
с сохранением частоты попадания в
него, происходит увеличениезначения,
при растягивании промежутка значения
уменьшается.
Если выполнено
т.е выбран равный шаг разбиения то
ступенчатая функцияf*(x)
получается из верхних границ гистограммы
частот изменением масштаба по оси
ординат делением частотni
наnh.
В этом случае
.
Рисунок 3а
…….. ..
Иногда, для удобства
изображения вместо ступенчатой функции
y=f*(x)
дополнительно строят ломаную, соединяющую
соседние точки с координатами
Получаем
подобие полигона распределения.
и
,
где
— серединаi-го
промежутка (или другой его представитель),
см. Рис.3б.
Эмпирическая функция распределения
и другие кумулятивные кривые
Из теории вероятностей известно, что функции распределения случайной величины Х имеет вид
и она в точкех0 показывает вероятность для Х принимать значения, меньшие заданногох0 (вероятность оказаться слева от х0).
Эмпирическая
функция распределения задаётся
аналогично функции распределения
случайной величины и обозначается.
Значение эмпирической функции
распределения в точкехравно сумме
относительных частот
для всех элементовxj
выборки, меньших взятогох,
.
При дискретном
распределении выборки функция
показывает суммарную относительную
частоту элементов выборки, меньших
указанного числах. Функция
принимает значения от 0 (прихменьше
минимального элемента выборки), до 1
(прих больше максимального элемента
выборки). При дискретном распределении
выборки функция
имеет вид:
.
График функции
является ступенчатой линией с высотой
очередной ступени равной относительной
частоте пройденной варианты
(слева направо) как на Рисунке 4. Справедливо
и обратное: изменение высотыF*при переходе через точку х(слева
направо) равна относительной частоте
соответствующей вариантых.
Для интервального
распределения выборки изменение высоты
F*при
переходе левую границуi-го
промежутка равна относительной частотепопаданий в данный промежуток.
При этом соседние
точки
и
часто соединяют отрезками прямых,
получая ломаную.
Эмпирическая функция распределения F* относится к числукумулятивных кривых иликумулят, которые изображают изменение накопленного признака при изменении аргумента. ДляF*указывается суммарная относительная частота элементов выборки, лежащих левеехпри изменениих. Можно строить также кумулятивные кривыедругих видов:
Кривая накопленных частотэлементов выборки, лежащих правеех. Высоты точек при этом будут меняться от 0 в левой части доn справа и полученная функцияF*(х) является неубывающей;
Кривая накопленных частотэлементов выборки, лежащих правеех.Высоты точек при этом будут меняться отn в левой части до 0 справа и полученная функция является невозрастающей;
Другие кумулятивные кривые (кумуляты), например огива.
Огивой или эмпирической квантильной кривойявляется кривая, которая указывает изменение значений исследуемого признака Х в зависимости от изменения частоты либо относительной частоты.
Огивы можно
получить из соответствующей кумулятивной
кривой перестановкой зависимой и
независимой переменных. Следовательно,
функции, задаваемые парами таких кривых,
являются взаимообратными. График огивы
по соответствующей кумуляте можно
построить, выполняя симметрию исходной
кумуляты относительно прямой у=хс учётом масштаба. При небольшом числе
искомых точек можно находить зависимость
значений для Х по относительной частоте
непосредственно по графику эмпирической
функции распределения.