
- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
5.2 Непрерывные случайные величины
Непрерывная случайная величина Х описываетсяс помощью
Плотности распределения f(x).
Для f(x)выполнено:
График у= f(x)лежит выше оси абсцисс, f(x)
;
Если
, то при
;
Площадь, ограниченная графиком у= f(x)и осью Ох, равна 1;
Функции распределения F(x).
Для F(x) выполнено:
;
;
;
Числовых характеристик
,
;
,
;
.
Перечислим основные виды распределенийнепрерывных случайных величин и укажем правила нахождения их параметров по статистическим данным.
Равномерноераспределение
Пусть случайная величина Х принимает значения из отрезка [a;b], вероятность попадания в малый участок этого отрезка не зависит от его положения в отрезке [a;b] и зависит только соотношения длин этих отрезков.
Вэтом случае Х имеетравномерное
распределение,
плотность равномерного распределения .
Чем больше длина
отрезка [a;b]
(разница междуa
и b ), тем
меньше значение функцииf(x)=на этом отрезке (см. Рис.17). .
График плотности равномерного распределения имеет следующий вид :
В случае равномерного распределения
Функция распределения
Вероятность попадания значений случайной величины Х в отрезок [x1;x2] длиныL(полностью лежащий в отрезке [a;b] )
находится как отношение его длины к длине отрезка [a;b];
Математическое ожидание
(середина отрезка);
Дисперсия
;
.
Замечание:
Равномерное распределение предполагается
при малом отличии полигона или графикаотрезка от горизонтальной прямой, за
пределами которого нулевые значения.
Параметры a
и bравномерного
распределения по статистическим данным
находятся из оценок:
,
т.е. . ;
Показательное распределение
Случайная величина Х имеет показательное распределение, если
плотность её распределения имеет вид .
.
График плотности показательного распределения
Функция распределения
для показательного распределения
называется функцией надёжности.
Вероятность
попадания в промежуток
.
Для показательного
распределения
.
Замечание:
Показательное распределение предполагают,
когда гистограмма или график эмпирической
плотности до нулевого значения практически
нулевые и значенияиS мало отличаются.
Для случайной
величины Х, имеющей показательное
распределение, параметром служит
, её значение по выборочным данным может
быть найдено следующим образом:
1) Для выборки х1,х2, …..,хnнаходим.
Если
иS существенно
отличаются, то показательное распределение
вряд ли имеет место;
2) Из оценки
и условия
,
получаем
;
В общем случае
показательное распределение может
иметь два параметра, плотность
распределения при этом
(см. Рис.18.б).
Число
показывает пологость кривой и наибольшую
высоту, числоа показывает сдвиг
относительно осиОу.
В этом случае
числовые характеристики
.
Замечание:
Такое распределение предполагается,
когда гистограмма или графикдо значениях = амало отличаются
от нуля, а послех = аявляется
убывающей и стремящейся к нулю. Значения
–аи
должны мало отличаться.
находится из оценки
т.е.
, ;
Нормальноераспределение
Нормальное
распределениеимеет плотность,
график которой является колоколообразным
(с одной точкой максимума).
На Рис.19
показаны графики плотностей нормального
распределения с параметрами а1=20
и1=15
,а 2=20
и
2=8,а3=35 и
3=5.
Для нормального
распределения параметр а показывает
абсциссу точки максимума, параметрпоказывает отклонение отх=а(влево
и вправо) абсцисс точек перегиба. Чем
меньше значение
,
тем плотность распределения имеет более
крутой график с большим значением
функции в точке максимума.
Для нормальной
случайной величины Х, имеющей параметры
а =0 и
=1
(нормированной) плотность распределения
обычно обозначается
,
. График
симметричен относительнох=0 (осиОу) и точки её перегиба при
.Функция
являетсячётной ,
.
Значения
при
заданы в таблице (приложение 1),
при
считаем
=0.
Функция распределения
F(x) приа=0 и=1
имеет видF(x)=0,5
+ Ф(х),
где
–нечётнаяфункция т.е. Ф(-х)=
–Ф(х).
Значения Ф(х) заданы в таблице (приложение 2),при х>5 считаемФ(х)=0,5.
Значения
плотности произвольного нормального
распределения можно найти, используянормированнуюслучайную величину,
тогда
.
Графикf(x)
получается из графика
сжатием в
раз вдоль осиОх(растяжением в
раз вдоль осиОхпри
<1)
и переносом наaвправо (приа<0 сдвиг влево).
Д
F(x)=0,5
+Ф,
используя функцию Ф(х) получим соотношение .
Вероятность
нормальной величиной принимать значения
от х1дох2находится
по правилу.
Из этого
а)—вероятность
значений нормальной случайной величины, не превосходящих х=х0 ;
б)—вероятность
значений нормальной случайной величины, превосходящих х=х0 .
Вероятность
отклонения нормальной величины от
своего математического ожидания на
величину, не превышающую
,
находится по правилу
.
Если взять
,
то
,
, (Ф(3)=0,49865 из таблицы).
«Правило трёх сигма»:
«вероятность отклонения нормальной случайной величины от своего математического ожидания на величину, большую трёх среднеквадратичных отклонений, составляет не более 0,3% ».
Следует обратить
внимание, что нормальное распределение
аппроксимирует (приближает) как
биномиальное распределение, так и
распределение Пуассона при увеличении
числа испытанийm.
При этом получим параметры
нормального распределенияпри биномиальном распределении,
для распределения Пуассона.
Если Х1, Х2, … , Хn— нормальные
случайные величины с известными
математическими ожиданиямии среднеквадратичными отклонениями
,
то их взвешенная сумма
является такженормальной
величинойс параметрами
и
.
Центральная предельная теорема:
ЕслиХ1, Х2, …. , Хn–
независимые случайные величины, имеющие
один и тот же закон распределения с
математическим ожиданием М(X)
и дисперсиейD(X),тозакон распределения их суммыпри неограниченном увеличении числа
слагаемыхnприближается
к нормальному распределению с
математическим ожиданием
и дисперсией
.
Замечание: Обычно распределение суммы независимых случайных величин считают нормальным приn>8. Такая сумма может считаться случайной величиной со свойстваминормальнойслучайной величины.
Посчитаем элементы
выборки х1,х2, …..,хnзначениями
случайных величинс одинаковым распределением (с одинаковыми
математическими ожиданиямиМ(Х) и
дисперсиямиD(X)при репрезентативности выборки).
В этом случае их
сумма (при объёме выборки n>8)
распределена нормально, как и случайная
величина.
Её математическое ожидание является
суммой математических ожиданий
и её дисперсия находится по правилу
,
.
Учитывая, что
,
получим:
1)
(несмещённость оценкиМ(Х) с помощью
);
2)
т.е. выборочное среднее — случайная
величина ,
разброс значений для которой убывает и стремится к нулю при увеличении
объёма выборки.
Замечание
:Нормальное распределение
предполагают, когда гистограмма или
графикимеют близкую к колоколообразной
форму.
Для случайной
величины Х, имеющей нормальное
распределение, параметрами служат аи, их значения по выборочным данным могут
быть найдены следующим образом:
По выборочным данным находятся
;
П
находятся из оценок
,
т.е. ;