
- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
Мода и медиана
4.5.1МодараспределенияМо – наиболее часто встречающийся её элемент. В дискретном распределении выборки мода – варианта (варианты), имеющая наибольшую частоту.
Мода распределения может быть единственной и распределение называться унимодальным, либо может быть несколько элементов (вариант) с наибольшими частотами и распределение в этом случаебимодальное(при двух модах) илимногомодальное.
В интервальном
унимодальном распределении для нахождения
его моды сначала определяется модальный
интервал с номером i,
имеющий наибольшую частоту
.
Само значение моды в этом случае находится
по формуле :
.
При построенной гистограмме с равными промежутками (плотности распределения) мода может быть найдена графически:
Правую вершину модального прямоугольника соединяют прямой с правой вершиной предыдущего прямоугольника;
Левую вершину модального прямоугольника соединяют прямой с левой вершиной следующего прямоугольника;
Абсцисса точки пересечения построенных прямых является модой.
В этом случае может получиться числовое значение, которое в данной выборке не наблюдалось.
4.5.2 Медиана распределенияМе – элемент выборки, сумма частот слева от которой в вариационном ряде равно сумме частот справа.
При дискретном распределении выборки медиана – такая варианта, для которой сумма частот слева и справа не превосходит половины объёма выборки. По накопленным частотам (обычно от наименьшего значения) находят её положение в вариационном ряде, затем указывают значение.
При интервальном распределении выборки медианным является промежуток с номером i, начиная с которого сумма накопленных частот превысит половину объёма выборки (сумма накопленных относительных частот превысит 0,5). Само значение медианы находится по формуле:
.
При известной
эмпирической плотности распределения,
медиана даёт такое значение у=Ме,
при котором соответствующая горизонтальная
прямая делитпополамплощадь
криволинейной трапеции (ограниченную
ось абсцисс и графиком
).
При построенной кумуляте (накопленных частотах или относительных частотах элементов, лежащих левее х ) медиану можно найтиграфически:
На оси ординат откладывают точку, делящую пополам наибольшую ординату (0,5 или
);
Через отложенную точку проводят прямую, параллельную оси ординат и находят точку её пересечения с кумулятой;
Абсцисса точки пересечения является медианой.
В этом случае может получиться числовое значение, которое в данной выборке не наблюдалось.
4.2 Виды статистических оценок. Исправление дисперсии
Для
различных числовых показателей
генеральной совокупности (исследуемой
случайной величины Х) по выборке находятся
их статистические оценки, которые
являются точечными т.к. имеют вид.
Важно представлять, можно ли полученной
оценкой приближать значение интересуемого
числового показателя.
4.2.1Выборочное
среднееявляетсяточечной оценкойгенерального
среднего
(математического ожидания исследуемой
случайной величины ).
Такая оценка является
несмещенной ,
т.е. ожидаемое значение
не должно
отличаться
от искомого значения;
эффективной, при данном объёме выборкиnдает наименьшую
дисперсию
для разных точечных оценок;
состоятельной, при
стремится по вероятности к
, т.е.
увеличение
объёма выборки даёт всё более точную
оценку искомой величины.
Следовательно,
математическое ожидание исследуемой
случайной величины Х можно приблизить
значением выборочного среднего
,
причем погрешность приближения
стремится к нулю при увеличении объёма
выборки.
4.2.2Выборочная
дисперсия являетсяточечной оценкой
генеральной дисперсии(дисперсии исследуемой случайной
величины).
Такая оценка является
эффективной ,
состоятельной,
смещенной,
, из теории вероятностей получено
.
В связи с этим
помимо выборочной дисперсии
вычисляют также иисправленную
дисперсию, обозначаемую
.
В этом случае исправленное среднее
квадратичное является квадратным корнем
из исправленной дисперсии,
.
Исправление
дисперсиипроизводится по правилу.
Если вычисления выборочной дисперсии производятся по определению, то можно сразу выполнять её исправление:
,
;
Если вычисление выборочной дисперсии выполняется по свойству, то её исправление выполняется по правилу:
;
В случае интервального распределения выборки в перечисленные формулы исправления дисперсии и нахождения Sвместо
подставляют
– середину промежутка (или другой выбранный представитель).
Замечание: При достаточно большом объёме выборки
(n50 ) исправление дисперсии можно не
производить т.е. взять
,
.
Пример 5:
Вычислить
,Dв,S, если распределение выборки имеет вид:
x |
68 |
168 |
268 |
368 |
nx |
30 |
20 |
40 |
10 |
.
Решение:
Объем выборки n=30+20+40+10,n=100 .
1 способ:
.
Выборочную дисперсию можно было вычислить, воспользоваться свойством:
=
.
2 способ
Вычисления
иDв можно
упростить если заметить, что
т
где распределение Yимеет вид:
Y |
0 |
1 |
2 |
3 |
ny |
30 |
20 |
40 |
10 |
.
В этом случае (воспользовавшись свойствами),
Исправление дисперсии не производилось, считая n=100 достаточно большим.
Ответ:=198,Dв=10100,S=100,499.