Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мат статистика.docx
Скачиваний:
6
Добавлен:
10.11.2019
Размер:
250.29 Кб
Скачать
  1. Несмешанной называют статистическую оценку θ*, математическое ожидание которой равно оценивающему параметру θ при любом объеме выборки, т.е. М(θ*)= θ . (2.1)

  2. Эффективной оценкой называют статистическую оценку θ*, которая при заданном объеме выборки n имеет наименьшую возможную дисперсию.

  3. Состоятельной называют статистическую оценку, которая при n→ ∞ и стремится по вероятности к оцениваемому параметру, т.е. .

    1. 2.2 Общие описательные характеристики.

ОПРЕДЕЛЕНИЕ 2.1. Генеральной средней называется среднее арифметическое значение признаков генеральной совокупности:

, (2.2)

где N – объем генеральной совокупности.

Если х1 встречается N1 раз, х2 N2 раз и т.д., то (2.2) можно переписать в виде:

(2.2)

ОПРЕДЕЛЕНИЕ 2.2. Несмещенной оценкой генеральной средней служит выборочная средняя, определяемая как среднее арифметическое значение признаков выборки (ni частоты появления признака):

или (2.3)

Средняя величина позволяет сделать вывод о центральном или наиболее общем значении, найденном для совокупности данных. Мера рассеяния (дисперсия) показывает, насколько данные распределены относительно среднего значения признака.

Показатели асимметрии иллюстрируют степень левосторонней асимметрии или правосторонней асимметрии, т.е. положительной или отрицательной «скошенности» в распределении частот.

Показатели уровня «островершинности» или «плосковершинности» в распределении частот называются эксцессами.

ОПРЕДЕЛЕНИЕ 2.3. Момент k-ого порядка относительно исходной величины А находится как:

(2.4)

При А=0, k=1 формула (2.4) станет формулой для определения средней арифметической;

При А – среднем значении, k=2, формула (2.4) станет формулой для определения дисперсии;

При А – среднем значении, k=3, по формуле (2.4) будет определятся мера скошенности;

При А – среднем значении, k=4, (2.4) – момент, измеряющий эксцесс.

ОПРЕДЕЛЕНИЕ 2.4. Модой называется это наиболее часто наблюдаемая величина случайной переменной, обозначается М0.

ОПРЕДЕЛЕНИЕ 2.5. Медианой называется значение наблюдения, которое находиться в середине ранжированного ряда данных, т.е. наблюдение, занимающее серединное значение, обозначается как Ме.

ПРИМЕЧЕНИЕ: Для определения медианы, сначала данные группируют в возрастающем порядке, затем берут серединное значение, если число данных четно, то берется среднее арифметическое значение серединных значений.

Пример:

1 1 1 1 2 2

Ме =1 – медиана

2.3. Показатели вариации

Зная точку центра распределения, можно узнать, как данные рассеяны вокруг нее.

ОПРЕДЕЛЕНИЕ 2.6. Значения, находящиеся в точках, когда 25% всех значений больше Q1 и 75% меньше Q3, называются соответственно нижними и верхними квартилями. Промежуток между квартилями Q1 и Q3 называется межквартильным промежутком, а его половина квартильным отклонением.

Для несгруппированных данных , , здесь n – число наблюдений в выборке.

ОПРЕДЕЛЕНИЕ 2.7. Процентли (персентили) измеряют относительное положение значений данных путем деления набора данных на 100 одинаковых сегментов.

ОПРЕДЕЛЕНИЕ 2.8. Генеральной дисперсией называют среднее арифметическое квадратов отклонений признака генеральной совокупности от ее среднего значения.

(2.5)

ОПРЕДЕЛЕНИЕ 2.9 Смещенной оценкой генеральной дисперсии служит выборочная дисперсия, определяемая как:

(2.6)

или .

Определение: Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия, определяемая:

(5)

Генеральное среднеквадратичное отклонение определяется соответственно по формулам: , .

Определение: Несмещенной оценкой среднего квадратического отклонения является стандартное отклонение, определяемое по формуле:

ОПРЕДЕЛЕНИЕ 2.10. Коэффициент асимметрии показывает, есть ли смещение («скошенность») в рассеянии данных.

Асимметрия может быть как положительной, так и отрицательной. Когда асимметрии нет, то говорят, что сдвиг в рассеянии данных отсутствует.

положительная асимметрия отрицательная асимметрия

(мода > медиана) (мода < медиана)

Симметрично (сдвига нет)

Коэффициент асимметрии Спирмена определяется как:

(2.7)

Квартильный коэффициент асимметрии (КвКА) определяется по формуле:

(2.8)

Коэффициент асимметрии для сгруппированных данных определяется как:

(2.9)

ОПРЕДЕЛЕНИЕ 2.11. Показатель эксцесса описывает «пиковость» распределения частот. Распределения, имеющие более выраженный пик, называются островершинными. Те же распределения, у которых степень вытянутости вдоль оси ординат меньше, называют плосковершинными.

Плосковершинное Островершинное

Коэффициент эксцесса определяется по формуле:

(2.10)

Задача 2. Дискретная случайная величина Х представлена выборкой объема n. Требуется: составить вариационный ряд; найти медиану Ме и моду Мо; выборочную среднюю; определить коэффициенты асимметрии и эксцесса: 4, 5 ,4, 6, 7, 5, 6, 4, 2, 4, 8, 6, 9, 2, 1, 3, 3, 6, 4, 5, 8, 4, 3, 7, 5, 4, 6, 3, 6, 5, 6, 5, 8, 3, 3, 5, 6, 4, 5, 7, 5, 7, 4, 7, 3, 7, 8, 9.

Решение. Общее число наблюдений в представленном ряде п=48. Составим вариационный ряд, т.е. ряд из упорядоченных по возрастанию наблюдений: 1, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9. Частоты наблюдений распределены следующим образом: «1» – 1, «2» – 2, «3» – 7, «4» – 9, «5» – 9, «6» – 8, «7» – 6, «8» – 4, «9» – 2. Чаще всего встречаются наблюдения «4» и «5», таким образом, случайная величина Х имеет две моды Мо=4 и Мо=5, т.е является бимодально распределенной в отличии от унимодальных, имеющих одну моду, случайных величин. Медиана это значение, находящееся в середине ранжированного ряда, т.е. соответствует порядковому номеру 24 – Ме=5. Определим выборочную среднюю:

Зная выборочную среднюю, вычислим коэффициенты асимметрии и эксцесса:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]