Описательная статистика: Числовые характеристики случайной величины

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Международный государственный экологический университет им. А. Д. Сахарова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

otvety_stat_metody.docx

Скачиваний:

Добавлен:

24.09.2019

Размер:

1.8 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 233 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 > Следующая >>>

Описательная статистика: Числовые характеристики случайной величины

Медиана – это значение случайной величины, которое делит распределение пополам: половина значений будет больше медианы, половина – не больше.

Процентиль – значение случайной величины, которое делит распределение на соответствующие доли (25%, 75% и т. д.)

Процентной точкой порядка α (α – процентной точкой) распределения называется такое возможное значение x_α этой случайной величины, для которого вероятность события X > x_αравна заданной вероятности α

Квантилем порядка p называется такое возможное значение x_p этой случайной величины, для которого вероятность события X < x_pравна заданной вероятности p

А симметрия

Э ксцесс

Мода – это наиболее часто встречающееся значение случайной величины

В ыборочное среднее, представляющее собой оценку математического ожидания генеральной совокупности:

В ыборочная дисперсия, служащая несмещенной оценкой дисперсии генеральной совокупности:

Выборочное среднеквадратическое (стандартное) отклонение:

Описательная статистика: Точность выборочных оценок

С тандартная ошибка среднего

Анализ резко выделяющихся наблюдений

Речь пойдет об анализе наблюдений, которые сильно отклоняются от центра распределения. Иногда такие большие отклонения возникают в результате случайного просчета, неправильного считывания показаний измерительного прибора, т.е. в результате допущенной грубой ошибки. Иногда большие отклонения отражают более тонкие моменты, такие как несоответствие в отдельных точках используемой математической модели, незамеченное исследователем изменение условий эксперимента и т.п.

В любом случае с математической точки зрения речь идет о выявлении наблюдений, значение которых не согласуется с распределением основной массы данных. Выявление таких наблюдений позволяет обычно еще раз проверить условия регистрации и тем самым выявить и устранить ошибку. Если же ошибку устранить

не удается, то возможно эти наблюдения следует просто исключить из данных как нетипичные (неправдоподобные).

Рассматриваемая задача анализа разделяется на два этапа:1) выявление “подозрительных” наблюдений и 2) проверка статистической значимости их отличия от основной массы данных.

Сложность анализа резко выделяющихся (аномальных) наблюдений заключается в, казалось бы, парадоксальном выводе: чем больше объем выборки, тем с большей вероятностью следует ожидать резких выбросов в наблюдениях.

Существует несколько различных критериев для идентификации резко выделяющихся наблюдений, но все они основываются на предположении о том, что распределение наблюдаемых значений описывается нормальным законом распределения.

Один из критериев основан на статистике

здесь выборочное среднее

s – среднеквадратическое отклонение

Если V < V_кр, торезко выделяющееся значение в выборке нельзя считать промахом и его лучше оставить

Построение гистограммы распределения

Как правило область изменения данных разбивают на m одинаковых интервалов длинной Δx и вычисляется относительная плотность попадания значений в каждый интервал:

Д иаграмму построенную из прямоугольников с основанием Δx и высотами w_k называют гистограммой

Отмечаются наименьшее и наибольшее значения в выборке и диапазон между ними разбивается на m равных интервалов.
Отмечаются крайние точки каждого из интервалов в порядке их возрастания, а также середины интервалов x⁰₁ , x⁰₂ , ..., x⁰_m.
Подсчитывается количество значений данных, попавших в каждый из интервалов: n₁,n₂, ..., n_m.

Г руппированные данные могут быть использованы для оценки математического ожидания и дисперсии:

Построение эмпирической функции распределения

Представление о характере распределения выборочных данных может давать также эмпирическая функция распределения, которой называется функция F(x) определяющая для каждого выборочного значения случайной величины X относительную частоту события X < x:

Здесь n_x число наблюдений меньших X

Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия χ² (хи-квадрат)

Применение многих методов статистической обработки данных предполагает, что результаты наблюдений являются выборкой из генеральной совокупности с вполне определенным законом распределения, например нормальным.

Чтобы оценить, насколько выбранный теоретически закон распределения согласуется с результатами наблюдений, используют так называемые критерии согласия.

В качестве меры расхождения между эмпирическим и теоретическим законами распределения К. Пирсоном была предложена статистика:

Здесь: m ─ число значений, принятых случайной величиной, n – общее число наблюдений, p_k ─ вероятность появления k-го значения в теоретическом законе распределения

Соответствие выбранного теоретического закона распределение результатам наблюдения должно быть отвергнута при уровне значимости α, если полученное в опыте значение статистики c² превысит критическое значение c²_m−1,_α.

Для различного числа степеней свободы и уровня значимости составлены таблицы критических значений c²

Когда вероятность появления k-го значения в теоретическом законе распределения p_k определяются с помощью параметров распределения оцененных по выборке число степеней свободы равно m-s-1. Здесь s – количество параметров теоретического закона распределения оцененных по выборке

<<< < Предыдущая 1 23 / 233 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.09.2019289.79 Кб7MVI-pochva.doc
#
16.11.2019971.26 Кб9obrabotka.doc
#
25.09.201996.86 Кб5otvety_k_testam_moya_redaktsia_pochti_vse.docx
#
21.09.201959.42 Кб4Otvety_OOP.docx
#
19.09.2019259.46 Кб62otvety_po_Operatsionnym_sistemam.docx
#
24.09.20191.8 Mб35otvety_stat_metody.docx
#
25.11.201989.6 Кб4Rak_zheludka_3.doc
#
15.02.20162.01 Mб101referat_informatika_Shuriberko.docx
#
23.09.20194.85 Mб7shp1-7_TsEL_E_33.docx
#
23.09.20191.45 Mб15ShPOR1_16_na_1.docx
#
03.08.2019161.19 Кб125shpory_himia.docx

Описательная статистика: Числовые характеристики случайной величины

Построение гистограммы распределения