- •1. Случайный эксперимент. Пространство исходов. Случайное событие.
- •2. Классическое определение вероятности. Свойства вероятности (из определения). Недостатки определения.
- •3. Основные формулы комбинаторики.
- •4. Геометрическое определение вероятности. Его недостатки. Задача Бюффона. Задача о встрече.
- •5. Частота события. Статистическое определение вероятности. Понятие устойчивости и законе больших чисел. Недостатки определения.
- •6. Алгебра событий. Аксиоматическое определение вероятности. Свойства вероятности из аксиоматического определения.
- •8. Условные вероятности. Теорема умножения вероятности, независимые события. Попарная независимость и независимость в совокупности.
- •9. Вероятность наступления хотя бы одного события.
- •10. Формула полной вероятности. Формула Байеса.
- •11. Схема Бернулли. Формула Бернулли.
- •12. Приближенные формулы для формулы Бернулли: локальная и интегральная формула Муавра-Лапласса. Формула Пуассона.
- •13. Отклонение относительной частоты от постоянной вероятности. Закон больших чисел в формуле Бернулли.
- •14. Случайные величины: дискретные и непрерывные
- •15. Закон распределения дискретной случайной величины. Многоугольник (полигон) распределения.
- •16. Неперывная случайная величина. Функция распределения, ее свойства. Плотность распределения, ее свойства.
- •17. Числовые характеристики случайных величин и их свойства.
- •19. Правило трех сигм
- •22. Эмпирическая функция распределения: полигон и гистограмма.
- •23. Числовые характеристики выборки.
- •28. Коэффициент корреляции. Его основные свойства и статистический смысл.
- •29. Задачи регрессионного анализа. Линейная регрессия.
23. Числовые характеристики выборки.
Вариационные ряды и графики эмпирических распределений дают наглядное представление о том, как варьируется признак в выборочной совокупности. Но они недостаточны для полной характеристики выборки , поскольку содержат много деталей, охватить которые невозможно без применения обобщающих числовых характеристик .
Числовые характеристики выборки дают количественное представление об эмпирических данных и позволяют сравнивать их между собой. Наибольшее практическое значение имеют характеристики положения, рассеяния и асимметрии эмпирических распределений.
Среднее арифметическое представляет собой такое значение признака, сумма отклонений выборочных значений признака от которого равна нулю.
Геометрический смысл среднего арифметического - точка на оси х, которая является абсциссой центра масс гистограммы.
Среднее арифметическое может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.
Для несгруппированных данных:
где n - объем выборки ; xi - варианты выборки. Для сгруппированных данных:
где n - объем выборки; k - число интервалов группировки; ni - частоты интервалов; xi - срединные значения интервалов.
Медианой (Ме) называется такое значение признака X, когда одна половина значений экспериментальных данных меньше ее, а вторая половина - больше.
Для вычисления медианы несгруппированных данных выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как . Если четное число членов в выборке, то медианой будет среднее арифметическое между двумя центральными значениями членов выборки, порядковый номер которых больше и меньше полученного значения ранга медианы.
Для нахождения медианы в случае сгруппированных данных находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частостей. Медианным будет тот интервал, в котором накопленная частота впервые окажется больше n/2 (n - объем выборки) или частость - больше 0,5. Внутри медианного интервала медиана определяется по следующей формуле:
где хMeН - нижняя граница медианного интервала; h - ширина интервалов группировки; nxMe-1 - накопленная частота интервала, предшествующего медианному; nMe - частота медианного интервала.
Мода (Мо) представляет собой значение признака, встречающегося в выборке наиболее часто.
Интервал группировки с наибольшей частотой называется модальным.
Для несгруппированных данных мода - это значение признака с наибольшей частотой появления.
Для определения моды сгруппированных данных используется следующая формула:
,
где xMoH - нижняя граница модального интервала, nMo - частота интервала.
В случае, когда все значения в группе встречаются одинаково часто, принято считать, что группа оценок не имеет моды.
Когда два соседних значения имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений.
Если два несмежных значения в группе имеют равные частоты и они больше частот любого значения, то существуют две моды, а группа оценок является бимодальной.