- •Министерство образования и науки Российской Федерации
- •Введение
- •1. Элементы математической логики
- •1.1. Высказывания и операции над ними
- •1.2. Формулы логики высказываний. Равносильность формул
- •1.3. Предикаты и кванторы
- •Упражнения
- •2. Теория множеств
- •2.1. Основные понятия
- •2.2. Операции над множествами
- •Упражнения
- •3. Комбинаторика
- •3.1. Общие правила комбинаторики
- •3.2. Размещения, сочетания и перестановки без повторения (без возвращения)
- •3.3. Размещения, сочетания и перестановки с повторением (с возвращением)
- •Упражнения
- •4. Теория вероятностей
- •4.1. Историческая справка
- •4.2. Случайные события
- •4.3. Определения вероятности
- •4.4. Операции над вероятностями
- •4.5. Формула полной вероятности. Формула Байеса.
- •Формула Байеса.
- •Упражнения
- •5. Элементы математической статистики
- •5.1 Понятие случайной величины
- •5.2. Виды распределений
- •5.3 Числовые характеристики случайной величины
- •Упражнения
- •6. Обработка результатов эксперимента
- •6.1. Основные положения
- •6.2. Способы представления экспериментальных данных
- •2. Графическое представление экспериментальных данных.
- •6.3. Понятие о корреляционной зависимости
- •Упражнения
- •7. Лабораторные работы (краткое содержание)
- •Математические основы шкалирования. Формы представления информации
- •Формы представления информации
- •Закон нормального распределения и его характеристика
- •Корреляционный анализ
- •Регрессионный анализ (линейная регрессия)
- •Некоторые методы математической обработки экспериментальных данных
- •Бронникова Лариса Михайловна
- •Колмогорова Валентина Мироновна
- •Основы математической
- •Обработки информации
2. Графическое представление экспериментальных данных.
Для наглядности результатов эксперимента используется их графическое представление: гистограмма, полигон частот и полигон накопленных частот.
Гистограмма – это примыкающие друг к другу прямоугольники. Основание каждого прямоугольника есть ширина группировки hi. а высота - ni. если все hi одинаковые. На графике гистограммы основания прямоугольников откладываются по оси Ох, а высоты по оси Оy.
ni
12
11
9
7
6
3
2
24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x
Рис. 1. Гистограмма с равными интервалами
Если hi не одинаковые, то по оси Оу откладывается Pi, где Pi = , т.е. высоты прямоугольников должны быть пропорциональны величинам Pi .
Pi
12
10
5
24,9 25,7 26,5 27,3 28,1 29,7 30,5 x
Рис. 2. Гистограмма с объединенными интервалами
На рисунке 1 гистограмма построена по данным таблицы 3 с равными интервалами. На рисунке 2 интервалы взяты не одинаковые (два объединили), поэтому по оси Оу откладывали Pi.
Полигон частот – это ломаная линия, соединяющая точки, соответствующие срединным значениям интервалов группировки.
ni
12
11
9
7
6
3
2
0 25,3 26,1 26,9 27,7 28,5 29,3 30,1 хсi
Рис. 3. Полигон частот
На оси Ох отложены срединные значения, по оси Оу – частоты. Из сравнения двух способов следует, что для получения полигона частот из построенной гистограммы нужно соединить середины сторон отрезками. На рис 1 график полигона частот построен пунктиром.
Полигон накопленных частот получается при соединении отрезком прямых точек. координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам. По оси ОХ границы интервалов, по оси ОУ - накопленные частоты.
nхi
50
40
30
20
10
0 24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x
Рис.4. Полигон накопленных частот
Получили более плавную линию по сравнению с полигоном частот.
Числовые характеристики выборки дают количественные представления об эмпирических данных и позволяют сравнивать их между собой. Остановимся на некоторых из них подробнее. К характеристикам положения относятся: среднее арифметическое, медиана, мода. Они определяют положение центра эмпирического распределения.
Среднее арифметическое – одна из основных характеристик выборки и представляет собой такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю. Геометрически среднее арифметическое можно определить как точку на оси Ох, которая является абсциссой центра масс гистограммы и обозначается .
Для несгруппированных данных среднее арифметическое определяется по формуле: , (3.1), где n – объём выборки, хi – варианты выборки.
Пример.
Для оценки уровня физической подготовленности студентов 1-го курса педагогического вуза были выбраны прыжки в длину с места. Результаты контрольной группы студентов в количестве 15 человек оказались следующими (в см): 213, 224, 225, 210, 226, 230, 201, 224, 230, 227, 228, 252, 238, 232, 246. Определить средний результат.
Для сгруппированных данных среднее арифметическое определяется по следующей формуле: , (3.2), где n – объём выборки, ni – частоты интервалов, хi – срединные значения интервалов.
Пример:
n хсi ni ni
хi 1 2 3 4 5 6 7 25,3 26,1 26,9 27,7 28,5 29,3 30,1 3 6 12 11 9 7 2 75,9 156,6 322,8 304,7 252,5 203,1 60,2 сумма 1375,8
Медианой называется такое значение признака X, когда одна половина значений экспериментальных данных меньше её, а вторая половина больше. Если объем выборки невелик, то для вычисления медианы выборку ранжируют, т. е. располагают в порядке возрастание или убывания и вычисляют порядковый номер R (ранг) медианы по формуле: .
Пусть, например, имеется ранжированная выборка n=11:
13, 15, 16. 19, 19, 22, 23, 25, 27, 27, 29. Тогда ;
Ме = 22 (6-ой член ряда).
При n = 8: 12, 15, 16, 18, 22, 24, 25, 27; .
Медианой в этом случае может быть любое число между 18 и 22 (четвертым и пятым членами ряда). Ме = .
Для сгруппированных данных вначале находят медианный интервал, т.е. интервал, в котором находится медиана. Медианным будет тот интервал. в котором накопленная частота окажется больше (n – объем выборки) или накопленная частость больше . Внутри медианного интервала медиана ищется по формуле: , где
Хмен - нижняя граница медианного интервала;
0,05n – 1/2 объема выборки;
h – ширина интервала группировки;
nхмв -1 - накопленная частота интервала, предшествующего медианному;
nме - частота медианного интервала.
Найдем медиану, в предыдущем примере. Медиана содержится в интервале (27,3; 28,0), которому соответствует накопленная частота 32, а =25. Me = 27,3 + 0,8 = 27,6; Ме = 27,6 (мин)
Медиана несколько отличается от среднего арифметического, так как имеет место несимметрическая форма эмпирического распределения.
Как было сказано выше, мода представляет собой значение признака, встречающееся в выборке наиболее часто. Интервал группировки с наибольшей частотой называется модальным. Мода ищется по формуле:
где
Хмон - нижняя граница модального интервала;
h - ширина интервала группировки;
nмо - частота модального интервала:
nмо – 1 - частота интервала, предшествующего модальному.
nмо + 1 - частота интервала, следующего за модальным.
Для предыдущего примера имеем Мо = 26,5+0,8 27,2. Тогда Мо = 27,2 (мин).