
- •Министерство образования и науки Российской Федерации
- •Введение
- •1. Элементы математической логики
- •1.1. Высказывания и операции над ними
- •1.2. Формулы логики высказываний. Равносильность формул
- •1.3. Предикаты и кванторы
- •Упражнения
- •2. Теория множеств
- •2.1. Основные понятия
- •2.2. Операции над множествами
- •Упражнения
- •3. Комбинаторика
- •3.1. Общие правила комбинаторики
- •3.2. Размещения, сочетания и перестановки без повторения (без возвращения)
- •3.3. Размещения, сочетания и перестановки с повторением (с возвращением)
- •Упражнения
- •4. Теория вероятностей
- •4.1. Историческая справка
- •4.2. Случайные события
- •4.3. Определения вероятности
- •4.4. Операции над вероятностями
- •4.5. Формула полной вероятности. Формула Байеса.
- •Формула Байеса.
- •Упражнения
- •5. Элементы математической статистики
- •5.1 Понятие случайной величины
- •5.2. Виды распределений
- •5.3 Числовые характеристики случайной величины
- •Упражнения
- •6. Обработка результатов эксперимента
- •6.1. Основные положения
- •6.2. Способы представления экспериментальных данных
- •2. Графическое представление экспериментальных данных.
- •6.3. Понятие о корреляционной зависимости
- •Упражнения
- •7. Лабораторные работы (краткое содержание)
- •Математические основы шкалирования. Формы представления информации
- •Формы представления информации
- •Закон нормального распределения и его характеристика
- •Корреляционный анализ
- •Регрессионный анализ (линейная регрессия)
- •Некоторые методы математической обработки экспериментальных данных
- •Бронникова Лариса Михайловна
- •Колмогорова Валентина Мироновна
- •Основы математической
- •Обработки информации
2. Графическое представление экспериментальных данных.
Для наглядности результатов эксперимента используется их графическое представление: гистограмма, полигон частот и полигон накопленных частот.
Гистограмма – это примыкающие друг к другу прямоугольники. Основание каждого прямоугольника есть ширина группировки hi. а высота - ni. если все hi одинаковые. На графике гистограммы основания прямоугольников откладываются по оси Ох, а высоты по оси Оy.
ni
12
11
9
7
6
3
2
24,9
25,7 26,5 27,3 28,1 28,9 29,7
30,5 x
Рис. 1. Гистограмма с равными интервалами
Если hi
не одинаковые, то по оси Оу
откладывается Pi,
где Pi
= ,
т.е. высоты прямоугольников должны быть
пропорциональны величинам Pi
.
Pi
12
10
5
24,9 25,7 26,5 27,3 28,1 29,7 30,5 x
Рис. 2. Гистограмма с объединенными интервалами
На рисунке 1 гистограмма построена по данным таблицы 3 с равными интервалами. На рисунке 2 интервалы взяты не одинаковые (два объединили), поэтому по оси Оу откладывали Pi.
Полигон частот – это ломаная линия, соединяющая точки, соответствующие срединным значениям интервалов группировки.
ni
12
11
9
7
6
3
2
0 25,3 26,1 26,9 27,7 28,5 29,3 30,1 хсi
Рис. 3. Полигон частот
На оси Ох отложены срединные значения, по оси Оу – частоты. Из сравнения двух способов следует, что для получения полигона частот из построенной гистограммы нужно соединить середины сторон отрезками. На рис 1 график полигона частот построен пунктиром.
Полигон накопленных частот получается при соединении отрезком прямых точек. координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам. По оси ОХ границы интервалов, по оси ОУ - накопленные частоты.
nхi
50
40
30
20
10
0 24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x
Рис.4. Полигон накопленных частот
Получили более плавную линию по сравнению с полигоном частот.
Числовые характеристики выборки дают количественные представления об эмпирических данных и позволяют сравнивать их между собой. Остановимся на некоторых из них подробнее. К характеристикам положения относятся: среднее арифметическое, медиана, мода. Они определяют положение центра эмпирического распределения.
Среднее арифметическое
– одна из основных характеристик
выборки и представляет собой такое
значение признака, сумма отклонений
от которого выборочных значений признака
равна нулю. Геометрически среднее
арифметическое можно определить как
точку на оси Ох,
которая является абсциссой центра масс
гистограммы и обозначается .
Для несгруппированных
данных среднее арифметическое
определяется по формуле:
, (3.1), где n
– объём выборки, хi
– варианты
выборки.
Пример.
Для оценки уровня физической подготовленности студентов 1-го курса педагогического вуза были выбраны прыжки в длину с места. Результаты контрольной группы студентов в количестве 15 человек оказались следующими (в см): 213, 224, 225, 210, 226, 230, 201, 224, 230, 227, 228, 252, 238, 232, 246. Определить средний результат.
Для
сгруппированных
данных
среднее арифметическое определяется
по следующей формуле:
,
(3.2), где n
– объём выборки, ni
– частоты интервалов, хi
– срединные
значения интервалов.
Пример:
n хсi ni ni
хi 1 2 3 4 5 6 7 25,3 26,1 26,9 27,7 28,5 29,3 30,1 3 6 12 11 9 7 2 75,9 156,6 322,8 304,7 252,5 203,1 60,2 сумма 1375,8
Медианой называется
такое значение признака X, когда одна
половина значений экспериментальных
данных меньше её, а вторая половина
больше. Если объем выборки невелик, то
для вычисления медианы выборку ранжируют,
т. е. располагают в порядке возрастание
или убывания и вычисляют порядковый
номер R
(ранг) медианы по формуле: .
Пусть, например, имеется ранжированная выборка n=11:
13, 15, 16. 19, 19, 22, 23,
25, 27, 27, 29. Тогда ;
Ме = 22 (6-ой член ряда).
При n
= 8: 12, 15, 16, 18, 22, 24, 25, 27; .
Медианой в этом
случае может быть любое число между 18
и 22 (четвертым и пятым членами ряда). Ме
= .
Для сгруппированных
данных вначале находят медианный
интервал, т.е. интервал, в котором
находится медиана. Медианным будет тот
интервал. в котором накопленная частота
окажется больше
(n
– объем выборки) или накопленная
частость больше
.
Внутри медианного интервала медиана
ищется по формуле:
,
где
Хмен - нижняя граница медианного интервала;
0,05n – 1/2 объема выборки;
h – ширина интервала группировки;
nхмв -1 - накопленная частота интервала, предшествующего медианному;
nме - частота медианного интервала.
Найдем медиану,
в предыдущем примере. Медиана содержится
в интервале (27,3; 28,0), которому соответствует
накопленная частота 32, а =25.
Me
= 27,3 + 0,8
= 27,6; Ме = 27,6 (мин)
Медиана несколько отличается от среднего арифметического, так как имеет место несимметрическая форма эмпирического распределения.
Как было сказано выше, мода представляет собой значение признака, встречающееся в выборке наиболее часто. Интервал группировки с наибольшей частотой называется модальным. Мода ищется по формуле:
где
Хмон - нижняя граница модального интервала;
h - ширина интервала группировки;
nмо - частота модального интервала:
nмо – 1 - частота интервала, предшествующего модальному.
nмо + 1 - частота интервала, следующего за модальным.
Для предыдущего
примера имеем Мо
= 26,5+0,8
27,2. Тогда Мо
= 27,2 (мин).