- •Казанский кооперативный институт (филиал)
- •Теория вероятностей и математическая статистика конспект лекций
- •Общие организационно-методические рекомендации преподавателю
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Предмет и задачи теории вероятностей
- •2. Основные понятия теории вероятностей. События и соотношения между ними. Классификация событий
- •3. Частота и вероятность события. Способы определения вероятности
- •Аксиомы теории вероятностей
- •Лекция 2 Основные формулы для вычисления вероятностей
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Основные формулы для вычисления вероятностей
- •6. (Рисунок 4).
- •7. (Рисунок 5).
- •Задание на самостоятельную работу
- •Лекция 3 Основные теоремы теории вероятностей: сложение, умножение, формула полной вероятности
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Правила сложения вероятностей
- •2. Правила умножения вероятностей
- •3. Формула полной вероятности
- •1. Формула Байеса, вероятность появления хотя бы одного события
- •Лекция 5 Основные законы распределения дискретных случайных величин. Формула Бернулли
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Понятие о случайной величине и законе её распределения
- •Р исунок 1
- •Р исунок 3
- •2. Формы закона распределения случайной величины: ряд распределения, функция распределения, функция плотности распределения
- •3. Формула Бернулли
- •Задание на самостоятельную работу
- •Лекция 6 Основные законы распределения дискретных случайных величин. Локальная теорема Муавра-Лапласа, формула Пуассона
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Локальная теорема Муавра-Лапласа
- •2. Распределение Пуассона
- •Задание на самостоятельную работу
- •Лекция 7 Основные законы распределения дискретных случайных величин. Интегральная теорема Лапласа
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1.1 Определение вероятности попадания случайной величины х с использованием приведенной табличной функции распределения
- •1.2 Определение вероятности попадания случайной величины на заданный интервал с использованием табличной функции плотности распределения
- •1.3 Определение вероятности попадания случайной величины на заданный интервал с использованием таблиц приведенной функции Лапласа
- •Текст лекции
- •1. Понятие случайной величины
- •2. Законы распределения дискретных случайных величин
- •Задание на самостоятельную работу
- •Лекция 9 Числовые характеристики: математическое ожидание, дисперсия, среднеквадратическое отклонение
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Понятие о числовых характеристиках случайной величины
- •2. Числовые характеристики положения: математическое ожидание и его основные свойства
- •3. Числовые характеристики рассеивания: дисперсия, среднеквадратическое отклонение. Основные свойства дисперсии
- •Задание на самостоятельную работу
- •Лекция 10 Непрерывные случайные величины: функция распределения случайной величины
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Функция распределения непрерывной случайной величины для определения вероятности попадания случайной величины на интервал
- •1.1. Функция распределения непрерывной случайной величины
- •1.2. Свойства функции распределения
- •Задание на самостоятельную работу
- •Лекция 11 Плотность вероятности. Числовые характеристики. Моменты случайных величин
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Плотность распределения непрерывной случайной величины для определения вероятности попадания случайной величины на интервал
- •1.1. Плотность распределения
- •1.2. Свойства плотности распределения
- •2.5. Медиана
- •2.6. Начальный момент
- •2.7. Центральный момент
- •2.8. Коэффициент асимметрии
- •2.9. Эксцесс
- •Задание на самостоятельную работу
- •Лекция 12 Законы распределения непрерывных величин: нормальное, равномерное, показательное
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Равномерное распределение
- •2. Показательное распределение
- •2.1. Функция надёжности
- •3. Нормальный закон распределения
- •3.1. Функция Лапласа
- •3.2. Правило трёх сигм
- •Задание на самостоятельную работу
- •Лекция 13 Понятие закона больших чисел
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •Закон больших чисел
- •1.1. Неравенство Чебышева
- •1.2. Теорема Чебышева
- •1.3. Теорема Бернулли
- •1.4. Теорема Пуассона
- •1.5. Предельные теоремы
- •1.6. Теорема Муавра – Лапласа
- •Текст лекции
- •1. Генеральная и выборочная совокупности
- •1.1. Статистическое описание результатов наблюдений
- •Текст лекции
- •1. Интервальные оценки параметров распределения. Непрерывное и дискретное распределения признаков
- •1.2. Интервальные оценки.
- •Текст лекции
- •1. Вариационные ряды
- •2. Построение интервального вариационного ряда
- •3. Графическое изображение вариационных рядов
- •4. Средние величины
- •5. Медиана и мода
- •6. Показатели вариации
- •7. Свойства эмпирической дисперсии
- •8. Эмпирические центральные и начальные моменты
- •9. Эмпирические асимметрия и эксцесс
- •Текст лекции
- •1. Доверительные вероятности, доверительные интервалы
- •Текст лекции
- •1. Корреляционный анализ
- •1.1. О связях функциональных и статистических
- •1.2. Определение формы связи. Понятие регрессии
- •1.3. Основные положения корреляционного анализа
- •1.4. Свойства коэффициента корреляции
- •1.5. Поле корреляции. Вычисление оценок параметров двумерной модели
- •1.6. Проверка гипотезы о значимости коэффициента корреляции
- •1.7. Корреляционное отношение
- •1.8. Понятие о многомерном корреляционном анализе
- •1.9. Ранговая корреляция
- •2. Регрессионный анализ
- •2.1. Основные положения регрессионного анализа
- •2.2. Линейная регрессия
- •2.3. Нелинейная регрессия
- •2.4. Оценка значимости коэффициентов регрессии. Интервальная оценка коэффициентов регрессии
- •2.5. Интервальная оценка для условного математического ожидания
- •2.6. Проверка значимости уравнения регрессии
- •2.7. Многомерный регрессионный анализ
- •2.8. Факторный анализ
- •Приложения
- •Функция Лапласа
- •Задание на самостоятельную работу
4. Средние величины
Средние величины являются как бы «представителями» всего ряда наблюдений, поскольку вокруг них концентрируются наблюдавшиеся значения признака. Заметим, что только для качественно однородных наблюдений имеет смысл вычислять средние величины.
Различают несколько видов средних величин: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая, средняя кубическая и т.д. При выборе вида средней величины необходимо прежде всего ответить на вопрос: какое свойство ряда мы хотим представить средней величиной или, иначе говоря, какая цель преследуется при вычислении средней? Это свойство, получившее название определяющего, и определяет вид средней. Понятие определяющего свойства впервые введено советским статистиком А. Я. Боярским.
Наиболее распространенной средней величиной является средняя арифметическая. Пусть — данные наблюдений; — средняя арифметическая. Свойство, определяющее среднюю арифметическую, формулируется следующим образом: сумма результатов наблюдений должна остаться неизменной, если каждое из них заменить средней арифметической, т.е.
.
(2)
Так
как
=const,
то
.
Отсюда получаем
следующую формулу для вычисления средней
арифметической по данным наблюдений:
(3)
Если по наблюдениям построен вариационный ряд, то средняя арифметическая
(4)
где х — вариант, если ряд дискретный, и центр интервала, если ряд интервальный; тх — соответствующая частота.
Частоты тх в формуле (4) называют весами, а операцию умножения х на тх — операцией взвешивания. Среднюю арифметическую, вычисленную по формуле (4), называют взвешенной в отличие от средней арифметической, вычисленной по формуле (3).
Очевидно, что если по данным наблюдений построен дискретный вариационный ряд, то формулы (3) и (4) дают одинаковые значения средней арифметической. Если же по наблюдениям построен интервальный ряд, то средние арифметические, вычисленные по формулам
(3) и (4), могут не совпадать, так как в формуле (4) значения признака внутри каждого интервала принимаются равными центрам интервалов. Ошибка, возникающая в результате такой замены, вообще говоря, очень мала, если наблюдения, распределены равномерно вдоль каждого интервала, а не скапливаются к одноименным границам интервалов (т.е. либо все к нижним границам, либо все к верхним границам).
Среднюю арифметическую для вариационного ряда можно вычислять по формуле
(5)
которая является следствием формулы (4). Действительно,
Свойство,
определяющее среднюю арифметическую,
сводилось к требованию неизменности
суммы наблюдений при замене каждого из
них средней арифметической. При решении
практических задач может оказаться
необходимым вычислить такую среднюю
,
при замене
которой каждого наблюдения, осталась
бы неизменной сумма
q-x
степеней
наблюдений, т.е. чтобы
(6)
где q — положительное или отрицательное число. Среднюю называют степенной средней q-го порядка. Из определяющего свойства (6) получим следующую формулу для вычисления по данным наблюдений:
(7)
Сравнивая
формулы (7) и (3), можно сделать вывод, что
степенная средняя первого порядка есть
не что иное, как средняя арифметическая,
т.е.
.
При q=-1 из формулы (7) получаем выражение для средней гармонической, при q=2 — для среднеквадратической, при q=3 — для средней кубической и т.д.
Средней
геометрической
называют
корень n-й
степени из произведения наблюдений
.
Можно доказать, что средняя геометрическая
является предельным случаем степенной
средней q-го
порядка при
q=0,
т.е.
Рассмотрим основные свойства средней арифметической.
1°. Сумма отклонений результатов наблюдений от средней арифметической равна нулю.
Доказательство. Исходя из определяющего свойства (2) средней арифметической, получаем
Если по результатам наблюдений построен вариационный ряд и средняя арифметическая взвешенная, то свойство 1° формулируется так: сумма произведений отклонений вариантов от средней арифметической на соответствующие частоты равна нулю. Действительно, на основании формулы (4) получаем
или
2°. Если все результаты наблюдений уменьшить (увеличить) на одно и то же число, то средняя арифметическая уменьшится (увеличится) на то же число. (Доказательство свойств 2° и 3° проведём в предположении, что по результатам наблюдений построен вариационный ряд и средняя арифметическая — взвешенная).
Доказательство. Очевидно, что при уменьшении вариантов на одно и то же число с соответствующие им частоты останутся прежними. Поэтому взвешенная средняя арифметическая для изменённого вариационного ряда такова:
Аналогично
можно показать, что
Это свойство
позволяет среднюю арифметическую
вычислять не по данным вариантам, а по
уменьшенным (увеличенным) на одно и то
же число с.
Если среднюю арифметическую, вычисленную
для измененного ряда, увеличить
(уменьшить) на число
с, то получим
среднюю арифметическую для первоначального
вариационного ряда.
3°. Если все результаты наблюдений уменьшить (увеличить) в одно и то же число раз, то средняя арифметическая уменьшится (увеличится) во столько же раз.
Доказательство. Очевидно, что при уменьшении вариантов в k раз их частоты останутся прежними. Поэтому средняя арифметическая для изменённого ряда
Аналогично
можно доказать, что
Рассмотренное
свойство позволяет среднюю арифметическую
вычислять не по данным вариантам, а по
уменьшенным (увеличенным) в одно и то
же число k
раз. Если
среднюю арифметическую, вычисленную
для изменённого ряда, увеличить
(уменьшить) в
k
раз, то получим
среднюю арифметическую для первоначального
вариационного ряда.
4°. Если ряд наблюдений состоит из двух групп наблюдений, то средняя арифметическая всего ряда равна взвешенной средней арифметической групповых средних, причём весами являются объёмы групп.
Пусть
и
число
наблюдений соответственно в 1-й и 2-й
группах;
— средняя арифметическая для всего
ряда (
+
)
наблюдений;
и
—
средние арифметические соответственно
для 1-й и 2-й групп наблюдений. Требуется
доказать, что
Доказательство.
Исходя из определяющего свойству средней
арифметической, имеем: произведение
равно сумме
наблюдавшихся
значений признака;
равно сумме
наблюдавшихся значений, образующих
первую группу:
равно сумме п2
наблюдавшихся значений, образующих
вторую группу. Следовательно,
Следствие.
Если ряд наблюдений состоит из k
групп
наблюдений, то средняя арифметическая
всего ряда
равна взвешенной средней арифметической
групповых средних
причём
весами являются объёмы групп
5°. Средняя арифметическая для сумм (разностей) взаимно соответствующих значений признака двух рядов наблюдений с одинаковым числом наблюдений равна сумме (разности) средних арифметических этих рядов.
Пусть
—
один ряд наблюдений,
— его средняя
арифметическая;
—
другой ряд наблюдений,
— его средняя арифметическая
—
ряд сумм соответствующих наблюдений,
—
его средняя арифметическая. Требуется
доказать, что
.
Доказательство. Имеем
Аналогично
можно показать, что
.
Следствие. Средняя арифметическая алгебраической суммы соответствующих значений признака нескольких рядов наблюдений с одинаковым числом наблюдений равна алгебраической сумме средних арифметических этих рядов.
Вычисление
средней арифметической вариационного
ряда непосредственно по формуле (4)
приводит к громоздким расчётам, если
числовые значения вариантов и
соответствующие им частоты велики.
Поэтому часто используют следующий
способ, основанный на свойствах 3° и 2°
средней арифметической: среднюю вычисляют
не по первоначальным вариантам
х, а по
уменьшенным на не которое число с,
а затем разделённым на некоторое число
k,
т.е. для вариантов
х'=(х — с)/к.
Зная среднюю арифметическую
для измененного
ряда, легко вычислить среднюю арифметическую
для первоначального ряда:
(8)
Действительно, принимая во внимание свойства 3° и 2° средней арифметической, получаем
откуда
следует, что
Очевидно,
что от выбора числовых значений с
и k
зависит,
насколько простым будет вычисление
средней арифметической для измененного
ряда. Значения
с и
k
обычно выбирают
так, чтобы новые варианты
х'=(х-с)/k
были небольшими целыми числами. Если
ряд дискретный, то в качестве
с берётся
вариант, занимающий серединное положение
в вариационном ряду (если таких вариантов
два, то за с
принимается тот, которому соответствует
большая частота); за k
принимают
наибольший общий делитель вариантов
(х-с). Если
ряд интервальный, то его заменяют
дискретным; тогда
с — центр
серединного интервала (если таких
интервала два, то берётся тот, которому
соответствует большая частота); за
k
принимают
длину интервала
h.
