
- •Экзаменационные вопросы по курсу математики
- •Часть I. М а т е м а т и к а
- •§ 1. Множества. Операции. Функция.
- •§ 2. Линейные функции.
- •§ 3. Квадратичные и степенные функции.
- •§ 4. Показательные, логарифмические, обратные и тригонометрические функции
- •§ 5. Пределы и их вычисление
- •§ 6. Понятие дифференциала и производной функции. Вычисление производных
- •§7. Неопределенный интеграл. Интегральное исчисление.
- •§8. Определенный интеграл. Применение определленного интеграла.
- •§9. Матрицы и их использование
- •§10. Понятие о межотраслевом балансе.
- •Часть II. Методические рекомендации по самостоятельной работе
- •Раздел 1. Поиск области определения функции.
- •Раздел 2. Построение графиков функций.
- •Раздел 3. Найти пределы функций.
- •Раздел 4. Вычисление производных.
- •Раздел 5. Найти неопределенный интеграл.
- •Раздел 6. Вычисление определенных интегралов.
- •Раздел 7. Уравнения кривых второго порядка.
- •Раздел 8. Матричные уравнения.
- •Часть III. Элементы общей теории статистики
- •Тема 2. Математические основы статистики.
- •Тема 3. Статистические распределения.
- •Тема 4. Выборочный метод. Корреляционные связи.
- •Тема 5. Индексный метод в исследовании социально-экономических явлений. Социальная статистика.
Тема 3. Статистические распределения.
Если случайным событием при испытаниях по исследованию признака или свойства процесса является получение численных значений этого признака, то говорят о наборе случайных величин (СВ), так как каждое число из набора возможных значений может появиться, а может не появиться в результате проведенного эксперимента. Если СВ принимает любые значения на числовой оси или в заданном условиями интервале, то говорят о непрерывной случайной величине, если же значения определенные, то есть заданы ограничения, то СВ – дискретна. Рассмотрим примеры задания случайных величин.
1. Числа от 1 до 6, нанесенные на гранях куба (гексаэдра) являются примером дискретной случайной величины, если куб использовать в качестве игральной кости (рис.4.1 представляет развертку куба на плоскости).
2. При игре в «Дарс» дискретные величины – это цифры на мишени, фиксируемые случайным образом при бросании «пера» (рис.4.2).Если же на мишени стереть все границы полей, то координаты (x,y) точки А – конца застрявшего пера, будут непрерывными СВ (рис.4.3, т.А).
Рис. 4. Примеры случайных величин
Если для каждого значения СВ удается найти соответствующую вероятность, то совокупность этих значений и соответствующих им вероятностей называют распределением вероятностей. В этом случае распределение можно представить в виде таблицы (табл.6).
Таблица 6
Распределение для СВ
Р
аспределение
общего вида
на грани куба
СВ X x1
x2 x3
…….xi…
xi
1 2 3 4 5 6
Вероятность р р1 р2
р3 …….рi…
рi 1/6 1/6 1/6 1/6
1/6 1/6
Очевидно, что для непрерывной СВ вероятность появления ее точного значения всегда равна нулю, так как она вычисляется отношением нулевых размеров точки к размерам площади не равной нулю. Поэтому имеет смысл сравнивать размеры хотя бы малой площади или интервала Δx к размерам площади или к размерам оси, соответствующим полной группе событий. Если обозначить Δр – вероятность попадания случайной величины x в интервал ее значений Δx, то можно рассчитать вероятность, соответствующую единичному интервалу значений СВ, т.е. вычислить отношение Δр/Δx. По смыслу, данное отношение является плотностью вероятности, которую обозначим символом функции f(x). Наконец, для детального описания необходимо приблизить границы интервала Δx к точке x. При этом, размеры интервала станут бесконечно малыми, но и соответствующая вероятность попадания СВ в этот интервал станет меньше. Тогда можно найти предел отношения Δр/Δx при Δx → 0, и если такой предел существует, то по смыслу он будет характеризовать плотность вероятности, но уже в точке x, принадлежащей бесконечно малому интервалу dx, что кратко запишем следующим образом:
.
С другой стороны, если этот предел существует, то, как было определено в §6, он называется производной и обозначается dp/dx, то есть f(x) = dp/dx. При такой записи каждому бесконечно малому интервалу dx можно поставить в соответствие величину dp – вероятность попадания СВ в этот интервал: dp = f(x)dx. Поэтому функцию f(x) также называют распределением, точнее, дифференциальной функцией распределения вероятностей, но по смыслу плотность вероятности f(x), как и выше, характеризует вероятность появления случайной величины в единичном интервале ее значений.
Для небольших интервалов Δx можно считать, что f(x) практически не меняется на этом интервале и можно записать: Δр = f(x)Δx. Пример, изображенный на рис.6 демонстрирует результат построения распределения f(x), где случайной величиной x является координата точки мишени, а вероятность Δр определяется экспериментально частотой, т.е. количеством точек с координатами, попадающими в Δx случайным образом.
Рис.6. Построение распределения
Из рисунка видно, что вероятность Δр=f(x)Δx численно равна площади заштрихованного столбика и это можно отнести не только к интервалу Δx, но и к любому другому интервалу значений СВ, используя теорему сложения вероятностей для несовместных событий. Если ступеньки станут очень частыми, т.е. когда в пределе Δx можно заменить на dx, экспериментальная диаграмма перейдет в график идеальной функции плотности вероятности, как это представлено на рис.6 (справа). Среди многих функций плотности вероятности распределение, изображенное на рис.6 встречается очень часто и аналитически график этой функции записывается в виде:
Данная функция исследована в рамках математики Гауссом, носит его имя и называется в теории вероятностей нормальным распределением. Входящие в него величины a и σ являются параметрами распределения, а π и е – иррациональные числа.
Рассмотрим полученное распределение вероятностей и выясним его основные характеристики (рис.7).
Рис.7. Нормальное распределение
Так как у плотности вероятности f(x) есть максимум, то соответствующее этому максимуму наиболее вероятное значение СВ называют модой.
Так
как функция f(x)
симметрична, то очевидно, что вычисление
среднего значения x
(обозначается
,
xср
или <x>)
совпадает c линией симметрии.
Если в нормальном распределении сделать замену переменных и ввести новую величину t=(x-a)/σ, т.е. из каждого значения случайной величины x вычесть а, то получится функция
, смещенная в начало координат, так как
теперь ее максимум будет совпадать с
началом координат (при t=0).
Но максимум функции f(t)
совпадет с максимумом f(x),
только если а =
0. Это означает, что величина а
характеризует положение центра симметрии,
т.е. вместе с этой величиной меняется
и среднее значение СВ. Поэтому xср
= а.
Функция
f(t)
отличается от f(x)
еще и тем, что параметр σ
принял значение равное 1. Поэтому, если
в распределении f(x)
величина σ
будет больше 1, то в максимуме функции
(при x
= a)
коэффициент перед экспонентой
е уменьшится и график в точке x
= a
пройдет ниже, чем при σ
= 1. Этот факт будет означать, что доля
значений СВ близких к хср
уменьшилась и, следовательно,
увеличилась доля значений СВ далеких
от х = а.
В этих интервалах график f(x)
пройдет (см.рис.7) выше исходного графика
(с σ = 1). В
результате, разброс СВ от среднего
значения возрастет. Поэтому величина
σ является
мерой разброса или среднеквадратичным
отклонением случайной величины от ее
среднего значения и называется также
стандартным отклонением. Так как в
показателе степени функции Гаусса
фигурирует σ2
, то и эта величина является параметром
распределения и называется дисперсией
(D).
Можно записать, что σ
=
.
Теперь научимся рассчитывать средние характеристики распределений. Начнем с простого примера. Для того, чтобы вычислить среднее значение СВ, появляющейся в результате бросания игральной кости в форме кубика, очевидно, необходимо просуммировать числа, нанесенные на гранях и разделить на общее число граней. Тогда имеем:
и, учитывая, что х1
=1, х2=2,…,
х6
= 6, а р1
= 1/6, р2
= 1/6, …, р6
= 1/6, можно записать формулу
для вычисления среднего значения (его
называют математическим ожиданием
СВ):
,
где i – индекс суммирования по всем значениям СВ.
Если
количество случайных событий равно
, вероятность появления каждого из них
определяется как рi
= mi/n,
а общее число событий равно
,
то среднее значение СВ
,
или, окончательно имеем:
.
Если теперь на гранях кубика вместо каждого значения СВ запишем величину, возведенную в квадрат, то для среднего значения новой случайной величины получим:
,
или в общем случае, имеем:
.
Получили формулу для вычисления среднего значения квадрата случайной величины. Рассуждая аналогичным образом, можно вычислить и дисперсию случайной величины, как ее среднеквадратичное отклонение от среднего значения. В этом случае имеем:
Далее, можно вычислить среднекубическое отклонение СВ и среднее значение четвертой степени отклонения от хср:
,
Для непрерывных случайных величин формулы средних значений трансформируем следующим образом:
вместо xi записываем текущую координату х;
вместо вероятности рi записываем dp=f(x)dx, т.е. вероятность попадания в бесконечно малый интервал dx значений СВ;
вместо суммы
вводим сумму бесконечно малых величин
, которая, как известно, называется интегралом.
В результате имеем еще один набор формул для вычисления средних значений случайной непрерывной величины.
;
;
;
;
.
Для нормального распределения хср= а, D =σ2 , μ3=0, μ4=3. Для других распределений величину μ3/σ3=As называют коэффициентом ассимметрии и этот коэффициент тем больше, чем значительнее нарушена симметрия распределения по сравнению с нормальным. Величину, равную μ4/σ4 –3=Эк называют эксцессом. Эта величина также характеризует нарушение формы кривой («островершинность» или «плосковершинность») по сравнению с нормальным распределением.
При переходе от теоретически рассчитанных вероятностей к частотам, получаемым в эксперименте, важно понять различие между «частотной» плотности вероятности f(x)=Δp/Δx и функцией плотности f(x)=dp/dx. В первом случае, вероятность Δp=f(x)Δx геометрически соответствует размерам площади под графиком (см. рис.6), опирающейся на интервал Δx, а во втором, размеры этой площади бесконечно малы. Так как СВ может попасть или в один интервал Δх1 , или в соседний –Δх2 , или…и т.д., то для поиска вероятности попадания величины х в относительно большой интервал (от а до в на рис.6), необходимо воспользоваться теоремой сложения вероятностей для несовместных событий (если считать, что СВ не может попасть сразу в несколько интервалов). Сложение же бесконечно малых dp, как мы уже говорили ранее, требует умения решать интегралы от функции распределения в заданных пределах. С другой стороны, оценка величины соответствующей вероятности может быть сделана, как в теоретическом, так и в эмпирическом распределении, по размерам площади «столбиков», опирающихся на интервал от а до в (рис.6). Отдельные этапы построения распределений можно понять, анализируя таблицы 3.4, 5.1, 5.2, 5.3 и соответствующие им графики на рис.5.3 (полигон частот) и рис.5.4 (гистограмма), представленные в Приложении II.
По
теореме полной вероятности сумма всех
вероятностей (всех площадей) должна
характеризовать вероятность достоверного
события, т.е. равняться единице, а тогда
и интеграл
=1. (Последнее выражение называют условием
нормировки функции плотности
вероятности). Однако, если экспериментальные
данные оказались ограниченными между
точками хН
-нижней границей экспериментальных
данных и хВ
– верхней границей, то и на графике
функции f(x)
площади, расположенные под графиком
слева от нижней границы и справа от
верхней в расчетах не участвуют
(отброшены). Поэтому вся площадь под
кривой распределения уже не соответствует
100% возможностей, а размеры Δх,
взятые от т.Н до т.В определяют так
называемый доверительный интервал.
Если например, в нормальном распределении
доверительный интервал ограничен
точками хН=хср–σ
и хВ=хср
+ σ, то площадь под графиком
составляет 68,3% от всей площади под кривой
(соответственно, вероятность р(–σ<х–хср<+σ)=
0,683). Если хН=хср–
2σ и хВ=хср+2σ,
то размеры площади «доверия» составляют
95,4%, а при отклонениях х
от хср
равных ±3σ
вызывает наибольшее доверие, т.к.
соответствующая площадь составляет
величину 99,7% от полной площади под кривой
распределения.