
- •Как вычисляются основные числовые характеристики по результатам выборки: «группа средних». Объяснить на примерах.
- •1.3 Средние величины: средняя, средневзвешенная, мода Мо, медиана Ме. Показатели вариации: дисперсия, среднее квадратическое отклонение, коэффициент вариации.
- •14. Приведите примеры зависимых и независимых событий
- •16. Дайте возможные определения вероятности. Приведите примеры их использования.
- •17. Что такое относительная частота события, как она связана с вероятностью?
- •18. Что такое случайная величина (св)? Какие виды св известны?
- •26. В каких случаях применяют формулу Байеса? (Показать на примерах)
- •27. В каких случаях применяют формулу Бернулли? (Показать на примерах)
- •§ 1. Испытания Бернулли.
- •§ 2. Наивероятнейшее число успехов.
- •Если число np-q - дробное, то существует одно наивероятнейшее число m*;
- •Если число np-q - целое, то существует два наивероятнейших числа
- •28. В каких случаях применяют формулу Пуассона? (Показать на примерах)
- •29. Что такое функция распределения св? Что такое плотность вероятности св? Приведите ее свойства.
- •30. Как рассчитывается вероятность попадания св в определенный интервал с помощью функции распределения, с помощью плотности вероятности?
- •36 Что такое дерево вероятностей? Сформулируйте правила построения и проверки корректности дерева вероятностей?
- •37. Какая выборка называется репрезентативной? Каким образом можно извлечь репрезентативную выборку?
- •38. Какой интервал мы называем доверительным?
- •39 Что называется уровнем доверительности (confidence level)?
- •40. Какой из двух доверительных интервалов больше: двусторонний 99% или двусторонний 95%? Объясните.
1.3 Средние величины: средняя, средневзвешенная, мода Мо, медиана Ме. Показатели вариации: дисперсия, среднее квадратическое отклонение, коэффициент вариации.
Среднее значение (иногда называемое показателем позиции или показателем центра) является наиболее важным специальным статистическим показателем, используемым для обобщения данных. Среднее значение дает представление о наиболее «типичном» или «центральном» значении в интервале изменения переменной. Часто опубликованные материалы, например отчеты предприятий, содержат средние значения различных переменных. Например, средняя заработная плата, средний объем выпуска, средняя Продолжительность рабочей недели и средний объем продаж — все эти термины часто встречаются в той или иной форме. При рассмотрении такого рода статистических показателей особое внимание следует уделить точному выяснению методики расчета указанных средних. Имеется несколько таких методов, и каждый из них зачастую дает различные результаты. В данном разделе описаны три наиболее часто используемые в большинстве практических ситуаций «средние».
Определение. Средняя — это статистический показатель «середины» или «центра» исследуемых данных.
Средняя арифметическая
Средняя арифметическая, или, обычно, просто средняя, используется наиболее часто для определения среднего значения. Более того, для многих людей средняя — это единственное рассматриваемое значение. Основное достоинство использования данного показателя состоит в наличии стандартной математической формулы. Данный факт, по крайней мере, обеспечивает объективность полученных значений. Далее приведены несколько примеров расчета средней арифметической.
Определение. Средняя арифметическая получается путем деления суммы всех значений на их количество.
Пример 1
Недельный доход каждого из пяти работников составляет соответственно: 400, 350, 520, 440 и 490 ф. ст.
Средняя арифметическая этих значений получается путем деления суммы значений на их количество. Таким образом,
Следовательно, средний недельный доход для данной группы работников составляет 440 ф. ст. В общем виде, при n значениях x среднее рассчитывается по формуле
(буква греческого алфавита «сигма»)
означает «сумма». Таким образом, формула
читается как сумма х,
деленная на n.
При
наличии таблицы частот, средняя
рассчитывается по следующей
формуле:
Рассмотрим приведенную ниже таблицу частот, содержащую данные невыходов на работу за последние 20 дней.
Количество отсутствовавших
:
1 2 3 4 5
Количество дней отсутствия
:
4 7 5 2 2
Среднее значение количества отсутствовавших в день рассчитывается путем деления суммы значений на количество дней. В данной таблице отмечено 4 дня, когда было только по одному отсутствовавшему, 7 дней — по 2 и т. д.
.
Мода
Средняя набора значений может быть получена путем определения моды. Моду можно коротко определить как значение, наиболее часто встречающееся в наборе данных. Это наиболее «типичное» значение среди данных, и часто его считают более репрезентативным, т.е. более достоверным, нежели среднюю арифметическую. На последующих примерах мы рассмотрим порядок получения моды на основании данных, представленных в том или ином виде.
Определение. Мода — это средняя, получаемая путем установления наиболее часто встречающегося значения в наборе данных.
Пример. Нижеприведенные значения показывают количество работников, отсутствовавших на работе за период в 10 дней:
3, 5, 2, 1, 4, 3, 2, 0, 3, 6
Здесь видно, что наиболее часто встречается цифра 3. Отсюда мода равняется 3 работникам. Таким образом, среднее количество работников, отсутствовавших на работе, можно определить как равное 3.
Пример. В таблице приведено количество отсутствовавших на работе за последние три недели (21 день):
Количество отсутствовавших: 0 1 2 3 4
Количество дней 2 8 6 3 2
Из таблицы частот следует, что чаще всего (8 дней) отсутствовало по одному работнику.
Таким образом, мода равняется 1 работнику. Как видно на примере такой простой таблицы частот, определение моды не представляет труда. Мы просто находим и соотносим ее со значением соответствующей переменной. Однако если таблица частот содержит интервалы группировки, то процесс определения становится более сложным.
Медиана
Еще один способ определения среднего значения набора данных заключается в получении медианы. В ряде случаев это наиболее приемлемый и очевидный вариант выявления центрального значения. В буквальном смысле, медиана — это срединное значение при условии, что данные выстроены в ранжированном порядке. На последующих примерах вы познакомитесь со способом определения медианы.
Определение. Медиана — это среднее, полученное путем выявления «центрального» значения в перечне данных, расположенных в ранжированном порядке.
Пример.
Рассмотрим таблицу частот, отображающую количество невыходов на работу за период в три недели (21 день):
Количество отсутствовавших: 01234
Количество дней: 2 8 6 3 2
Согласно
данной таблице, общее количество дней
равно n
=
= 21.
Отсюда медиана = [(n + 1)/2]-е или [(21 + 1)/2]-е = 11-е значение.
Теперь необходимо из этих данных выбрать 11-е значение. Есть 2 дня, в которые не отмечено невыходов; есть 8 дней, в которые отмечено по 1 невыходу. Следовательно, первые десять значений — это 0 или 1. Таким образом, 11-е значение — это 2. Итак, медиана равна 2-м работникам.
Дисперсия
Иногда значение дисперсии приводится как мера вариации вместо среднеквадратического отклонения. Это значение — просто квадрат среднеквадратического отклонения. Так, его можно получить по следующей формуле:
Дисперсию можно использовать при проведении сложного анализа при объединении различных наборов данных. Значения дисперсии могут быть объединены напрямую, а значения среднеквадратического отклонения — нет.
Однако достоинство среднеквадратического отклонения состоит в том, что оно дается в единицах измерения анализируемой переменной, например в ф. ст., если мы рассматриваем доход или заработную плату. Обычно, в большинстве случаев, предпочтение отдается среднеквадратическому отклонению.
Определение. Дисперсия — это мера вариации, получаемая путем возведения в квадрат среднеквадратического отклонения.
Среднеквадратическое отклонение
Одной
из наиболее важных характеристик
вариации является значение
среднеквадратического отклонения,
обычно обозначаемое
или
.
Основное достоинство
среднеквадратического отклонения
состоит в том, что его можно рассчитать
с помощью объективной математической
формулы, а не путем оценочных
методов, как в случае с межквартильным
размахом. Среднеквадратическое
отклонение выборки значений можно
рассчитать по следующей формуле:
Среднеквадратическое отклонение
.
Как вариант, Среднеквадратическое отклонение может быть рассчитано на основании данных таблиц частот с помощью одной из следующих формул:
Среднеквадратическое
отклонение
Определение. Среднеквадратическое отклонение есть мера вариации, получаемая путем извлечения квадратного корня из средней суммы квадратов отклонений между каждым значением и арифметической средней.
Коэффициент вариации
При рассмотрении различных распределений с существенно отличными значениями арифметической средней для проведения более реалистичного сравнения применяется коэффициент вариации. Например, распределение с большим значением арифметической средней, вероятно, даст большую вариацию. То есть, базовое сравнение вариации с помощью среднеквадратического отклонения или квартилей может и не дать какой-либо дополнительной информации. Коэффициент вариации позволяет сравнить вариацию относительно величины рассматриваемых данных. Значение получается следующим образом:
О
Полученное значение дает среднеквадратическое отклонение в процентах от арифметической средней. Например, рассмотрим следующие наборы данных:
Таблица показывает, что среднее значение Б больше среднего значения А. Кроме того, разброс данных Б больше, чем разброс данных А. Однако когда мы рассчитаем коэффициент вариации для каждого набора данных, нам предстанет иная картина: ;
Данные
А:
коэффициент вариации = 50/200
100
= 25%.
Данные Б: коэффициент вариации — 60/300 100 = 20%.
Анализ показывает, что при соотнесении со средними значениями вариация в Б меньше, чем в А.
Следует отметить, что в отличие от других значений, представленных в данном разделе, коэффициент вариации не является «овеществленной» мерой разброса. Например, при рассмотрении заработной платы большинство показателей выражены в используемой денежной единице, скажем, в фунтах стерлингов. В противоположность этому коэффициент вариации не зависит от используемой единицы измерения.
11. Классическое определение вероятности.
Вероятность события – это оценка шансов наступления события.
Если число
– число всех исходов испытания, а
– число исходов, благоприятствующих
событию А, то вероятность
наступления
события
находится по формуле:
.
Свойства вероятности.
1. Вероятность достоверного события равна 1.
.
2. Вероятность невозможного события равна 0.
.
3. Вероятность события удовлетворяет неравенству:
.
12. Приведите примеры случайных событий в экономике. Можно ли дать им вероятностное описание?
Под событием понимается явление, которое происходит, в результате осуществления какого-либо определённого комплекса условий будем называть опытом или испытанием.
Определение. Случайным называется событие, которое может произойти или не произойти в результате некоторого испытания (опыта).
События обычно обозначают заглавными буквами латинского алфавита A,B,C,…и т.д.
13. Приведите примеры совместных и несовместных событий.
Определение. События A и В называются несовместными, если в результате данного испытания появление одного из них исключает появления другого.
Определение. События A и В называются совместными, если в результате данного испытания появление одного из них не исключает появления другого.
Пример. Появление на верхней грани кубика трёх очков исключает появление шести очков, при одном испытании – несовместное событие.
Пример. Выпадение четного числа очков и выпадение числа очков, равного 6 – совместное событие.