
- •Содержание
- •Введение
- •I.Статистический анализ
- •§1.1. Основные понятия выборочного метода
- •§1.2. Законы распределения непрерывных случайных величин. Нормальное распределение
- •§1.3.Оценка параметров распределения
- •§ 1.4. Статистическая проверка гипотез
- •Тесты для самоконтроля Составьте краткие ответы на следующие вопросы
- •Характеристика тестов
- •II. Корреляционный и регрессионный анализ
- •§2.1. Система случайных величин
- •§ 2.2. Основы корреляционного анализа
- •§ 2.3. Регрессия. Линии среднеквадратической регрессии
- •§ 2.4. Выборочное уравнение регрессии
- •§ 2.5. Основы дисперсионного анализа
- •§ 2.6. Нелинейная корреляционная связь
- •Тесты для самоконтроля Составьте краткие ответы на вопросы
- •Характеристика тестов
- •III.Многомерный статистический анализ
- •§3.1. Основные характеристики многомерной генеральной совокупности
- •§ 3.2. Множественная корреляция
- •§ 3.3. Множественное уравнение регрессии
- •Тесты для самоконтроля
- •Характеристика тестов
- •IV. Статистический анализ в Excel
- •§ 4.1.Очистка информации от засорения
- •§ 4.2. Проверка закона распределения.
- •§ 4.3. Корреляционный анализ
- •§4.4. Регрессионный анализ двумерной модели.
- •§4.5. Регрессионный анализ трехмерной модели.
- •V. Содержание и объем курсовой работы
- •VI. Литература
- •Статистические данные.
- •Варианты заданий к работе « Статистический анализ»
Тесты для самоконтроля Составьте краткие ответы на следующие вопросы
Предмет математической статистики – уровень 1.
Две основные задачи математической статистики – уровень 1.
Вариационный ряд дискретной и непрерывной случайной величины – уровень 1.
Статистическое распределение и его виды – уровень 1.
Теоретическая и эмпирическая функции распределения – уровень 1.
Кривая распределения и гистограмма – уровень 1.
Плотность распределения вероятностей – уровень 1.
Числовые характеристики дискретных и непрерывных случайных величин – уровень 1.
Законы распределения непрерывных случайных величин – уровень 1.
Свойства нормального распределения – уровень 3.
Асимметрия и эксцесс нормального распределения – уровень 2.
Два способа оценки параметров распределения – уровень 2.
Требования к статистической оценке параметра распределения – уровень 2.
Точеные оценки числовых характеристик генеральной совокупности – уровень 2.
Интервальные оценки параметров распределения – уровень 2.
Что такое доверительная вероятность? – уровень 2.
Что такое доверительный интервал? – уровень 2.
Доверительные интервалы для неизвестного математического ожидания нормально распределенной случайной величины – уровень 3.
Что собой представляет задача статистической проверки гипотез? – уровень 2.
Основная и конкурирующая гипотезы – уровень 1.
Ошибки первого и второго рода при проверке статистических гипотез – уровень 2.
Что такое статистический критерий? – уровень 1.
Критическая область и критические точки – уровень 2.
Уровень значимости и критические точки – уровень 2.
Общая схема проверки гипотез – уровень 3.
Статистический критерий и проверка статистических данных на «выбросы»– уровень 3.
Характеристика тестов
Всего вопросов – 26;
Количество вопросов уровня 1 – 11; уровня 2 – 11; уровня 3 – 4.
Количество баллов за вопрос
уровня 1 – 1;
уровня 2 – 2;
уровня 3 – 3.
Количество баллов за раздел 1 – 45.
II. Корреляционный и регрессионный анализ
§2.1. Система случайных величин
Случайные величины, возможные значения которых определяются двумя и более числами, называются двумерными, трехмерными ,…, n - мерными. Двумерная случайная величина обозначается ( X, Y ), а величины X и Y называют составляющими ( компонентами). Обе величины X и Y , рассматриваемые одновременно, образуют систему двух случайных величин. И , по аналогии, n – мерную величину можно рассматривать как систему n случайных величин. Различают дискретные и непрерывные многомерные случайные величины.
Законом распределения дискретной двумерной случайной величины называется перечень возможных значений этой величины, т.е. пар чисел (xi,yj) , и их вероятностей p(xi,yj) ( I = 1,2,…, n; j = 1,2,…,m ) . Обычно закон распределения задают в виде таблицы с двумя входами, в которой по строкам располагают значения Y, а по столбцам значения X, а в клетке , соответствующей (xi,yj), указывается вероятность p(xi,yj) . Очевидно, что
P(xi)
=
; P(yj)
=
;
=1
Функцией распределения двумерной случайной величины ( X,Y ) называют функцию F(x,y), определяющую вероятность того, что X примет значение, меньшее x, и при этом Y примет значение, меньшее y:
F (x, y) = P ( X < x, Y < y)
Функция распределения есть неубывающая функция по обоим аргументам, значения которой меняются в пределах от 0 до 1.
Плотностью совместного распределения вероятностей f ( x, y ) двумерной непрерывной случайной величины ( X , Y) называют вторую смешанную частную производную от функции распределения
Плотность распределения одной из составляющих двумерной случайной величины находится по формуле:
f1(
x )
=
;
f2(
y )
=
Для характеристики зависимости между составляющими двумерной дискретной случайной величины вводится понятие условного распределения. Если, допустим, в результате испытания величина Y приняла значение Y = yj , при этом X примет одно из своих возможных значений x1, x2, … , xn . Условная вероятность того, что X примет значение xi при условии, что Y приняло значение yj , обозначается так: p ( xi | yj ). Условным распределением составляющей X при Y = yj называют совокупность условных вероятностей p( xi | yj )(i = 1,2,…,n), вычисленных в предположении, что событие
Y = yj уже наступило. Аналогично определяется условное распределение составляющей Y . Зная закон распределения двумерной случайной величины, можно найти условные законы распределения составляющих:
p ( xi | yj ) = p( xi ,yj ) / p ( yj ) ; p ( yj | xi ) = p( xi, yj ) / p ( xi )
Сумма
вероятностей условного распределения
равна 1:
.
Условной плотностью φ ( x | y ) распределения составляющих X при данном значении Y = y называют отношение плотности совместного распределения f ( x, y ) системы ( X, Y ) к плотности распределения f2 ( y ) составляющей Y : f( x | y ) = f( x, y ) / f2 ( y )
и аналогично определяется условная плотность распределения составляющей Y при данном значении X = x :
f( y | x ) = f( x, y ) / f1 ( x )
Отличие условной плотности f( x | y ) от безусловной плотности f1(x) состоит в том, что функция f( x | y ) дает распределение X при условии, что составляющая Y приняла значение Y = y ; функция f1(x) дает распределение X независимо от того, какие из возможных значений приняла составляющая Y. Аналогичные рассуждения справедливы и для условной и безусловной плотности f( y | x ) и f2 ( y ).
Условным
математическим ожиданием
дискретной случайной величины Y
при X
= x
, где x
– определенное возможное значение X
, называют сумму произведений возможных
значений Y
на их условные вероятности:
M
( Y
| X
= x)
=
Для непрерывной случайной величины
M
( Y
| X
= x)
=
,
где f( y | x ) – условная плотность случайной величины Y при X = x. Аналогично определяется условное математическое ожидание X при Y=y.
Условное математическое ожидание M(Y | x ) является функцией от x: M ( Y | x ) = f ( x ), которую называют функцией регрессии Y на X. Аналогично определяется условное математическое ожидание случайной величины X и функция регрессии X на Y: M ( X | y ) = φ ( y ).
Для описания системы двух случайных величин, кроме числовых характеристик составляющих, используют корреляционный момент и коэффициент корреляции.