
- •С.Е.Игнатова математическая статистика
- •Санкт-Петербург
- •Утверждено редакционно-издательским советом сПбГиэу
- •Игнатова с.Е.
- •Содержание:
- •Предисловие
- •Введение
- •1.Генеральная совокупность, выборка и основные способы организации выборки.
- •2.Вариационный ряд и порядковые статистики.
- •3.Статистическое оценивание параметров.
- •4.Точечные оценки и их свойства (несмещенность, состоятельность и эффективность).
- •5.Основные выборочные характеристики и их свойства.
- •5.1.Генеральная и выборочная средние.
- •5.2.Групповая и общая средние.
- •5.3.Отклонение от общей средней и его свойство.
- •5.4.Генеральная и выборочная дисперсии.
- •5.5.Групповая, внутригрупповая, межгрупповая и общая дисперсии.
- •5.6.Сложение дисперсий.
- •6.Основные точечные оценки.
- •6.1.Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних.
- •6.2.Оценка генеральной дисперсии по исправленной выборочной.
- •7.Законы распределения выборочных характеристик в нормальной генеральной совокупности.
- •7.1.Число степеней свободы.
- •7.2.Распределение хи-квадрат.
- •7.3.Распределение Стьюдента.
- •7.4.Распределение Фишера-Снедекора.
- •8.Интервальные оценки и доверительные области.
- •8.1.Оценка вероятности (биноминального распределения) по относительной частоте.
- •8.2.Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении.
- •8.3.Доверительный интервал для оценки среднего квадратического отклонения нормального распределения.
- •9.Байесовское статистическое оценивание.
- •10.Статистическая проверка гипотез: основные типы гипотез и общая логическая схема статистического критерия; характеристики качества критерия.
- •10.1.Общая логическая схема статистического критерия
- •10.2.Характеристики качества критерия.
- •11.Критерии согласия и однородности, проверка гипотезы о числовых значениях параметров.
- •11.1.Критерий однородности.
- •Например, рассмотрим непараметрический критерий сдвига.
- •11.2.Критерий согласия.
- •11.3.Методика вычисления теоретических частот нормального распределения:
- •11.4.Пример обработки массива статистических данных.
- •11.5.Сравнение двух дисперсий нормальных генеральных совокупностей
- •12.Неравенство информации, метод максимального правдоподобия и метод моментов.
- •12.1.Метод максимального правдоподобия
- •12.2.Неравенство информации
- •12.3.Эмпирические моменты
- •12.4.Метод моментов.
- •13.Основы статистического исследования зависимостей.
- •13.1.Регрессионный анализ.
- •13.1.1.Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным.
- •13.1.2.Выборочный коэффициент корреляции.
- •13.1.3.Корреляционная таблица.
- •13.1.4.Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным.
- •13.1.5.Выборочное корреляционное отношение.
- •13.1.6.Свойства выборочного корреляционного отношения.
- •13.1.7.Простейшие случаи криволинейной корреляции.
- •13.1.8.Понятие о множественной корреляции.
- •13.2.Дисперсионный анализ.
- •13.2.1.Общая, факторная и остаточная суммы квадратов отклонений
- •13.2.2.Связь между общей, факторной и остаточной суммами.
- •13.2.3.Общая, факторная и остаточная дисперсии.
- •13.2.4.Сравнение нескольких средних методом дисперсионного анализа.
- •13.2.5.Неодинаковое число испытаний на различных уровнях фактора.
- •Заключение
- •Список литературы:
- •Сведения об авторе
13.1.8.Понятие о множественной корреляции.
Определение: Корреляцию называют множественной, если исследуется связь между несколькими признаками.
В простейшем случае число признаков равно трем и связь между ними линейная: z = ax + by + c.
В этом случае возникают задачи:
Найти по данным наблюдений выборочное уравнение связи вида
z = Ax + By + C, (1)
т.е. требуется найти коэффициенты регрессии A и B и параметр C.
2) Оценить тесноту связи между Z и обоими признаками X, Y.
3) Оценить тесноту связи между Z и X (при постоянном Y), между Z и Y (при постоянном X).
Укажем пути решения этих задач:
Задача 1 решается методом наименьших квадратов, причем вместо уравнения (1) уравнение связи удобнее искать в виде:
z -
= A
(x
-
)
+ B
(y -
),
где
Здесь rxz , ryz , rxy – коэффициенты корреляции соответственно между признаками X и Z, Y и Z, X и Y; σx , σy , σz – средние квадратические отклонения.
Определение: Выборочным совокупным коэффициентом корреляции называется величина R,
которая оценивает тесноту связи признака Z с признаками X и Y, причем 0 ≤ R ≤ 1.
Определение: Частными выборочными коэффициентами корреляции называются величины
,
которые оценивают тесноту связи между Z и X (при постоянном Y), между Z и Y (при постоянном X) соответственно.
Эти коэффициенты имеют те же свойства и тот же смысл, что и обыкновенный выборочный коэффициент корреляции, т.е. служат для оценки линейной связи между признаками.
13.2.Дисперсионный анализ.
Во многих экономических задачах требуется оценить влияние различных факторов на изучаемую величину X.
Например, разные формы организации производства могут оказывать существенное или несущественное влияние на прибыль фирмы или предприятия.
Другим примером может служить задача оценки эффективности различных видов удобрений. Данный фактор F можно разделить на ряд уровней, в качестве которых могут выступать, например, разные формы организации производства или разные виды удобрений (фактор F – удобрение, а уровни – виды удобрений.).
Суть метода дисперсионного анализа заключается в том, что дисперсия величины X разделяется на две части:
Факторная дисперсия, вызванная действием фактора F.
Остаточная дисперсия, обусловленная случайными причинами.
Если выясняется, что факторная дисперсия невелика по сравнению с остаточной дисперсией, то фактор не оказывает существенного влияния на величину X.
Определение: Если рассматривается один фактор, то дисперсионный анализ называется однофакторным, если более одного – многофакторным.
13.2.1.Общая, факторная и остаточная суммы квадратов отклонений
Рассмотрим схему однофакторного дисперсионного анализа.
Пусть на рассматриваемую величину X влияет фактор F, который имеет p уровней. На каждом уровне, т.е. для одного из видов фактора F, проводятся измерения величины X.
Число таких
измерений для всех уровней одинаково
и равно q.
Пусть наблюдалось
значений
признака
где
–
номер измерения;
– номер уровня фактора.
Составим таблицу полученных измерений. В последней строке помещены средние значения измерений для каждого уровня:
Номер измерения |
F1 |
F2 |
… |
Fp |
1 |
x11 |
x12 |
… |
x1p |
2 |
x21 |
x22 |
… |
x2р |
… |
… |
… |
… |
… |
q |
xq1 |
xq2 |
… |
xqp |
Групп.средняя |
xгр1 |
xгр2 |
… |
xгр.р |
где F1, F2 , …, Fp – уровни фактора,
– общая средняя
величина
Определение: Общей суммой квадратов отклонений наблюдаемых значений xij от общей средней называется величина:
(1)
Определение: Факторной суммой квадратов отклонений групповых средних от общей средней называется величина:
(2),
которая характеризует рассеяние «между группами».
Определение: Остаточной суммой квадратов отклонений наблюдаемых значений группы от своей групповой средней, называется величина:
(3),
которая характеризует рассеяние «внутри группы».