
- •С.Е.Игнатова математическая статистика
- •Санкт-Петербург
- •Утверждено редакционно-издательским советом сПбГиэу
- •Игнатова с.Е.
- •Содержание:
- •Предисловие
- •Введение
- •1.Генеральная совокупность, выборка и основные способы организации выборки.
- •2.Вариационный ряд и порядковые статистики.
- •3.Статистическое оценивание параметров.
- •4.Точечные оценки и их свойства (несмещенность, состоятельность и эффективность).
- •5.Основные выборочные характеристики и их свойства.
- •5.1.Генеральная и выборочная средние.
- •5.2.Групповая и общая средние.
- •5.3.Отклонение от общей средней и его свойство.
- •5.4.Генеральная и выборочная дисперсии.
- •5.5.Групповая, внутригрупповая, межгрупповая и общая дисперсии.
- •5.6.Сложение дисперсий.
- •6.Основные точечные оценки.
- •6.1.Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних.
- •6.2.Оценка генеральной дисперсии по исправленной выборочной.
- •7.Законы распределения выборочных характеристик в нормальной генеральной совокупности.
- •7.1.Число степеней свободы.
- •7.2.Распределение хи-квадрат.
- •7.3.Распределение Стьюдента.
- •7.4.Распределение Фишера-Снедекора.
- •8.Интервальные оценки и доверительные области.
- •8.1.Оценка вероятности (биноминального распределения) по относительной частоте.
- •8.2.Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении.
- •8.3.Доверительный интервал для оценки среднего квадратического отклонения нормального распределения.
- •9.Байесовское статистическое оценивание.
- •10.Статистическая проверка гипотез: основные типы гипотез и общая логическая схема статистического критерия; характеристики качества критерия.
- •10.1.Общая логическая схема статистического критерия
- •10.2.Характеристики качества критерия.
- •11.Критерии согласия и однородности, проверка гипотезы о числовых значениях параметров.
- •11.1.Критерий однородности.
- •Например, рассмотрим непараметрический критерий сдвига.
- •11.2.Критерий согласия.
- •11.3.Методика вычисления теоретических частот нормального распределения:
- •11.4.Пример обработки массива статистических данных.
- •11.5.Сравнение двух дисперсий нормальных генеральных совокупностей
- •12.Неравенство информации, метод максимального правдоподобия и метод моментов.
- •12.1.Метод максимального правдоподобия
- •12.2.Неравенство информации
- •12.3.Эмпирические моменты
- •12.4.Метод моментов.
- •13.Основы статистического исследования зависимостей.
- •13.1.Регрессионный анализ.
- •13.1.1.Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным.
- •13.1.2.Выборочный коэффициент корреляции.
- •13.1.3.Корреляционная таблица.
- •13.1.4.Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным.
- •13.1.5.Выборочное корреляционное отношение.
- •13.1.6.Свойства выборочного корреляционного отношения.
- •13.1.7.Простейшие случаи криволинейной корреляции.
- •13.1.8.Понятие о множественной корреляции.
- •13.2.Дисперсионный анализ.
- •13.2.1.Общая, факторная и остаточная суммы квадратов отклонений
- •13.2.2.Связь между общей, факторной и остаточной суммами.
- •13.2.3.Общая, факторная и остаточная дисперсии.
- •13.2.4.Сравнение нескольких средних методом дисперсионного анализа.
- •13.2.5.Неодинаковое число испытаний на различных уровнях фактора.
- •Заключение
- •Список литературы:
- •Сведения об авторе
13.1.6.Свойства выборочного корреляционного отношения.
Выборочное
корреляционное отношение
обладает
теми же свойствами, что и
.
Поэтому рассмотрим
,
которое далее, для упрощения записи,
будем обозначать
и, для простоты речи, называть
«корреляционным отношением».
Свойство 1:
Корреляционное
отношение удовлетворяет неравенству
0
.
Доказательство:
, т.к.
.
Докажем, что
Разделим обе части этого равенства на :
1 =
+
1=
+
Т.к. оба слагаемых неотрицательны и их сумма равна 1, то каждое из них не превышает 1, т.е., в частности, η2 ≤ 1.
Итак, 0 ≤ η ≤ 1.
Свойство 2: Если η = 0, то признак Y с признаком X корреляционной зависимостью не связан.
Доказательство: η = . = 0. А это означает, что σмежгр= 0, следовательно, Dмежгр = 0.
Межгрупповая
дисперсия есть дисперсия условных
(групповых) средних
x
относительно общей средней
.
Тот факт, что Dмежгр = 0 означает, что при всех значениях X условные средние сохраняют постоянное значение, равное общей средней. Т.е. при η = 0 условная средняя не является функцией от X, а значит, признак Y не связан корреляционной зависимостью с признаком X.
Заметим, что можно доказать и обратное: если признак Y не связан с признаком X корреляционной зависимостью, то η = 0.
Свойство 3: Если η =1, то признак Y связан с признаком X функциональной зависимостью.
Доказательство: По условию, η = = 1. Это означает, что σобщ.= σмежгр , возводя обе части этого равенства в квадрат, получим:
Dобщ. = Dмежгр. (1)
Т.к. Dобщ. = Dвнгр.+ Dмежгр., то, в силу формулы (1), имеем:
Dвнгр.= 0 (2)
Поскольку внутригрупповая дисперсия есть среднее арифметическое групповых дисперсий (взвешенное по объемам групп), то из формулы (2) следует, что дисперсия каждой группы (т.е. значений Y, соответствующих определенному значению X) равна нулю. А это означает, что в группе содержатся разные значения Y, т.е. каждому значению X соответствует одно значение Y. Следовательно, при η = 1 признак Y связан с признаком X функциональной зависимостью.
Заметим, что можно доказать и обратное: если признаком Y связан с признаком X функциональной зависимостью, то η =1.
Приведем еще два свойства, опустив доказательства.
Свойство 4: η ≥ | |.
Свойство 5: Если η = | |, то имеет место точная линейная корреляционная зависимость.
Другими словами, если η = | |, то точки (x1, y1), (x2, y2), ..., (xn, yn) лежат на прямой линии регрессии, найденной методом наименьших квадратов.
При определении корреляционного отношения форма связи не принималась во внимание, отсюда вытекает его достоинство и недостаток.
Достоинство: η служит мерой тесноты связи любой формы, в том числе и линейной.
Недостаток: η не позволяет судить о том, насколько близко расположены точки, найденные по данным наблюдений, к кривой определенного вида, например к параболе, гиперболе и других.
13.1.7.Простейшие случаи криволинейной корреляции.
Определение: Если график регрессии = ƒ(x) или у = φ(y) изображается кривой линией, то корреляцию называют криволинейной.
Например, функции регрессии Y на X могут иметь вид:
= ax2 + bx + c – параболическая корреляция второго порядка;
= ax3 + bx2 + cx + d – параболическая корреляция третьего порядка.
Для того чтобы определить вид функции регрессии строят точки (x, ) и по их расположению делают заключение о примерном виде функции регрессии. При окончательном решении принимают во внимание особенности, вытекающие из сущности решаемой задачи.
Теория криволинейной корреляции решает те задачи, что и теория линейной корреляции (установление формы и тесноты корреляционной связи).
Рассмотрим параболическую корреляцию второго порядка. Предположим, что данные n наблюдений (выборка) позволяют считать, что имеет место именно такая корреляция. В этом случае выборочное уравнение регрессии Y на X имеет вид:
=Ax2 + Bx + C (1),
где A, B, C – неизвестные параметры.
Пользуясь методом наименьших квадратов, получаем систему линейных уравнений относительно неизвестных параметров (предлагаем вывести ее самостоятельно):
(2)
Найденные из системы (2) параметры A, B, C подставляем в формулу (1), в итоге получаем искомое уравнение регрессии.
Пример: Найти выборочное уравнение регрессии Y на X вида = Ax2 + Bx + C по данным корреляционной таблицы.
Y \ X |
1 |
1,1 |
1,2 |
|
6 |
8 |
2 |
- |
10 |
7 |
- |
30 |
- |
30 |
7,5 |
- |
1 |
9 |
10 |
|
8 |
33 |
9 |
|
|
6 |
6,95 |
7,5 |
|
Решение: Составим расчетную таблицу.
|
|
|
|
|
|
|
|
|
|
1 |
8 |
6 |
8 |
8 |
8 |
8 |
48 |
48 |
48 |
1,1 |
33 |
6,95 |
36,3 |
39,93 |
43,93 |
48,32 |
229,35 |
252,3 |
277,5 |
1,2 |
9 |
7,5 |
10,8 |
12,96 |
15,55 |
18,66 |
67,5 |
81 |
97,2 |
|
50 |
- |
55,1 |
60,89 |
67,48 |
74,98 |
344,85 |
381,3 |
422,7 |
Подставив числа (суммы) нижней строки таблицы в систему (2), получим:
Решив эту систему, получаем: A = 1,94; В = 2,98; С = 1,1. Тогда искомое уравнение принимает вид:
= 1,94x2 + 2,98x + 1,1.
Например, при x1=1
найдем по таблице
= 6, а по уравнению
=1,94 + 2,98 + 1,1 =
6,02.
Таким образом, найденное уравнение хорошо согласуется с данными выборки.