
- •С.Е.Игнатова математическая статистика
- •Санкт-Петербург
- •Утверждено редакционно-издательским советом сПбГиэу
- •Игнатова с.Е.
- •Содержание:
- •Предисловие
- •Введение
- •1.Генеральная совокупность, выборка и основные способы организации выборки.
- •2.Вариационный ряд и порядковые статистики.
- •3.Статистическое оценивание параметров.
- •4.Точечные оценки и их свойства (несмещенность, состоятельность и эффективность).
- •5.Основные выборочные характеристики и их свойства.
- •5.1.Генеральная и выборочная средние.
- •5.2.Групповая и общая средние.
- •5.3.Отклонение от общей средней и его свойство.
- •5.4.Генеральная и выборочная дисперсии.
- •5.5.Групповая, внутригрупповая, межгрупповая и общая дисперсии.
- •5.6.Сложение дисперсий.
- •6.Основные точечные оценки.
- •6.1.Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних.
- •6.2.Оценка генеральной дисперсии по исправленной выборочной.
- •7.Законы распределения выборочных характеристик в нормальной генеральной совокупности.
- •7.1.Число степеней свободы.
- •7.2.Распределение хи-квадрат.
- •7.3.Распределение Стьюдента.
- •7.4.Распределение Фишера-Снедекора.
- •8.Интервальные оценки и доверительные области.
- •8.1.Оценка вероятности (биноминального распределения) по относительной частоте.
- •8.2.Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении.
- •8.3.Доверительный интервал для оценки среднего квадратического отклонения нормального распределения.
- •9.Байесовское статистическое оценивание.
- •10.Статистическая проверка гипотез: основные типы гипотез и общая логическая схема статистического критерия; характеристики качества критерия.
- •10.1.Общая логическая схема статистического критерия
- •10.2.Характеристики качества критерия.
- •11.Критерии согласия и однородности, проверка гипотезы о числовых значениях параметров.
- •11.1.Критерий однородности.
- •Например, рассмотрим непараметрический критерий сдвига.
- •11.2.Критерий согласия.
- •11.3.Методика вычисления теоретических частот нормального распределения:
- •11.4.Пример обработки массива статистических данных.
- •11.5.Сравнение двух дисперсий нормальных генеральных совокупностей
- •12.Неравенство информации, метод максимального правдоподобия и метод моментов.
- •12.1.Метод максимального правдоподобия
- •12.2.Неравенство информации
- •12.3.Эмпирические моменты
- •12.4.Метод моментов.
- •13.Основы статистического исследования зависимостей.
- •13.1.Регрессионный анализ.
- •13.1.1.Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным.
- •13.1.2.Выборочный коэффициент корреляции.
- •13.1.3.Корреляционная таблица.
- •13.1.4.Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным.
- •13.1.5.Выборочное корреляционное отношение.
- •13.1.6.Свойства выборочного корреляционного отношения.
- •13.1.7.Простейшие случаи криволинейной корреляции.
- •13.1.8.Понятие о множественной корреляции.
- •13.2.Дисперсионный анализ.
- •13.2.1.Общая, факторная и остаточная суммы квадратов отклонений
- •13.2.2.Связь между общей, факторной и остаточной суммами.
- •13.2.3.Общая, факторная и остаточная дисперсии.
- •13.2.4.Сравнение нескольких средних методом дисперсионного анализа.
- •13.2.5.Неодинаковое число испытаний на различных уровнях фактора.
- •Заключение
- •Список литературы:
- •Сведения об авторе
13.1.1.Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным.
Пусть имеются две случайные величины Х и Y и проводится их измерение.
Предположим, что каждая пара значений (Х, Y) наблюдалось по одному разу.
В результате n независимых опытов получено n пар чисел:
(
,
),
(
,
),
…, (
,
).
Будем искать линейное выборочное уравнение регрессии Y на Х (для определенности) в виде:
= kx + b. (1)
Так как по выборочным
данным можно получить только оценки
параметров, то оценку коэффициента k
обозначим через
,
а оценку b
– через
,
т.е.
= + . (2)
– выборочный коэффициент регрессии Y на Х .
Подберем параметры и так, чтобы точки ( , ), ( , ), …, ( , ), построенные по данным наблюдений, на плоскости лежали как можно ближе к прямой (2).
Обозначим через
значение величины Y,
соответствующее значению
,
а через
– значение
,
которое можно получить из выражения
(2) при Х
=
.
Подберем параметры и так, чтобы сумма квадратов отклонений ( - ) была минимальной (в этом состоит сущность метода наименьших квадратов).
Возьмем разности
(
-
,
возведем их в квадрат и просуммируем.
Получим функцию:
f(
,
)
=
=
.
Приравнивая
и
к нулю, получаем два уравнения для
определения
и
:
После элементарных преобразований эти уравнения приводятся к виду:
Аналогично находится выборочное уравнение линейной регрессии Х на Y:
=
у
+
,
где
– выборочный коэффициент регрессии Х на Y.
Это можно записать проще, используя обозначения:
=
,
=
=
,
=
,
=
.
Тогда неизвестные параметры выборочного уравнения линейной регрессии Y на Х вычисляются по формулам:
=
,
=
Аналогично вычисляются параметры выборочного уравнения линейной регрессии Х на Y:
=
,
=
.
13.1.2.Выборочный коэффициент корреляции.
Для оценки связи между случайными величинами обычно используется выборочный коэффициент корреляции. Сначала дадим определение выборочного эмпирического корреляционного момента (или просто корреляционного момента).
Определение: Выборочным эмпирическим корреляционным моментом называется величина:
=
,
где и – выборочные средние.
Рассмотрим эту формулу. Раскроем скобки и учтем, что
=
n
,
= n
.
Тогда получаем:
=
(
–
)
=
(
–
n
–
n
+ n
)
=
=
(
–
).
Таким образом получаем компактную и удобную для вычисления формулу:
–
.
Определение: Выборочным коэффициентом корреляции называется величина:
=
.
Пример: В магазине одежды в течение пяти дней подсчитывали число покупок рубашек Х и курток Y. По данным наблюдений составлена таблица:
|
10 |
20 |
25 |
28 |
30 |
|
4 |
8 |
7 |
12 |
14 |
Найти выборочное уравнение линейной регрессии Y на Х и выборочный коэффициент корреляции.
Решение: Составим таблицу вычислений.
Номер опыта i |
|
|
|
|
|
1 |
10 |
4 |
100 |
40 |
16 |
2 |
20 |
8 |
400 |
160 |
64 |
3 |
25 |
7 |
625 |
175 |
49 |
4 |
28 |
12 |
784 |
336 |
144 |
5 |
30 |
14 |
900 |
420 |
196 |
|
113 |
45 |
2809 |
1131 |
469 |
Вычислим параметры выборочного уравнения линейной регрессии Y на Х:
=
= 0,447,
=
= -1,1.
Получаем уравнение:
=0,447
х
– 1,1.
Теперь вычислим составляющие формулы выборочного коэффициента корреляции:
=
= 22,8,
=
=
=93,8,
D(Х)
=
-
=
–
= 51,04,
D(Y)
=
-
=
-
= 12,8,
=
7,14,
=
3,58.
Теперь вычисляем выборочный коэффициент корреляции:
=
= 0,89.