- •Содержание
- •Введение
- •РазделI. Статистические методы обработки данных
- •Глава 1. Вариационные ряды и их характеристики
- •1.1. Первичная обработка результатов наблюдений
- •1.2. Графическое представление статистических данных
- •1.3. Расчет выборочных характеристик статистического распределения
- •1.4. Интервальные (доверительные) оценки параметров распределения
- •Контрольные вопросы
- •Глава 2. Проверка статистических гипотез
- •2.1. Построение кривой нормального распределения
- •2.2. Классический метод проверки гипотез
- •2.3. Проверка гипотез о законе распределения
- •Критерий Пирсона
- •Критерий Колмогорова
- •Контрольные вопросы
- •Глава 3. Парная регрессия и корреляция
- •3.1. Понятие функциональной, статистической и корреляционной зависимости
- •3.2. Линейная модель парной регрессии и корреляции
- •3.3. Нелинейные модели парной регрессии и корреляции
- •Контрольные вопросы
- •Глава 4. Множественная регрессия и корреляция
- •4.1.Спецификация модели. Отбор факторов при построении уравнения множественной регрессии
- •4.2. Метод наименьших квадратов (мнк). Свойства оценок на основе мнк
- •4.3. Проверка существенности факторов и показатели качества регрессии
- •Контрольные вопросы
- •Раздел II. Лабораторный практикум
- •Выполнение работы
- •Лабораторная работа № 2. Построение модели линейной регрессии (случай несгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 3. Построение уравнения модели линейной регрессии (случай сгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 4. Изучение модели нелинейной регрессии
- •Выполнение работы
- •Лабораторная работа № 5. Построение модели множественной регрессии
- •Выполнение работы
- •Лабораторная работа № 6. Прогнозирование. Анализ аддитивной модели
- •Выполнение работы
- •Варианты индивидуальных заданий Варианты заданий к лабораторной работе № 1.
- •Варианты заданий к лабораторной работе № 2.
- •Варианты заданий по лабораторной работе № 3
- •Варианты заданий по лабораторной работе № 4
- •Варианты заданий к лабораторной работе № 5.
- •Варианты заданий к лабораторной работе № 6.
- •Тестовые задания
- •Список литературы
- •Приложения
- •Статистические методы обработки данных
- •Библиотечно-издательский комплекс
- •625000, Тюмень, ул. Володарского, 38. Типография библиотечно-издательского комплекса.
- •625039, Тюмень, ул. Киевская, 52.
1.2. Графическое представление статистических данных
В статистике принято изображать статистическое распределение графически с помощью полигона и гистограммы.
Полигоном
частот называется ломаную, отрезками
которой соединяются точки с координатами
(рис. 1.1); а полигоном частостей –
ломаную с координатами
,
где
,
[1] (рис. 1.2).
Рис. 1.1. Полигон частот
Рис. 1.2. Полигон частностей
Полигон предназначен для графического изображения дискретного статистического ряда. Полигон частостей в теории вероятностей является аналогом многоугольника распределения дискретной случайной величины.
Графическим изображением интервального ряда является гистограмма.
Гистограмма
частот (частостей) - это ступенчатая
фигура, состоящая из прямоугольников,
основания которых расположены на оси
и длины равны длинам частичных интервалов
,
а высоты отношению
- для гистограммы частот (рис. 1.3) и
– для гистограммы частостей.
Площадь гистограммы частот равна , а гистограммы частостей всегда равна единице.
Рис. 1.3. Гистограмма частот
Полигон для интервального ряда можно построить в том случае, если преобразовать его в дискретный ряд. Тогда интервалы заменяются их серединными значениями и ставятся в соответствие интервальные частоты и частости. Полигон получается соединением отрезками середины верхних оснований прямоугольников гистограммы.
Вариационные
ряды графически можно изобразить в виде
кумулятивной кривой (кривой сумм
– кумуляты). При построении
кумуляты дискретного вариационного
ряда по оси абсцисс откладываются
варианты
,
а по оси ординат - соответствующие им
накопленные частоты
.
Соединяя точки ( ; ) отрезками, получаем ломаную, которую называют кумулятой (рис. 1.4). Для получения накопленных частот и дальнейшего построения точек ( ; ) составляется расчетная табл. 1.5.
Таблица 1.5
Варианты,xi |
x1 |
x2 |
. . . |
xk |
Относительные частоты, wi= ni/ n |
n1 |
n2 |
. . . |
nk |
Накопленные относительные частоты, Wi = Wi – 1 + wi |
n1 / n |
n2 / n |
. . . |
nk/ n |
При построении кумуляты интервального вариационного ряда левому концу первого интервала сопоставляется частота, равная нулю, а правому – частота этого интервала. Правому концу второго интервала соответствует накопленная частота первых двух интервалов, то есть сумма частот этих интервалов и т. д. Правая граница последнего интервала равна сумме всех частот, то есть объему nвыборки.
Рис. 1.4. Кумулята и эмпирическая функция распределения
1.3. Расчет выборочных характеристик статистического распределения
Для характеристики важнейших свойств статистического распределения используют средние показатели, называемые выборочными числовыми характеристиками. К числу данных показателей относятся:
- выборочная средняя;
- выборочная дисперсия;
- выборочное среднее квадратическое отклонение;
- выборочные структурные средние;
- выборочные начальные и центральные моменты;
- асимметрия, эксцесс.
Выборочной
средней
называют среднее арифметическое всех
значений изучаемой выборки:
- если результаты наблюдений не сгруппированы:
(1.10)
- если результаты сгруппированы в дискретный вариационный ряд:
.
(1.11)
Выборочную среднюю можно записать как:
,
(1.12)
где
– частость.
В случае интервального статистического ряда в качестве следует брать середины интервалов, а – соответствующие им частоты.
Выборочной
дисперсией
принято называть среднее арифметическое
квадратов отклонений значений выборки
от выборочной средней
:
- если результаты наблюдений не сгруппированы:
(1.13)
- если результаты наблюдений сгруппированы в дискретный вариационный ряд:
(1.14)
или
.
(1.15)
Выборочное среднее квадратическое отклонение выборки определяется на основании формулы:
.
(1.16)
Особенность выборочного среднего квадратического отклонения заключается в том, что оно измеряется в тех же единицах, что и данные выборки.
В
случае, когда объем выборки достаточно
невелик (
)
пользуются исправленной выборочной
дисперсией, которая определяется на
основании формулы:
.
(1.17)
Соответственно,
величину
называют исправленным средним
квадратическим отклонением.
Для анализа вариационных рядов вычисляют такие статистики, как моду и медиану.
Модой
называют варианту, которая имеет
наибольшую частоту. Например, для
вариационного ряда:
xi |
6 |
14 |
21 |
27 |
ni |
12 |
29 |
21 |
9 |
мода
равна
.
Медианой
–
значение случайной величины, приходящееся
на середину ряда.
Если
,
где
– объем выборки, то есть ряд имеет четное
число членов, то медиана находится на
основании формулы:
.
(1.18)
Например, для следующего вариационного ряда:
xi |
10 |
13 |
18 |
23 |
25 |
31 |
ni |
4 |
8 |
3 |
5 |
4 |
2 |
медиана
равна
.
Если
ряд имеет нечетное число членов, то есть
,
то медиана равна серединному члену
вариационного ряда:
.
(1.19)
Например, для вариационного ряда
xi |
6 |
14 |
18 |
21 |
27 |
ni |
12 |
29 |
25 |
21 |
9 |
медиана
равна
.
Показатели средней выборочной и выборочной дисперсии являются частным случаем более общего понятия - момента статистического ряда.
Начальный выборочный момент порядка l - это среднее арифметическое l- ых степеней всех значений исследуемой выборки:
(1.20)
или
.
(1.21)
Из представленного определения следует, что начальным выборочным моментом первого порядка является:
.
(1.22)
Центральным
выборочным моментом порядка
называют среднее арифметическое l-
ыхстепеней отклонений наблюдаемых
значений выборки от выборочной средней
:
(1.23)
или
.
(1.24)
Таким образом, центральным выборочным моментом второго порядка является:
.
(1.25)
Выборочным
коэффициентом асимметрииназывают
число
,
которое определяется на основании
формулы:
.
(1.26)
Выборочный коэффициент асимметрии является характеристикой асимметрии полигона вариационного ряда – в случае если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем вторая.
Если
,
то более пологий «спуск» полигона
наблюдается слева от центра и асимметрию
называют левосторонней; в противном
случае
-
справа от цента и асимметрию называют
правосторонней.
Выборочный
коэффициент эксцесса (коэффициент
крутости) позволяет сравнить на
«крутость» выборочное распределение
с нормальным распределением. Выборочным
коэффициентом эксцесса или
коэффициентом крутости называется
число
,
которое определяется на основании
формулы:
.
(1.27)
Важно
заметить, что коэффициент эксцесса для
случайной величины, распределенной по
нормальному закону, равен нулю. В связи
с чем, за стандартное значение выборочного
коэффициента эксцесса принимается
.
В случае, когда
полигон имеет более «пологую» вершину
в сравнении с нормальной кривой; когда
- полигон более «крутой» в сравнении с
нормальной кривой.
При
больших количествах значений вариантов
(
)
и соответствующих им частот, расчет
выборочной средней, дисперсии и выборочных
моментов по приведенным формулам
приводит к громоздким вычислениям.
Поэтому для их вычисления используются
условные варианты
,
определяемые на основании формулы:
,
(1.28)
где C = MoX, h — шаг (длина интервала).
Для вычисления числовых характеристик выборки составляется расчетная табл. 1.6.
Таблица 1.6
|
|
|
|
|
|
|
контрольный столбец
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
строка сумм: |
= |
= |
= |
= |
= |
= |
= |
Контроль вычислений осуществляется на основании выражения:
.
С помощью сумм, полученных в нижней строке таблицы 6.1, вычисляют условные моменты на основании формул:
,
(1.29)
,
(1.30)
,
(1.31)
.
(1.32)
Числовые характеристики выборки вычисляют на основании ниже представленных формул:
;
(1.33)
;
(1.34)
; (1.35)
; (1.36)
, (1.37)
где
и
находим по формулам:
- условного центрального момента третьего порядка:
,
(1.38)
- условного центрального момента четвертого порядка:
.
(1.39)
Для характеристики колеблемости признака Х используют относительный показатель - коэффициент вариации V, который вычисляют по формуле:
.
(1.40)
Величина коэффициента вариации показывает степень сгруппированности значений около центра рассеяния – чем ближе значение показателя к нулевому значению, тем теснее сгруппированы значения признака около центра рассеяния.
