
Математическая статистика
.docГенеральная совокупность – большое множество объектов (в идеале все), обладающие данным признаком; множество значений признака, каждый из которых проявляется у соответствующего объекта.
Выборочная совокупность – выборка – часть генеральной совокупности.
Объём выборки – число отобранных в выборку значений. Обозначается N.
Варианта – одно из значений, отобранных выборку.
Репрезентативная выборка – выборка, точно отражающая основные закономерности генеральной совокупности (случайный отбор вариант, достаточно большой объём).
Простой статистический ряд – последовательность вариант, перечисленная в порядке их получения.
Ранжированный статистический ряд – последовательность вариант, расположенных в порядке их возрастания (убывания).
Вариационный ряд – последовательность расположенных в порядке возрастания вариант с указанием соответствующих им частот.
Относительная частота – отношение абсолютной частоты варианты к объёму выборки. Обозначается: W.
- условие нормировки.
Графическое изображение выборки – полигон частот или относительных частот (ось абсцисс – значения Х, ось ординат – частоты или относительные частоты).
Алгоритм построения интервального вариационного ряда (если N велик):
-
определение размаха распределения Хmax – Xmin
-
определение разумного числа интервалов
-
расчёт ширины интервала (шага разбиения)
-
нахождение границ интервалов
-
подсчёт числа вариант в каждом интервале.
Графическое изображение интервального вариационного ряда – гистограмма частот, относительных частот или плотности – это ступенчатая фигура, состоящая из прямоугольников, основанием каждого прямоугольника является соответствующий интервал, а высота равна частоте, относительной частоте или плотности.
Плотность относительных частот:
(кривая, проведённая через середины вершин всех прямоугольников – аналог кривой распределения)
Характеристики выборки:
Выборочная средняя – среднее арифметическое всех вариант:
Выборочная дисперсия – характеризует рассеяние вариант вокруг среднего значения выборки (вокруг средней выборочной):
Выборочное среднеквадратическое
отклонение:
Мода – наиболее часто встречающаяся варианта. Обозначается Мо.
Медиана – варианта, находящаяся в середине ранжированного ряда, делящая его пополам. Обозначается Ме.
Точечные оценки параметров распределения
(приближ. с погрешностью
и случайные):
Приближённым значением средней
генеральной является средняя выборочная:
Приближённым значением генеральной дисперсии явл. исправленная выб. дисп.
Приближённым значением генерального
среднеквадратического отклонения
является стандартное отклонение:
.
Доверительная вероятность ()
– вероятность того, что параметр
генеральной совокупности будет заключён
в пределах окрестности
своей
точечной оценки.
Доверительный интервал – случайный
интервал с доверительной вероятностью
,
включающий данный параметр.
Интервальная оценка – оценка параметра с помощью указания его доверительного интервала.
Уровень значимости ()
– вероятность того, что доверительный
интервал не включит соответствующий
параметр генеральной совокупности.
.
Алгоритм построения доверительного интервала для средней теоретической нормально распределённой величины:
-
вычислить
-
по заданной
рассчитать значение
-
по значению
в таблице (Стьюдента при малых N) распределения найти значение t.
-
рассчитать точность оценки
по формуле:
-
определить границы доверительного интервала: (
)
Определение минимального объёма
выборки, характеризующего оценку средней
теоретической с заданной точностью и
надёжностью:
«Нулевая» гипотеза – исходная гипотеза.
Критерий – контрольная случайная величина, значения которой зависят от значений сравнивающих параметров.
Наблюдаемые значения – значения, вычисляемые по результатам данной выборки.
Критические значения – значения, определяемые исходя из надёжности.
Критерий согласия Пирсона (хи -
квадрат):
,
где
m – число интервалов
nk – частота
nk/
- теоретическая частота,
,
где
-
вероятность попадания значений
исследуемой величины в к-ый интервал.
Критическое хи-кв. находят по
и по числу степеней свободы
.
Если
,
то гипотеза принимается.
Оценка достоверности различия выборочных средних:
Нулевая гипотеза: мат ожидания одинаковы
Критерий: T – критерий.
,
причём S2 – исправленные
выборочные дисперсии.
Если
,
то гипотеза о равенстве теоретических
средних верна.
Функциональная связь – каждому значению Х соответствует опред. значение У.
Статистическая связь – изменение значений Х ведёт к изменению закона распределения У.
Корреляционная связь – изменение значений одной величины приводит к изменению среднего значения другой.
Коэффициент корреляции
Если k=0,то связи нет. Если
k-
корреляционная связь есть.
Свойства коэффициента корреляции:
.
Если
1
– линейная связь. Если k
> 0 – положит. связь.
Если k < 0 – отрицательная связь.
Выборочный коэффициент корреляции:
Слабая связь – меньше 0,3; сильная – выше 0,7; ост – средняя.
Множественная корреляция – связь между 3 и более величинами – определяют при помощи частного коэффициента корреляции с исключённым влиянием остальных величин.