Математическая статистика
.docГенеральная совокупность – большое множество объектов (в идеале все), обладающие данным признаком; множество значений признака, каждый из которых проявляется у соответствующего объекта.
Выборочная совокупность – выборка – часть генеральной совокупности.
Объём выборки – число отобранных в выборку значений. Обозначается N.
Варианта – одно из значений, отобранных выборку.
Репрезентативная выборка – выборка, точно отражающая основные закономерности генеральной совокупности (случайный отбор вариант, достаточно большой объём).
Простой статистический ряд – последовательность вариант, перечисленная в порядке их получения.
Ранжированный статистический ряд – последовательность вариант, расположенных в порядке их возрастания (убывания).
Вариационный ряд – последовательность расположенных в порядке возрастания вариант с указанием соответствующих им частот.
Относительная частота – отношение абсолютной частоты варианты к объёму выборки. Обозначается: W.
- условие нормировки.
Графическое изображение выборки – полигон частот или относительных частот (ось абсцисс – значения Х, ось ординат – частоты или относительные частоты).
Алгоритм построения интервального вариационного ряда (если N велик):
-
определение размаха распределения Хmax – Xmin
-
определение разумного числа интервалов
-
расчёт ширины интервала (шага разбиения)
-
нахождение границ интервалов
-
подсчёт числа вариант в каждом интервале.
Графическое изображение интервального вариационного ряда – гистограмма частот, относительных частот или плотности – это ступенчатая фигура, состоящая из прямоугольников, основанием каждого прямоугольника является соответствующий интервал, а высота равна частоте, относительной частоте или плотности.
Плотность относительных частот:
(кривая, проведённая через середины вершин всех прямоугольников – аналог кривой распределения)
Характеристики выборки:
Выборочная средняя – среднее арифметическое всех вариант:
Выборочная дисперсия – характеризует рассеяние вариант вокруг среднего значения выборки (вокруг средней выборочной):
Выборочное среднеквадратическое отклонение:
Мода – наиболее часто встречающаяся варианта. Обозначается Мо.
Медиана – варианта, находящаяся в середине ранжированного ряда, делящая его пополам. Обозначается Ме.
Точечные оценки параметров распределения (приближ. с погрешностью и случайные):
Приближённым значением средней генеральной является средняя выборочная:
Приближённым значением генеральной дисперсии явл. исправленная выб. дисп.
Приближённым значением генерального среднеквадратического отклонения является стандартное отклонение: .
Доверительная вероятность () – вероятность того, что параметр генеральной совокупности будет заключён в пределах окрестности своей точечной оценки.
Доверительный интервал – случайный интервал с доверительной вероятностью , включающий данный параметр.
Интервальная оценка – оценка параметра с помощью указания его доверительного интервала.
Уровень значимости () – вероятность того, что доверительный интервал не включит соответствующий параметр генеральной совокупности. .
Алгоритм построения доверительного интервала для средней теоретической нормально распределённой величины:
-
вычислить
-
по заданной рассчитать значение
-
по значению в таблице (Стьюдента при малых N) распределения найти значение t.
-
рассчитать точность оценки по формуле:
-
определить границы доверительного интервала: ()
Определение минимального объёма выборки, характеризующего оценку средней теоретической с заданной точностью и надёжностью:
«Нулевая» гипотеза – исходная гипотеза.
Критерий – контрольная случайная величина, значения которой зависят от значений сравнивающих параметров.
Наблюдаемые значения – значения, вычисляемые по результатам данной выборки.
Критические значения – значения, определяемые исходя из надёжности.
Критерий согласия Пирсона (хи - квадрат): , где
m – число интервалов
nk – частота
nk/ - теоретическая частота, , где
- вероятность попадания значений исследуемой величины в к-ый интервал.
Критическое хи-кв. находят по и по числу степеней свободы .
Если , то гипотеза принимается.
Оценка достоверности различия выборочных средних:
Нулевая гипотеза: мат ожидания одинаковы
Критерий: T – критерий.
, причём S2 – исправленные выборочные дисперсии.
Если , то гипотеза о равенстве теоретических средних верна.
Функциональная связь – каждому значению Х соответствует опред. значение У.
Статистическая связь – изменение значений Х ведёт к изменению закона распределения У.
Корреляционная связь – изменение значений одной величины приводит к изменению среднего значения другой.
Коэффициент корреляции
Если k=0,то связи нет. Если k- корреляционная связь есть.
Свойства коэффициента корреляции:
. Если 1 – линейная связь. Если k > 0 – положит. связь.
Если k < 0 – отрицательная связь.
Выборочный коэффициент корреляции:
Слабая связь – меньше 0,3; сильная – выше 0,7; ост – средняя.
Множественная корреляция – связь между 3 и более величинами – определяют при помощи частного коэффициента корреляции с исключённым влиянием остальных величин.