- •Содержание
- •Введение
- •Аксиомы, определяющие вероятность
- •Законы тождества
- •Определения вероятности
- •Понятие об условной вероятности
- •Теорема Байеса
- •Случайные величины и их законы распределения
- •Свойства функции распределения
- •Плотность распределения
- •Свойства плотности распределения
- •Числовые характеристики случайных величин
- •Математическое ожидание числа появления события в одном опыте. Закон распределения
- •Свойства математического ожидания
- •Характеристики рассеяния
- •Свойства дисперсии
- •Стандартные распределения дискретных случайных величин
- •Проверка статистических гипотез
- •Алгоритм проверки статистических гипотез
- •Стандартные распределения непрерывных случайных величин
- •Этапы моделирования непрерывных случайных величин
- •Локальная и интегральная теоремы Лапласа
- •Локальная теорема
- •Интегральная теорема
- •Система случайных величин
- •Интегральная функция распределения
- •Дифференциальная f(X) для непрерывных случайных величин (двумерная плотность вероятности)
- •Моменты двумерной выборки
- •Центральная предельная теорема
- •Метод статистических испытаний, или метод Монте-Карло
- •Задача о «случайном блуждании»
- •Статистические оценки параметров распределения случайных величин
- •Доверительные границы
- •Плотность распределения
- •Распределение Стьюдента (Госсета) или t-распределение
- •Распределение Фишера
- •Модели дисперсионного анализа
- •Однофакторный дисперсионный анализ
- •Двухфакторный дисперсионный анализ, двойная группировка
- •Модели непараметрической статистики Априорное ранжирование факторов
- •Краткие выводы по курсу
Двухфакторный дисперсионный анализ, двойная группировка
П
редполагает
разложение суммы квадратов отклонений
всех значений от их общего среднего на
три составляющих. Q=Q1+Q2+Q3.
.
Взвешенная сумма квадратов отклонений
средних значений по группам первого
фактора (А)
от общего среднего значения:
(В). Q3 – остаточная дисперсия: .
Схема дисперсионного анализа может быть представлена в таблице:
Изменчивость |
Сумма квадратов |
Число степеней свободы |
Оценка дисперсии |
Общая |
Q |
ν=mn-1 |
|
Между группами дисперсии А |
Q1 |
m-1 |
|
Между группами дисперсии В |
Q2 |
n-1 |
|
Остаточная |
Q3 |
(m-1)(n-1) |
|
Д
алее
следует рассчитать две f-статистики:
П
ри
этом S32
должно быть обязательно меньше двух
других оценок дисперсий. В качестве
примера можно привести исследование
влияния различных электродов (фактор
А)
и фотопластинок (В)
на величину, характеризующую интенсивность
света. Данные следует оформлять в виде
таблицы, в которой кроме xij,
то есть наблюдений, полученных при
действии iого
уровня фактора А
и jого
уровня фактора В
нужно указать среднее значение (правый
столбец таблицы) и (нижняя строка
таблицы).
Модели непараметрической статистики Априорное ранжирование факторов
Существует ряд задач, где напрямую не определяются параметры распределения. Одним из самых распространенных классов задач является группировка тех или иных объектов в соответствии с набором ряда признаков. В рамках этого класса задач простейшей задачей является задача ранжирования тех или иных объектов, обладающих рядом свойств, в том числе качественных. В рамках этой задачи рассматривается модель обработки данных экспертного анализа. Пусть для проведения экспертизы приглашены m экспертов. Каждый эксперт должен установить важность каждого из n факторов, задав каждому фактору определенное место или ранг. Ранги могут быть расположены по возрастанию или убыванию. И в том и в другом случае нужно проанализировать каждую полученную ранжировку. А именно:
Эксперт каждому фактору присваивает собственный ранг. Тогда сумма всех рангов, присвоенных iым экспертом n-факторам равна сумме элементов арифметической прогрессии. Эта сумма является весовым коэффициентом каждого эксперта.
Если эксперт затрудняется присвоить индивидуальный ранг каждому фактору, а присваивает индивидуальные ранги группе факторов, то говорят, что ранжировка содержит связанные ранги. Тогда нужно выполнить преобразования, заменив одинаковые ранги средним значением суммы этих рангов в нормальной ранжировке:
Фактор |
1 |
2 |
3 |
4 |
5 |
Место |
2 |
1 |
2 |
1 |
3 |
Место |
2 |
1 |
2 |
1 |
3 |
Среднее значение |
3,5 |
1,5 |
3,5 |
1,5 |
5 |
В приведенной выше таблице две группы связанных рангов, содержащих в каждой группе по два ранга.
По данным нормальной матрицы ранжирования можно найти: 1.Коэффициент конкордации, который служит мерой согласованности мнений экспертов и является единой выборочной мерой связи признаков. Этот коэффициент был предложен Кенделлом и Бебингтоном Смитом. Коэффициент можно рассчитать по формуле, которая учитывает связанные ранги: ,
г
де
. – среднее значение суммы рангов матрицы.
- сумма
рангов, присвоенных всеми экспертами
jому
фактору. Ti
оценивает
связанные ранги:
,
где t
– количество связанных рангов в одной
группе в iой
ранжировке. l
– количество групп, связанных рангами
в iой
ранжировке. W
меняется от 0
до 1.
Считается, что чем W
ближе к 1,
тем лучше мнение экспертов отражает
реальность. После расчета W
обязательно нужно оценить его значимость.
Можно воспользоваться χ2-статистикой:
. Если χ2расч>
χ2табл,
полученного при ν=n-1,
H0
о равновероятности всех возможных
ранжировок должна быть отвергнута. W
– значима.
2.Коэффициент ранговой корреляции: бывают двух видов:
к
оэффициент
ранговой корреляции Спирмена
(1904):
, dj
– разность рангов jого
фактора назначенных двумя экспертами:
.
коэффициент ранговой корреляции Кенделла:
,
где sign(x)=-1, если x<0
0, если x=0
1, если x>0
Н
аиболее
широкое применение находит коэффициент
Спирмена.
После расчетов этих коэффициентов нужно
обязательно оценить их значимость.
Значение ρ
и τ
меняются от 0
до 1.
. Критическая точка двусторонней критической области при выбранном α и k=n-2. Если |ρ|<tкр, то H0 принимается, то есть ранговая корреляционная связь между качественными признаками не значима. H0: ρ=0 в генеральной совокупности.
Коэффициент
Кенделла:
, где Zкр
– критическая точка двусторонней
критической области, которая находится
на таблице функции Лапласа:
. Если |τ|<Tкр, то H0 принимается, иначе отвергается.
Задача: нужно определить степень важности, а, следовательно, и очередность автоматизации ряда процессов легкой промышленности. Были приглашены 6 экспертов, которым было предложено проранжировать 8 процессов:
Подача материала к рабочим элементам швейных машин.
Транспортировка рулонов ткани от склада к раскройным столам.
Автоматизация вспомогательных приемов на пошивочном участке.
Внутрипроцессорная транспортировка полуфабрикатов.
Складирование рулонов ткани.
Раскрой ткани.
Разбраковка и промер ткани.
Комплектовка тканей.
Требуется построить диаграмму рангов, дать заключение о согласованности мнений экспертов, провести анализ результатов. В результате анкетирования была получена информация, которая представлена в исходной матрице ранжирования.
ЭкспертФактор |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
5 |
4 |
6 |
7 |
8 |
2 |
1 |
3 |
2 |
2 |
3 |
2 |
2 |
3 |
1 |
1 |
3 |
3 |
5 |
6 |
3 |
4 |
7 |
2 |
1 |
2 |
4 |
5 |
3 |
6 |
7 |
2 |
4 |
1 |
4 |
5 |
6 |
5 |
4 |
2 |
3 |
1 |
1 |
7 |
6 |
6 |
2 |
7 |
8 |
1 |
4 |
3 |
5 |
Здесь первый и шестой эксперты не затруднились в ранжировании предложенных процессов, присвоив каждому процессу свой индивидуальный ранг. Все остальные эксперты некоторым факторам присвоили одинаковые ранги, причем второй эксперт условно разбил 8 процессов на три группы. То есть, сформированы три группы связанных рангов l=3, при этом в первой группе содержится два связанных ранга: t1=1, t2=3, t3=3. Данные исходной матрицы преобразуются в нормальную матрицу ранжирования.
ЭкспертФактор |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Сумма |
Количество связанных рангов |
1 |
5 |
4 |
6 |
7 |
8 |
2 |
1 |
3 |
36 |
- |
2 |
4 |
7 |
4 |
4 |
7 |
1,5 |
1,5 |
7 |
36 |
2, 3, 3 |
3 |
6 |
7 |
4 |
5 |
8 |
2,5 |
1 |
2,5 |
36 |
2 |
4 |
6 |
3 |
7 |
8 |
2 |
4,5 |
1 |
4,5 |
36 |
2 |
5 |
7 |
6 |
5 |
3 |
4 |
1,5 |
1,5 |
8 |
36 |
2 |
6 |
6 |
2 |
7 |
8 |
1 |
4 |
3 |
5 |
36 |
- |
Σkij |
34 |
29 |
33 |
35 |
30 |
16 |
9 |
30 |
|
|
Σ ранж
0
10
20
30
40
факторы
Диаграмма рангов ясно показывает, что экспертный опрос позволил выделить три группы процессов: первая группа включает в себя процессы 7 и 6, которые нужно подвергнуть первоочередной автоматизации. Во вторую группу вошли процессы 2, 5, 8. В последнюю – третью группу, можно включить процессы 3, 1, 4.
