- •Математико-статистические методы обработки данных при управлении качеством электронных средств
- •Математико-статистические методы обработки данных при управлении качеством электронных средств Утверждено редакционно-издательским советом
- •Введение
- •1. Общие сведения о контроле качества электронных средств
- •2.2. Графические методы представления статистического ряда
- •2.3. Численные методы представления статистического ряда
- •2.4. Основные понятия теории вероятностей и характеристики генеральной совокупности
- •2.5. Основные законы распределения случайной величины
- •2.6. Статистическая проверка гипотез
- •2.7. Элементы дисперсионного и корреляционного анализа
- •Отклонения толщины фоторезиста от среднего значения при различных частотах вращения центрифуги
- •3. Статистические методы анализа качества. Расслаивание и графические методы
- •3.1. Методы расслаивания
- •3.2. Расслаивание общей изменчивости статистических данных с помощью дисперсионного анализа
- •3.3. Диаграмма разброса (поле корреляции)
- •3.4. Диаграмма Парето
- •3.5. Причинно-следственная диаграмма
- •4. Статистические методы оценки качества
- •4.1. Выбор оценок генеральных характеристик
- •4.2. Определение доверительных интервалов оценок генеральных характеристик
- •4.3. Оценка генеральной средней м(х) с помощью среднего значения выборки
- •Результаты испытаний эс на безотказность работы
- •4.4. Оценка генеральной характеристики рассеивания σ с помощью выборочных характеристик рассеивания
- •4.5. Определение объема выборки для оценки генеральных характеристик с заданной точностью
- •Библиографический список
2.6. Статистическая проверка гипотез
Критерий Пирсона. Для проверки гипотезы о соответствии экспериментального закона распределения случайной величины теоретическому наиболее часто применяют критерий Пирсона или, как его иначе называют, критерий χ2 («хи-квадрат»), так как принятие и отклонение гипотезы основаны на χ -распределении.
Предположим, что имеется статистический ряд наблюдений над случайной величиной X. Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина имеет предполагаемый закон распределения, заданный интегральной функцией распределения F(x) или плотностью вероятностей f(x), который в дальнейшем будем называть теоретическим законом распределения.
Первоначально статистический ряд разбивают на k интервалов и подсчитывают число значений случайной величины X в каждом интервале. В результате получают экспериментальный ряд частот:
Следует сразу оговорить, что предпосылкой применения критерия χ2 является достаточная заполненность интервалов частотами. На практике рекомендуется иметь в каждом интервале не менее 5. ..10 наблюдений. Если число наблюдений в отдельных интервалах мало, имеет смысл объединить эти интервалы.
Исходя из предполагаемого теоретического закона распределения вычисляют частоты тi в тех самых интервалах, на которые разбит статистический ряд. В результате получают теоретический ряд частот в k интервалах m1 ,m2, т3 ,..., mк.
Для проверки согласованности теоретического и экспериментального распределения подсчитывают меру расхождения:
или
(2.41)
и число степеней свободы ν. Число степеней свободы равно в этом случае числу интервалов k минус число ограничений f:
ν = k – f (2.42)
Число ограничений равно числу параметров в рассматриваемом законе распределения, увеличенному на единицу. Например, для гауссовского закона имеется два параметра: [М(х) и σ ] в этом случае число ограничений равно трем.
Для распределения χ2 составлены специальные таблицы (см. табл. 2 Приложения [1, с. 399]). Пользуясь этими таблицами, можно для каждого значения χ 2 и числа степеней свободы v определить вероятность Р того, что за счет чисто случайных причин мера расхождения теоретического и экспериментального распределений (2.41) будет меньше, чем фактически наблюдаемое в данной серии опытов значение χ 2. Если эта вероятность Р мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе о том, что закон распределения величины X есть F(х). Эту гипотезу следует отбросить как неправдоподобную.
Напротив, если вероятность Р сравнительно велика, можно признать расхождение между теоретическим и экспериментальным распределениями несущественным и отнести его за счет случайных причин. Гипотезу о том, что величина X распределена по закону F(x), можно считать в этом случае правдоподобной, по крайней мере не противоречащей полученным, экспериментальным данным.
В табл. 2 Приложения [3, с. 399] входами являются значение χ2 и число степеней свободы v. Числа, стоящие в таблице, представляют соответствующие значения Р.
Насколько должна быть мала вероятность Р для того, чтобы отбросить или пересмотреть гипотезу,— вопрос неопределенный. Он не может быть решен из математических соображений, а должен базироваться на априорных сведениях о физической сущности изучаемого процесса.
На практике, если Р<0,1, рекомендуется проверить эксперимент, если возможно — повторить его. В случае появления повторных расхождений следует попытаться найти наиболее подходящий для описания экспериментальных данных закон распределения.
Пример 4. Рассмотрим гипотезу о соответствии закона распределения, представленного статистическим рядом в табл. 2.4, гауссовскому закону распределения. Распределение, полученное по результатам наблюдений, представлено в табл. 2.4 и разбито на 12 интервалов. Первые три и последние два интервала объединим для того, чтобы теоретические частоты получились больше 5. Таким образом, число интервалов станет равным 9. Значения экспериментальных и теоретических частот, подсчитанных исходя из гауссовского закона распределения, приведены в табл. 2.6.
Таблица 2.6
Значения экспериментальных и теоретических частот
|
9=1+3+5 |
16 |
21 |
29 |
31 |
21 |
18 |
9 |
6=5 + 1 |
mi |
11,6=1,0+3,7-1-6,9 |
13,4 |
21,6 |
28,0 |
29,3 |
24,6 |
168 |
91 |
5,6=4,2+1,4 |
Подставив значения и тi в выражение (2.41), получим χ 2 = 7,52. Число степеней свободы в соответствии с (2.42) равно 6. По табл. 2 Приложения [3, с. 399] находим Р=0,25. Следовательно, распределение значений для напряжения пробоя, приведенных в табл. 2.4, близко к гауссовскому.
Критерий Фишера (F-критерий). Для гауссовского закона распределения случайной величины при проверке гипотезы о равенстве выборочных дисперсий в качестве критерия значимости используется параметр, который равен отношению двух независимых оценок дисперсий генеральной совокупности и имеющих соответственно степени свободы υ1 и υ2, т. е.
F = / (2.43)
При этом должно выполняться условие > , в противном случае следует поменять местами выборочные дисперсии.
Найденное экспериментальное значение F сравнивается с теоретическим FT, которое по числу степеней свободы и при заданном значении коэффициента риска находится из таблицы, построенной для F-распределения (см. табл. 3 Приложения), обладающего тем свойством, что случайные значения отношений дисперсий двух независимых выборок будут не менее FT по сравнению с заданным коэффициентом риска β. Для практических целей достаточно иметь такие таблицы для β = 0,01 и β = 0,05. Например, β = 0,01 (1%) означает, что отклонения, равного или большего наблюдаемого, можно ожидать только один раз на 100 опытов. Такая малая вероятность указывает на высокую степень значимости. Вот почему иногда вместо коэффициента риска эту вероятность называют уровнем значимости.
В табл. 3 Приложения значение υ1 определяет значение F по столбцу, а значение υ2 — по строке. Если F<FT, то гипотеза о равенстве выборочных дисперсий принимается.
Критерий Кохрена. Для проверки гипотезы о равенстве нескольких выборочных дисперсий с одинаковым числом наблюдений в выборках используют критерий Кохрена. Для этого, располагая экспериментальными данными, подсчитывают параметр
(2.44)
где , т. е. вычисляют отношение максимального значения изменчивости среди k выборок к сумме изменчивости всех выборок. Найденное по формуле (2.44) экспериментальное значение G сравнивают с теоретическим значением GT. Теоретическое значение находят из таблицы значений критерия Кохрена для гауссовской генеральной совокупности (см. табл. 5 Приложения). Задаваясь коэффициентом риска β (обычно задаются β =0,05 или β = 0,01), по объему выборки п определяют значение GT по столбцу, а по числу выборок k — значение GT по строке. Если G<GT, то результаты не противоречат гипотезе о равенстве выборочных дисперсий.
Критерий Стьюдента (t-критерий). Для проверки гипотезы о равенстве двух выборочных средних значений случайной величины, имеющей гауссовский закон распределения, используется критерий Стьюдента. Для применения данного критерия располагают выборочные средние арифметические значения случайной величины в ранжированный ряд от наименьшей величины до наибольшей . Далее подсчитывают величину стандартного отклонения выбороч-1ых средних арифметических значений по формуле
(2.45)
Для случая, когда объем выборки п значительно меньше объема партии изделий N, из которой берутся выборки, формула (2.45) имеет вид
(2.46)
Если генеральная характеристика σ неизвестна (а это наиболее часто встречающийся случай), то в формуле (2.46) берется ее оценка
(2.47)
После того как определены максимальное и минимальное значения отборочного среднего арифметического и , подсчитывают размах Стьюдента:
(2.48)
Найденное экспериментальное значение t сравнивают с табличными , которое определяют по таблице размаха Стьюдента для экстремальных точек (см. табл. 4 Приложения). При заданном значении коэффициента риска β число степеней свободы υ (в данном случае υ=Nk) определяет значение tT по строке. Если t<tт, то гипотеза равенстве выборочных средних арифметических значений принимается, а это значит, что выборки взяты из одной и той же генеральной совокупности.
В заключение следует отметить, что при малом объеме выборки n< 10) t — случайная величина и ее распределение не является .гауссовским. Однако по мере увеличения объема выборки t-распределение приближается к гауссовскому. При n>30 его можно cчитать практическим гауссовским и оно не отличается от распределения α .
К вопросам, связанным со статистической проверкой гипотез о соответствии экспериментального распределения предполагаемому закону распределения случайной величины, близко примыкает вопрос о сглаживании экспериментальных зависимостей.
Пусть проводится опыт, целью которого является исследование зависимости некоторой физической величины У от физической величины X (например, зависимость глубины диффузии фосфора в кремниевую пластину от времени диффузии). Предполагается, что величины связаны функциональной зависимостью
у=φ(х). (2.49)
Вид этой зависимости и требуется определить из опыта. Предположим, что в результате опыта мы получили ряд экспериментальных точек и построили график зависимости Y от X (рис. 2.7). Обычно экспериментальные точки на таком графике располагаются не совсем правильно — дают некоторый разброс, т. е. обнаруживают случайные отклонения от видимой общей закономерности. Эти отклонения связаны с неизбежными при всяком опыте ошибками измерения. Тогда возникает типичная для практики задача сглаживания экспериментальной зависимости.
Для решения данной задачи обычно применяется расчетный метод, известный под названием метода наименьших квадратов. Этот метод дает возможность при заданном типе зависимости у= φ (х) так выбрать ее числовые параметры, чтобы кривая у= φ(х) наилучшим образом отражала экспериментальные данные. Вопрос выбора типа кривой у = φ (х) часто решается непосредственно по внешнему виду экспериментальной зависимости. Например, экспериментальные точки, изображенные на рис. 2.7, явно наводят на мысль о прямолинейной зависимости вида у=ах+b.
Рис. 2.7. График зависимости y от
Очень часто вид зависимости (линейная, квадратичная, показательная и т. д.) бывает известен из физических соображений, связанных с существом решаемой задачи, а из опыта требуется установить только некоторые параметры этой зависимости.
Вернемся к методу наименьших квадратов. При этом методе требование наилучшего согласования кривой у= φ(х) и экспериментальных точек сводится к тому, чтобы сумма квадратов отклонений экспериментальных точек от сглаживающей кривой обращалась в минимум.
Пусть экспериментальная величина У' имеет следующие значения у’1, у'2 ,..., у’i, ..., уn', а общий вид функции, зависящей от нескольких числовых параметров а, b, с, ..., может быть записан как
у= φ (х; а, b, с, ...) (2.50)
Тогда по методу наименьших квадратов требуется выбрать параметры а, b, с,... так, чтобы выполнялось условие
(2.51)
Найдем значения а, b, с, ..., обращающие левую часть выражения (2.51) в минимум. Для этого продифференцируем ее по этим параметрам и приравняем производные к нулю:
(2.52)
где - значение частной производной функции φ по параметру a в точке xi ; вычисляются аналогично.
Система уравнений (2.52) содержит столько же уравнений, сколько неизвестных а, b, с, ... . Решить систему уравнений (2.52) в общем виде нельзя; для этого необходимо задаться конкретным видом функции φ.