- •1,4. Специфика научной деятельности
- •3. Критерии научного знания
- •5. Средства научного познания
- •6. Возникновение естествознания е
- •8. Взаимосвязь теории и эксперимента
- •7. Структура научного знания
- •9. Модели научного познания
- •10. Научные традиции
- •11. Научные революции
- •12. Научные открытия
- •13. Фундаментальные научные открытия
- •14. Проблемы науки
- •15. Идеалы научного знания
- •16. Функции науки
- •17. Научная этика
- •22. Калориметрия
- •23,26 Рентгенография и электронография
- •28. Спектральные методы
- •29. Электронные спектры поглощения и люминесценции
- •30. Инфракрасные спектры поглощения
- •33. Ядерный магнитный резонанс (ямр)
- •39. Фотоэлектронная спектроскопия (фэс)
- •49. Основные правила действий с приближенными числами
39. Фотоэлектронная спектроскопия (фэс)
При помощи ФЭС можно непосредственно измерять энергии, которые необходимы для удаления электронов из валентных оболочек атомов и молекул. Образец в виде газа облучают в камере монохроматическим ионизирующим потоком фотонов с энергией 21,2 эВ (А, = 58,4 нм, источник — гелиевая трубка, тлеющий разряд, низкое давление). Фотоэлектронную эмиссию можно наблюдать в двух режимах: 1) по мере непрерывного увеличения энергии квантов света квантовый выход эмитированных электронов резко возрастает, наблюдаемый рост квантового выхода составляет много порядков и в максимуме дает величину потенциала ионизации 1пи молекулы; 2) при облучении образца монохроматическим светом с энергией кванта, значительно превышающей потенциал ионизации, происходит ионизация молекул с выбросом электронов с различных молекулярных орбиталей. Эти электроны разделяются в электрическом поле между коаксиальными пластинами в соответствии с их кинетической энергией. Происходит ионизация молекул с выбросом валентных электронов. При заданной разности потенциалов на пластины попадают электроны определенной энергии, измеряется генерируемый ими ток и определяется их относительная доля в общем количестве выброшенных электронов. На спектрограмме регистрируется ток в зависимости от потенциала ионизации 1т, который находится согласно выражению:
здесь Ект — кинетическая энергия выброшенного фотоэлектрона; hv — энергия возбуждающего излучения. Максимумы тока на спектрограмме соответствуют потенциалам ионизации каждой занятой электронами молекулярной орбитали. Таким образом, возможно непосредственное измерение орбитальной энергии валентного электрона. Наблюдаемая тонкая структура полос связана с образованием ионов в колебательно-возбужденных состояниях. Энергии ионизации, измеренные методом ФЭС, коррелируют с потенциалами полуволн окисления в полярографических измерениях. Таким образом, метод электронной спектроскопии применим для исследования веществ в различных агрегатных состояниях, он позволяет определить состав веществ, потенциалы ионизации молекул, характеристики хи-
мическои связи, энергетическое распределение электронов в молекулах и твердом теле.
Ц
'/у Масс^спектрометрия
Метод был предложен Дж. Дж^Томсоном в 1912 году (им в 1897 году был открыт электрон). При бомбардировке молекулы электронами средней энергии (25-70 эВ) происходит ионизации молекулы — выброс электрона с глубоколежащих электронных уровней молекулы и образование иона в сильно возбужденном состоянии М+*. Такое состояние является неустойчивым и ион распадается на положительно и отрицательно заряженные фрагменты. В масс-спектрометре происходит распределение заряженных частиц в соответствии с их массами и зарядами. Масс-спектр записывается в единицах m/q (т — масса фрагмента, q — заряд). В спектре на-блнЗдаётся "пик молекулярного иона и пики фрагментов с различной интенсивностью. Заряд и масса определяются составом и структурой соединения.
Пусть электрон движется вдоль оси х, пройдя расстояние I между пластинами конденсатора в электрическом поле с напряженностью Е. Вектор магнитной индукции В направлен по оси у. Простой расчет показывает, что отклонение электрона от оси х при х = L (L > 1) равен:
Am
= ](L-x)Bydx.
Большое значение масс-спектры имеют в расшифровке структуры сложных соединений, при этом требуются очень небольшие количества вещества (доли миллиграмма). Этот метод позволяет точно определить молекулярную массу вещества (по молекулярному иону) и его элементный состав. Метод применяется для прецизионного измерения массы ионов, изотопного анализа, молекулярного химического анализа, идентификации и установления структуры сложных органических молекул и т. д. В статических масс-спектрометрах с однородным магнитным полем Я ионы, образованные в источнике, выходят из щели в масс-анализатор в виде расходящегося пучка (все измерения проводятся в высоком вакууме), который в магнитном поле меняет направление на 90°, разделяется на пучки ионов с разными отношениями т/е, и пучок с mje фокусируется на выходную щель (рис. 14). Значение mje определяется следующим выражением: mje = 4,824Ю~5Яг2/У2. Здесь mn-— масса иона, а.е.м.;
50
Рис. 14. Схема масс-спектрометра с однородным магнитным полем;
Sl,Si — щели ионного источника и приемника ионов; треугольник — область
однородного магнитного поля Н, перпендикулярного плоскости рисунка;
тонкие сплошные линии - границы пучков ионов с разными т/е;
г —- радиус центральной траектории ионов
е — его заряд; г — радиус центральной траектории, см; V — ускоряющий потенциал, В; Я — напряженность магнитного поля, Э. Развертка масс-спектра производится изменением Я или V, первый метод предпочтительнее, поскольку в этом случае не меняются условия вытягивания ионов из источника по мере развертывания пучка. Пучок ионов с заданным значением mje фокусируется на щель приемника ионов. При плавном изменении магнитного или электрического поля в приемную щель последовательно попадают пучки ионов с различными отношениями mje. Измеряют ионный ток и получают график с ионными пиками масс-спектра. Вмасс^спектрографах запись ведется на фотопленку. Измерение массы многоатомного иона в сочетании с предварительными сведениями о составе соединения дает возможность однозначно установить формулу и строение молекулы. Например, измеренная масса молекулярного иона составляет 345,2290 ± 0,0010 а.е.м. Ей могут соответствовать вещества C21H31NO3 (345,230), С18Н33О6 (345,228), C19H29N4O2 (345,229). Второе вещество идентифицируется при отсутствии азота в элементном анализе. Между первым и третьим выбор делается по результатам специфической реакции на нитрогруппу.
Развитием хроматографии и масс-спектрометрии является разработка масс-хроматографов, в которых на первом этапе проводится хроматографическое разделение смеси веществ на индивидуальные компоненты, а затем масс-спектрометрически идентифицируется каждый компонент.
51
Спектрополяриметрия
Метод основан на измерении оптического вращения плоскости... поляризаций света при прохождении через оптически активное вещество. Вращение плоскости поляризации измеряют в поляриметре, который устроен следующим образом: неполяризованный свет проходит через оптический поляризатор и становится плоскополя-ризованным, т. е. электрический вектор всех волн находится в одной плоскости; при прохождении через оптически активное вещество плоскость поляризации поворачивается на некоторый угол а; затем свет попадает на выходной поляризатор и может пройти через него, только если плоскость поляризации выходного поляризатора находится пол углом а по отношению к плоскости входного поляризатора. Таким способом проводится измерение угла вращения а. Характеристикой оптически активного вещества является удельное вращение а или молярное вращение [М]:
[ос] ~ a/cl; [М] = М[а]/100,
где ос — наблюдаемое вращение, град; I — длина образца, дм; с — концентрация оптически активного вещества, обычно находящегося в растворенном состоянии, г/см2; М — молекулярная масса. Оптическая активность веществ связана с отсутствием симметрии в их молекулах, например, с наличием асимметрического атома углерода, который связан ковалентными связями с четырьмя различными заместителями (рис. 15). В этом случае возможно двоякое расположение заместителей в пространстве, причем оба изомера различаются между собой как зеркальные изображения (зеркальные изомеры, стереоизомеры, энантиомеры) и их нельзя совместить никаким вращением (хиральность молекулы). В данном случае оба стереоизо-
Y
хиральяая молекула не идентична ее зеркальному отражению
А
ажираяьаая молекула
Рис. 15. Хиральные и ахиральная молекулы. Треугольные связи идут
к заместителям, расположенным над плоскостью чертежа, штриховая — за плоскостью, сплошная — в плоскости чертежа
52
мера составляют пару оптических антиподов, которые отличаются друг от друга знаком оптического вращения -[а] и +[а] при одинаковом значении [а]. Органические вещества с асимметрическими молекулами, имеющими асимметрические атомы С, Si, N, P, S, всегда оптически активны в случае, если имеется только один антипод или один из антиподов преобладает в смеси антиподов. Интересно отметить, чтсквещества растительного и животного происхождения всегда оптически активны, причем, по не известной пока причине, состоят только из левовращающих антиподов, в ходе же лабораторных химических реакций практически всегда получаются два антипода в равных количествах (рацемические вещества). Разделить антиподы можно используя, например процесс кристаллизации (допустим, натриевую и калиевую соли винной кислоты) или реакции с веществами природного происхождения. Вращательная способность характеризует многие кристаллы, в некоторых случаях вращательная способность связана именно с кристаллической структурой и не является свойством самих молекул. В то же время все вещества, активные в аморфном состоянии (расплавленные или растворенные), активны и в виде кристаллов. Спектрополя|юметрия является важным методом установления детального строения оптически активных кристаллов, а также молекул оптически активных органических и элементоорганических соединений.
Если среда становится оптически активной под действием внешнего магнитного поля с напряженностью Я, то говорят о магнитном вращении плоскости поляризации, или эффекте Фарадея (1846).
В этом случае угол поворота плоскости поляризации на длине
прохождения среды I равен % = ШВ, где В — индукция магнитного поля, a R — постоянная Верде (магнитная вращательная способность), зависящая от свойств вещества и длины электромагнитной волны (в ферромагнетиках имеется слабое возрастание с индукцией В, если существует доменная структура). Для ряда веществ выполняется формула Беккереля:
2тс dk
где п — показатель преломления вещества. Таким образом, определяя из эффекта Фарадея значения R, можно построить зависимость от А, производной показателя преломления от длины волны.
Для полупроводников эффект Фарадея служит удобным средством определения эффективной массы носителей тока (в том числе
53
и при комнатных температурах). Так, в случае скалярной эффективной массы то* для угла вращения плоскости поляризации имеем:
2ne3NHd
Л c2nw2m2 '
где N — концентрация свободных электронов, и> = 2jw (показатель преломления можно брать в отсутствие магнитного поля).
Эта формула не зависит от механизма рассеяния, поэтому остается справедливой, когда неприменим метод циклотронного резонанса, использующего формулу:
_ еЯ
т*с' где х — время свободного пробега в веществе.
Эффект Холла
Эффект Холла (1879) — простой и вместе с тем эффективный метод определения знака и концентрации носителей в веществе.
Пусть вдоль длинной и тонкой металлической ленты шириной d протекает ток плотностью j, а перпендикулярно плоскости ленты приложено постоянное магнитное поле с индукцией В. Направление оси X декартовой системы координат направим по току, направление оси Z — по магнитному полю, тогда вдоль оси Y возникнет разность потенциалов:
V = RjBd, R = l/(nec).
Коэффициент R называется постоянной холла; п — концентрация электронов; с — скорость света; е — заряд электрона. В основе
явления лежит сила Лоренца Г=—[vxB] (v — скорость электрона).
с
Поскольку сила Г будет отклонять отрицательные частицы в сторону отрицательных значений оси Y, то потенциал будет возрастать вдоль направления этой оси. Для измерения коэффициента Холла часто применяется компенсационный метод. По значению R можно найти концентрацию носителей, а по знаку холловской разности потенциалов — определить вид носителей (например, в полупроводниках: электроны или дырки). Если присутствуют носители обоих знаков, то будет происходить взаимная (полная или частичная) компенсация холловского напряжения. Другое техническое применение этого эффекта — измерение индукции магнитного поля, а если оно известно, то не сложно измерить силу тока и мощность. 54
С помощью эффекта Холла можно моделировать, демоделировать и генерировать электрические колебания, осуществлять квадратичное детектирование колебаний, усиливать электрические сигналы и решать другие технические задачи.
Другая полезная величина — тангенс угла Холла:
где Е и Е — компоненты вектора напряженности электрического поля. При выполнении закона Ома j. = o.JZ. получаем другую форму записи для постоянной Холла (для приведенной в примере выше геометрии):
R = -
В а
Зондовая микроскопия
Можно перечислить, по крайней мере, три основные и существенные особенности сканирующих зондовых микроскопов, благодаря которым зондовые микроскопы привлекли внимание специалистов различных профилей.
1. Возможность увидеть атомную и молекулярную структуру поверхности, воздействовать на нее на уровне отдельных атомов и молекул. Пространственное разрешение сканирующего туннельного и атомно-силового микроскопа может достигать тысячных долей нанометра в направлении по нормали к образцу и сотые доли нанометра в плоскости образца.
2. Структуру и свойства (механические, электрические и электронные) поверхности можно изучать в различных средах — на воздухе, в чистых жидкостях и растворах, в вакууме.
3. Наглядность представляемой информации.
Общепринятая аббревиатура сканирующей зондовой микроскопии — СЗМ. Основное отличие разных методов зондовой микроскопии состоит в типе применяемого зонда.
Сканирующий туннельный микроскоп (СТМ или STM). В СТМ используется явление туннелирования электрона через барьер, высота которого Н превышает энергию электрона. Барьер возникает между изучаемой электропроводящей поверхностью и металлическим остриём (зондом), на которые подается разность потенциалов
55
V (типичные значения напряжений: от единиц мВ до 1 В). Вероят-
ность туннелирования резко увеличивается с уменьшением расстояния зонд — образец (ширина барьера) г. Протекающий при этом в цепи туннельный ток I определяется соотношением:
= аУехр(-ЬгН°Ц:}
Здесь а и b — константы. Устойчивые изображения многих поверхностей можно получать при величине туннельного тока в 1 нА. При этом острие оказывается вблизи поверхности на расстоянии в доли нанометра. В сканирующем туннельном микроскопе в качестве зонда используется заточенное острие, приготовленное из металлической проволоки, например вольфрамовой или из сплава благородных металлов (80% Pt, 20% Ir). Изготовление зонда осуществляют методом электрохимического травления или просто механическим срезом. В первом случае кончик проволоки, как правило, опускают в раствор щелочи и при пропускании постоянного или переменного тока формируют микроострие. Во втором случае можно даже с помощью простых ножниц сделать срез проволоки под углом 30-60°. Удивительно, но даже с помощью такого зонда можно увидеть отдельные атомы на поверхности проводника. Важнейшей деталью сканирующего туннельного микроскопа является механический манипулятор, который обеспечивает перемещение зонда над поверхностью с точностью до тысячных долей нанометра. Механический манипулятор изготавливают из пъезокерамического материала. Если из пьезоматериала вырезать балку прямоугольного сечения, нанести на противоположные стороны металлические электроды и приложить к ним разность потенциалов, то при этом произойдет изменение геометрических размеров балки (обратный пьезоэффект). С помощью такой балки можно перемещать зонд по одной координате, с помощью комбинации из трех балок — по всем трем пространственным координатам. Конструкции современных манипуляторов позволяют обеспечивать механическое перемещение зонда до 100-200 мкм в плоскости образца и до 5—12 мкм — по нормали к образцу. Обычно исследуемый образец крепится с помощью магнитного держателя к пьезосканеру. Для получения изображения поверхности металлическое острие перемещают над поверхностью образца, поддерживая постоянной силу туннельного тока (рис. 16, а). Поддержание постоянства величины I определяется постоянством L, которое, в свою очередь, обеспечивается изменением напряжения VgK на «высотной» секции пьезосканера за счет обратной связи. VcK ~ L и компьютерная обработка изменения Vck дает рельеф поверхности в абсолютных единицах.
56
В режиме фиксированного V"^ (рис. 16, б) атомный рельеф поверхности отражается в изменении L и соответственно J. Второй режим обеспечивает большую точность и более быстрое сканирование, но из-за отсутствия обратной связи применим только к относительно гладким поверхностям. Изображения, которые получают с помощью СТМ, дают информацию о пространственном распределении плотности электронных состояний вблизи поверхности. Образно говоря, туннельный микроскоп видит распределение электронных облаков вблизи поверхности.
Траектории ""*%ч зонда
Поверхностные атомы образца
Тумиеяьный ток
Поверхностные атомы образца
ф „ ф,, Туннельный ' "* • \ ток
Рис. 16. Схематическое изображение режимов работы СТМ а — режим постоянного тока; б — режим постоянной высоты
СТМ можно использовать только для проводящих материалов. Аналогом этого микроскопа, позволяющим с атомным разрешением сканировать любые материалы, является атомно-силовой микроскоп (АСМ или AFM). Метод основан на столь же резкой, как и для СТМ, зависимости энергии взаимодействия зонд — образец U от расстояния между ними г. Эта зависимость имеет степенной вид и в первом приближении дается соотношением (потенциал Леннарада —Джонса):
U(r) = t70[-2(r0/r)6 + (r0/r)12].
Первый член описывает энергию дальнодействующего притяжения, обусловленную, в основном, диполь-дипольным взаимодействием атомов. Второе слагаемое учитывает энергию отталкивания между электронами зонда и образца на малых расстояниях. Ug-— значение энергии в минимуме на равновесном расстоянии между атомами rff На рис. 17,а изображено схематически устройство АСМ. В АСМ контролируется сила взаимодействия между микроострием и поверхно-
57
стью образца. ACM представляет собой оригинальную конструкцию сверхчувствительного измерителя профиля поверхности. В качестве зонда атомно-силового микроскопа используют микроминиатюрную упругую пластинку (кантилевер) 2, на свободном конце которой методами литографии формируют острие 1 из твердого материала (нитрида кремния, кремния). При перемещении зонда вдоль поверхности исследуемого объекта 3 регистрируется изгиб кантилевера. Упругую деформацию кантилевера регистрирует оптическая система, состоящая из лазера и четырехсекционного фотодиода 5. Чтобы измерить отклонение кантилевера, лазерный пучок фокусируют на свободном конце кантилевера 4 и отраженный луч направляют в чувствительный фотодетектор. Обычно обратную сторону кантилевера покрывают тонкой золотой пленкой для лучшего отражения. Пье-зосканер 6 обеспечивает перемещение образца в трех направлениях. Таким образом, зонд при сканировании остается неподвижным, а образец — перемещается. В менее распространенной версии вертикальные перемещения регистрируются с помощью зонда СТМ 7 (рис. 17, б). АСМ может работать в контактном и бесконтактном режимах. В первом случае работы АСМ подвод зонда к поверхности осуществляется на небольшие расстояния, когда преобладают силы отталкивания (второе слагаемое в уравнении Леннарда — Джонса). При этом острие зонда фактически контактирует с поверхностью, и изменения высоты зонда в ходе сканирования непосредственно описывают исследуемый профиль. Информация от пьезосканера и фотодиода поступает в компьютер, который представляет результат измерений в цифровом виде.
Фотодиод
Рис, 17. Устройство и принцип работы АСМ
а - фоторегистрация высоты зонда; б — регистрация высоты с использованием зонда туннельного микроскопа
58
Информацию о поверхности образца можно регистрировать в трех видах: высота (Height), отклонение (Deflection), трение (Friction). Высота — высота образца (перемещение по оси Z пьезосканера). В этом режиме записи содержится информация о рельефе поверхности. В режиме отклонения лучше видны микроскопические детали поверхности, так как этот режим записи соответствует ошибке в системе обратной связи, поддерживающей постоянной деформацию кантилевера. Трение — тангенциальная составляющая деформации кантилевера.
Поверхность образца представляется «топографической картой», где чаще всего более светлые участки на изображении соответствуют большим значениям высоты и отклонения.
В бесконтактном режиме силы притяжения (первое слагаемое в уравнении Леннарда — Джонса) больше сил отталкивания. При сканировании зонду 1 навязываются механические колебания с частотой, близкой к резонансной частоте кантилевера 2, и регистрируется изменение частоты колебаний, вызванных притяжением зонда к поверхности. Это изменение частоты связано линейно с изменением силы притяжения, поэтому разностный частотный отклик в разных точках поверхности зависит от локального расстояния зонд — образец и позволяет построить изображение профиля поверхности. Амплитуды колебаний составляют порядка нанометра, поэтому среднее расстояние между зондом и поверхностью должно быть не меньше нескольких нанометров. Модуляционные методы нашли широкое применение при исследовании материалов с пониженной поверхностной жесткостью — полимерных материалов и биополимеров.
АСМ позволяет измерять не только профиль поверхности (вплоть до регистрации отдельных молекул), но и локальные силы трения, величину адгезии, упругие и вязкие свойства поверхности с субна-нометровым пространственным разрешением.
Развитие зондовых методов исследования поверхности происходит и в настоящее время. Современные мультимодовые атомно-си-ловые микроскопы могут сочетать в себе несколько методов сканирующей зондовой микроскопии, что очень удобно для всестороннего исследования поверхности и ее свойств. Так, например можно изучать локальные вязкоупругие свойства поверхности (измерять модуль Юнга в точке, величину адгезии между зондом и образцом).
стью образца. ACM представляет собой оригинальную конструкцию сверхчувствительного измерителя профиля поверхности. В качестве зонда атомно-силового микроскопа используют микроминиатюрную упругую пластинку (кантилевер) 2, на свободном конце которой методами литографии формируют острие 1 из твердого материала (нитрида кремния, кремния). При перемещении зонда вдоль поверхности исследуемого объекта 3 регистрируется изгиб кантилевера. Упругую деформацию кантилевера регистрирует оптическая система, состоящая из лазера и четырехсекционного фотодиода 5. Чтобы измерить отклонение кантилевера, лазерный пучок фокусируют на свободном конце кантилевера 4 и отраженный луч направляют в чувствительный фотодетектор. Обычно обратную сторону кантилевера покрывают тонкой золотой пленкой для лучшего отражения. Пье-зосканер 6 обеспечивает перемещение образца в трех направлениях. Таким образом, зонд при сканировании остается неподвижным, а образец — перемещается. В менее распространенной версии вертикальные перемещения регистрируются с помощью зонда СТМ 7 (рис. 17, б). АСМ может работать в контактном и бесконтактном режимах. В первом случае работы АСМ подвод зонда к поверхности осуществляется на небольшие расстояния, когда преобладают силы отталкивания (второе слагаемое в уравнении Леннарда — Джонса). При этом острие зонда фактически контактирует с поверхностью, и изменения высоты зонда в ходе сканирования непосредственно описывают исследуемый профиль. Информация от пьезосканера и фотодиода поступает в компьютер, который представляет результат измерений в цифровом виде.
Фотодиод а
Рис. 17. Устройство и принцип работы АСМ
а - фоторегистрация высоты зонда; - регистрация высоты с использованием зонда туннельного микроскопа
58
Информацию о поверхности образца можно регистрировать в трех видах: высота (Height), отклонение (Deflection), трение (Friction). Высота — высота образца (перемещение по оси Z пьезосканера). В этом режиме записи содержится информация о рельефе поверхности. В режиме отклонения лучше видны микроскопические детали поверхности, так как этот режим записи соответствует ошибке в системе обратной связи, поддерживающей постоянной деформацию кантилевера. Трение — тангенциальная составляющая деформации кантилевера.
Поверхность образца представляется «топографической картой», где чаще всего более светлые участки на изображении соответствуют большим значениям высоты и отклонения.
В бесконтактном режиме силы притяжения (первое слагаемое в уравнении Леннарда — Джонса) больше сил отталкивания. При сканировании зонду 1 навязываются механические колебания с частотой, близкой к резонансной частоте кантилевера 2, и регистрируется изменение частоты колебаний, вызванных притяжением зонда к поверхности. Это изменение частоты связано линейно с изменением силы притяжения, поэтому разностный частотный отклик в разных точках поверхности зависит от локального расстояния зонд — образец и позволяет построить изображение профиля поверхности. Амплитуды колебаний составляют порядка нанометра, поэтому среднее расстояние между зондом и поверхностью должно быть не меньше нескольких нанометров. Модуляционные методы нашли широкое применение при исследовании материалов с пониженной поверхностной жесткостью — полимерных материалов и биополимеров.
АСМ позволяет измерять не только профиль поверхности (вплоть до регистрации отдельных молекул), но и локальные силы трения, величину адгезии, упругие и вязкие свойства поверхности с субна-нометровым пространственным разрешением.
Развитие зондовых методов исследования поверхности происходит и в настоящее время. Современные мультимодовые атомно-си-ловые микроскопы могут сочетать в себе несколько методов сканирующей зондовой микроскопии, что очень удобно для всестороннего исследования поверхности и ее свойств. Так, например можно изучать локальные вязкоупругие свойства поверхности (измерять модуль Юнга в точке, величину адгезии между зондом и образцом).
ЛЕКЦИЯ 7
Оценка точности физических измерений
Задача измерений в науке и технике — найти приближенное значение истинного значения хд и указать границы неопределенности этой оценки, являющиеся в некотором вероятностном смысле мерой отклонения х от х0. Это необходимо, чтобы сделать определенные выводы из эксперимента.
Основные правила действий с приближенными числами:
1. При сложении и вычитании приближенных чисел после запятой следует ставить столько знаков, сколько их имеет приближенное число с наименьшим числом десятичных знаков. Пример: 21,32+11,4=32,7.
2. При умножении и делении в результате оставляют столько знаков, сколько их имеет приближенное число с наименьшим числом значащих цифр. Пример: 2463x1,1=2,7х103.
3. При возведении в квадрат и куб следует сохранять столько значащих цифр, сколько их имеет возводимое в степень число.
4. При извлечении квадратного и кубического корней в результате следует брать столько цифр, сколько их имеет приближенное значение подкоренного числа.
5. Во всех промежуточных результатах следует сохранять одной цифрой больше, чем рекомендуется в предыдущих правилах. В окончательном результате эта цифра отбрасывается.
6. Если некоторые данные (при сложении или вычитании) имеют больше десятичных знаков или больше значащих (при умножении, делении, возведении в степень, извлечении корня), чем другие, то их следует округлить, сохраняя лишь одну лишнюю цифру.
7. Все ошибки достаточно приводить с двумя значащими цифрами.
8. Наименьшие разряды численных значений результатов измерений и численных показателей точности должны быть одинаковы.
р(х) = -
2а2
ь
Нормальные случайные величины
Рассмотрим случай непрерывной случайной величины, способной принимать любые значения из некоторого интервала (а, Ъ). Нормальной (или гауссовской) случайной величиной называется случайная величина X, определенная на всей оси (~°°, +°°) и имеющая плотность вероятности (плотность распределения)
60
где х0 и а > 0 — числовые параметры (не случайные величины); х0 — истинное значение случайной величины X; о2 — ее дисперсия (рис. 18). Множество значений X может быть любым, однако должны выполняться два условия:
1) плотность р(х) положительна;
2) интеграл от плотности по всему интервалу (~°°, +.°°) равен 1:
J p(x)dx = l.
Рис. 18. Две нормальные плотности вероятности, соответствующие хд = 0, о = 1 и х0 = 0, а = 0,5
При этом вероятность того, чтоХокажется в интервале (а, Ь), равна:
Параметр х0 не влияет на форму кривой р(х), изменение его приводит лишь к сдвигу кривой вдоль оси ж, однако при изменении а форма кривой меняется. Действительно, можно видеть, что
Если уменьшить о, то max р(ж) будет возрастать, но площадь под кривой остается равной 1. Поэтому кривая будет сужаться в окрестности х = xQ. На рис. 18 построены две нормальные плотности с парамет-
61
рами ж0 = 0, а = 1 и х0 = О, о = 0,5. Нетрудно вычислить, что каковы бы ни были х0 и а, действительны следующие соотношения:
Р[(хо-а)<Х<(хо+а)]= J p(x)dx = 0,683, Р[(х0-2ст)<Х<(х0+2о)]= J p(x)dx = 0,954, Р[(хо-За)<Х<(хо+За)]= J p(x)dx = 0,997.
Эти соотношения дают вероятность найти значения переменной X в пределах, заданных определенными значениями о.
Центральная теорема теории вероятности говорит, что при достаточно большом числе нормально распределенных случайных величин их сумма также распределена нормально. Поэтому измеряемые физические величины распределены по нормальному закону, так как являются результатом суммарного действия независимых случайных факторов: колебаний давления, температуры, показаний измерительного прибора, условий снятия показаний измерительного прибора и т.д.
Среднее и истинное значение изменяемой величины. Типы ошибок
Случайные помехи приводят к разбросу повторных результатов измерения ж,, х2,..., х.,..., хп одной и той же величиныX. Такие величины называются случайными или переменными величинами. Неограниченное число измерений одной и той же величины дает генеральную совокупность. Измерения свойств генеральной совокупности осуществляются с помощью конечной группы объектов, выбранных из генеральной совокупности. Такая группа называется выборкой, а число п элементов в ней — объемом выборки. Генеральная совокупность может быть реальной (например, большая партия производственных изделий) или гипотетической (например, результаты измерения физической величины). Большие совокупности результатов измерений физической величины имеют нормальное распределение и следующие свойства:
1. Больше всего результатов концентрируется около среднеарифметического:
62
2. Положительные и отрицательные отклонения результатов от среднего, т. е. х(—хп, встречаются одинаково часто.
3. Чем больше абсолютная величина xi-xn, тем она встречается
реже.
Среднеарифметическое по всей генеральной совокупности
(X) = ±±х,
называется средним значением или математическим ожиданием. Число 5S = ж, - (X) называется случайной ошибкой г-го измерения.
Ее можно рассматривать как значение случайной переменной, равной разности между случайной величиной X и ее средним значением Л = Х-(Х).
Переменная А называется случайной ошибкой. Среднеарифметическое п результатов имеет случайную ошибку
г(1 2п) (1 2 п
it ТЬ
Так как случайные ошибки имеют разные знаки, они компенсируют друг друга при сложении, таким образом среднеарифметическое является более точной оценкой среднего, чем отдельные значения xf Отклонение среднего от истинного значения физической величины х0
которое находится на основе полного физического анализа, называется систематической ошибкой. Выбросом или грубой ошибкой называется ошибка, принадлежность которой к основной совокупности случайных ошибок Д является маловероятной. В зависимости от условий измерения некоторые ошибки могут оказаться случайными, или систематическими, или грубыми. Например, отсчет показаний на шкале
по проекции стрелки прибора. Далее примем, что Ас = 0 и (X) = х0.
Дисперсия
Характеризует степень разброса значений генеральной совокупности xv хг,..., х.,... по отношению к среднему и определяется как сред-
63
нее значение квадратов разностей между средним и всеми элементами генеральной совокупности:
Корень квадратный из дисперсии называется квадратичным отклонением а случайной переменной X. При конечном значении п можно получить только приближенное значение дисперсии, которая называется выборочной дисперсией, или оценкой дисперсии:
J =
п—1 ,=1
J1 » а2, чем больше п, тем ближе J2 к а2, ж к х . При п > 12 с хорошей точностью Р — а2. Далее будет, что п имеет достаточно большое значение.
Среднее и дисперсия совокупности среднеарифметических
Пусть проведено N повторных серий по п измерений в каждой и вычислены среднеарифметические для каждой серии х,, да ,„., х.,..., где х. — среднеарифметическое п результатов, объединенных в г-ю серию. Найдем среднее среднеарифметических и их дисперсию:
—(^i
где nN — число результатов в N сериях. Дисперсия совокупности равна:
°1 =^Е(^о~^)2 =-21 *о --(*« +*« +-+*fc) =
2
Поскольку положительные и отрицательные ошибки встречаются с равной вероятностью, второй член при увеличении N стремится к нулю, а первый член —■ дисперсия совокупности отдельных измерений, т. е.
64
и
п
n(n-l)
Таким образом, дисперсия совокупности среднеарифметических результатов п измерений в п раз меньше дисперсии совокупности отдельных измерений.
Реально обычно имеют одну выборку из п измерений xv х2,..., ее,,..., хп. Естественно, одно среднеарифметическое меньше отклонится от истинного значения хо(в отсутствие систематической ошибки), чем отдельные результаты х{. Таким образом, квадратичное отклонение
а
°~г - ~Т= является мерой неточности оценки хп. Поскольку.резуль-
таты отдельных измерений имеют квадратичное отклонение о, можно сказать, что хп в -Jn раз более точная оценка х0, чем отдельный результат х.. Причина этого — в частичной компенсации случайных ошибок отдельных результатов х. Из закона нормального распределения случайных величин следует, что хп отклоняется от х0 более чем
на ±—== только в 5 случаях из 100, а на ±—j= лишь в 3 случаях из
Vn " Vn
1000. Для отдельного результата xi в этих соотношениях надо взять соответственно ±2о и ±3о. Поэтому измеренные значения х{, для
которых \хг■— хпI>Зо, обычно отбрасывают, считая их грубыми ошибками (правило «трех сигм"), после чего вновь вычисляют величины 5 , а, и а,,.
Оценка квадратичного отклонения по размаху
Результаты измерения можно расположить в ряд по возрастающей величине: ж(1)) х(2),..., х{п).
Разность наибольшего и наименьшего результата выборки
называется размахом выборки п и дает возможность получить оценку а по формулам:
65
Коэффициенты (dj ' приведены в табл. 2.
Таблица 2
N |
|
ЛГ |
(<*„)-' |
JV |
(су1 |
2 |
0,886 |
7 |
0,370 |
12 |
0,307 |
3 |
0,591 |
8 |
0,351 |
13 |
0,300 |
4 |
0,486 |
9 |
0,337 |
14 |
0,294 |
5 |
0,430 |
10 |
0,325 |
15 |
0,288 |
6 |
0,395 |
11 |
0,315 |
16 |
0,283 |
При небольшом числе измерений (п < 12) оценка по размаху по точности не уступает оценке по квадратам разностей. На основании изложенного становится понятным принятое представление конечного результата неоднократных измерений в виде
---- rtf. Л- _
_______
I— •
Vn
В качестве примера ниже приводятся результаты измерения светостойкости красочного слоя при воздействии интенсивного ультрафиолетового излучения в течение 15 дней (табл. 3).
хп = 33,92/15 = 2,261; ст2 = 0,3406/14 = 0,0243; а = 0,0160;
15
= 0,00162; аг=0,04.
Таблица 3
День |
Опт. плотность, xi |
|
|
1 |
2,48 |
+0,22 |
0,0484 |
2 |
2,50 |
+0,24 |
0,0576 |
3 |
2,50 |
+0,24 |
0,0576 |
4 |
2,32 |
+0,06 |
0,0036 |
5 |
2,09 |
-0,17 |
0,0289 |
6 |
1,98 |
-0,28 |
0,0784 |
7 |
2,07 |
-0,19 |
0,0361 |
8 |
2,28 |
+0.02 |
0,0004 |
9 |
2,27 |
+0,01 |
0,0001 |
10 |
2,20 |
-0,06 |
0,0036 |
11 |
2,30 |
+0,04 |
0,0016 |
жение хп — случайной. Если значение неизвестного параметра а с вероятностью Р заключено в интервале от аг до ос2, то а1 и ос2 называют 100Р%-ными доверительными пределами для а. Возвращаясь к рассмотренному выше примеру определения светостойкости красочного слоя, можно утверждать, что D = х0 = 2,26±0,04; 2,30 и 2,22 являются 68%-ными доверительными пределами для D (к — 1); или D = х0 = 2,26±0,08; 2,34 и 2,18 являются 95%-ными доверительными пределами для D(k = 2).
ЛЕКЦИЯ 8
Подбор формул по данным эксперимента методом наименьших квадратов
1. Построение графика по экспериментальным данным. Выявление характерных особенностей: прохождение кривой через начало координат, поведение при больших и малых значениях аргумента, пересечение осей и т.д.
2. Определение постоянных величин, входящих в формулу, например, у = fcx. Каждый опыт дает определенное значение кп — уп/хп. Среднее значение
_
7. __
к, —
где р — общее число опытов. Получаем формулу у = х. Если Ду — ошибка измерения, Pie зависящая от хп, то ошибка в величине кп, равная Ауп/хп, тем больше, чем меньше хп. Следует ориентироваться на опыты с большим х .
п
3. Задача: найти такое значение к, которое наилучшим образом соответствует опытным данным. За меру отклонения функции от экспериментальных данных для n-го опыта берется величина (уп — kxj2. Квадрат берется для того, чтобы избежать взаимной компенсации положительных и отрицательных отклонений. В качестве меры общей ошибки в описании опытных данных функцией у = кх берется сумма отклонений:
Метод определения констант при условии, чтобы общее отклонение S было минимальным, называется методом наименьших квадратов (МНК). Если одно отклонение равно 10, то вклад в S будет равен 100, а десять отклонений по 1 дадут вклад 10, таким образом МНК направлен на уменьшение самых больших отклонений. Чтобы найти значение
k = k, при котором S наименьшее, решаем —— = 0. Отсюда имеем:
dk
и далее
что дает
р
n=l
±<
... + Х2
Если в каждом опыте точно уп = кхп, то имеем
— «X. ь Н"Х. 1 т ЗСпгСОСп "т ... "г ^т)"'*^'11
Если для различных опытов fcn = yn/xn различно, то, подставляя вместо уп его значение &пхп, получим
/CX + /СХ + + /СХ
1 2 ■" р
Среди разных кп, полученных в разных опытах, есть fcmax и kmi . Если в предыдущем уравнении заменить все кп на fcmax или ?cmin, то получим ^есть fcmin < к < fcmax, т.е. найденная из условия минимума S величина к действительно является средней из всех значений кп, однако каждая величина к. входит в числитель со своим множителем х^, называемым весом. Ясно, что чем больше вес, тем сильнее влияет на величину к измерение, соответствующее значению х = хп, т.е. измерения с большими хп важнее для правильного определения к.
4. Более часто встречается линейная зависимость вида
у — 1 + кх.
Для этого случая
Надо выбрать числа Ink так, чтобы величина S была минимальной. Предположим, что I уже найдено, тогда в правой части последнего равенства можно было бы изменять только к и, следовательно,
70
С другой стороны, если бы было найдено fc, то
dS p dl n=i
Эти два условия дают следующую систему уравнений для определения Ink:
n=l
p p p p
Обозначим a = Xxn> ъ = £xl. c = EУп, d = JJxnyn.Tomaсисте-
му уравнений можно записать так:
Ък + al = d, ак + pl = с. Решая эту систему, получаем искомые значения fc и I:
pd-ca _ pb-a2
;_cb-da_n=1
_ 71=1
р
Линейная зависимость является наиболее распространенной закономерностью, например, закон Ома: V — RI (переменные — ток и напряжение, определяется сопротивление), зависимость длины металлического стержня от температуры (переменные — температура и длина, определяется коэффициент линейного расширения) и т.д. Кроме того, к линейному виду приводятся более сложные функции, как показано далее.
5. К линейному виду можно привести наиболее часто встречающиеся логарифмическую, экспоненциальную и степенную функции: у — I +fclnx. При замене lnx — х получаем линейную зависимость.
71
Логарифмическая функция характеризует, например, зависимость оптической плотности от экспозиции на линейном участке характеристической кривой, переменные — экспозиция и оптическая плотность, определяются коэффициентом контрастности и точкой инерции:
у' =т ехр(тсаг"*).
Логарифмируя, получаем \пу' = lnm + кх'п, и при замене lny' = у, lnm = I, х'п = х получаем линейное уравнение. Экспоненциальная функция описывает, например, радиоактивный распад элементов, временной ход процесса первого порядка или мономолекулярной химической реакции:
c(t) = c(0)exp(-t/x),
определяются переменные время и концентрация, с(0) — начальная концентрация, т — время жизни.
Закон Аррениуса дает температурную зависимость проводимости, коэффициента диффузии, скорости химических реакций и т.д.: а = стоехр(-ДЕ//сТ), переменные — абсолютная температура Т и измеряемая характеристика а, определяются как энергия активации процесса ДЕ и предэкспоненциальный множитель аоу' = тп(х')(с. Логарифмируя, получаем lny' = lnm +Mnx'. При замене \пу' - у, lnm = I, 1пж' = х снова получаем линейное уравнение. Степенная функция описывает, например, зависимость времени пролета носителей заряда t через транспортный слой электрофотографического фоторецептора при формировании скрытого электростатического изображения: t^ — d/mF, здесь d — толщина слоя, т — подвижность носителей заряда, F — электрическое поле в слое. Переменные — электрическое поле и время пролета определяют величину подвижности. Далее по приведенному выше способу рассчитываются к и I, а из них константы исходных функций. Как видно из приведенных выражений, графики полученных функций могут быть получены в линейных приведенных координатах или в координатах исходных переменных.
6. Для того чтобы определить, какая функция наиболее соответствует экспериментальной зависимости, используется коэффициент
корреляции г. Введем обозначение
=s , тогда
pd-ac
n=l n=l
Чем больше коэффициент, тем лучше корреляция и тем лучше соответствующая функция соответствует экспериментальным данным. При максимальной корреляции г = ±1. При малых значениях г корреляция между х и у мала или отсутствует, но это не значит, что у не зависит от х.