Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
VM_R3MA.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
4.83 Mб
Скачать

Околом точки називається гіперкуля деякого радіусу з центром в даній точці, тобто множина

.

Є інший, рівноправний, математично еквівалентний, підхід до узагальнення поняття околу. Візьмемо точку і виберемо звичайні околи для кожної координати цієї п-вимірної точки:

Назвемо околом точки множину всіх таких точок , координати яких потрапляють у відповідні околи відповідних координат точки . Фактично такий окіл є гіперпаралелепіпедом у п-вимірному просторі, його на математичному жаргоні називають ще гіперцеглиною.

Узагальнюємо поняття похідної.

Означення (частинної похідної функції багатьох змінних).

Нехай є функція п змінних і нехай – одна з її змінних. Зафіксуємо умовно („заморозимо”) усі змінні, крім , тобто будемо розглядати усі змінні, крім , як параметри; тоді функція стає параметричною функцією однієї змінної ; звичайна класична похідна цієї функції (по змінній ) називається частинною похідною по функції п змінних і позначається (читається „де еф по де ікс і”) або („еф штрих по ікс і”).

Можна навести відповідну „строгу” формулу, яка принципово нічим не відрізняється від формули, яка подає звичайну похідну як границю відношення приросту функції до приросту аргументу. Пропонуємо це зробити самостійно, в якості вправи.

Приклади.

1) ,

;

2) ,

;

3)

(функція сумарної квадратичної нев’язки з задачі лінійної апроксимації з п.21.1),

.

Теорема Ферма (для функцій багатьох змінних).

Якщо точка є точкою локального екстремуму функції п змінних , то кожна частинна похідна цієї функції, по кожній змінній, в точці дорівнює нулю:

Д о в е д е н н я. Нехай точка є точкою локального екстремуму функції п змінних . Тоді, очевидно, для функції однієї змінної – ця функція залежить тільки від змінної – точка буде точкою екстремуму, а тоді похідна (звичайна похідна), за класичною теоремою Ферма, в цій точці цієї функції повинна дорівнювати нулю. Але ж, за означенням, ця похідна є частинною похідною функції .

Теорему доведено.

Приклад. Застосуємо теорему Ферма для розв’язання задачі лінійної апроксимації з п.21.1, яка зведена до пошуку точки мінімуму функції сумарної квадратичної нев’язки:

Маємо: . Частинні похідні: . Утворюємо систему

і розв’язуємо її:

Таким чином, прямою, яка в сумарно-квадратичному найменше відхиляється від точок з координатами є пряма :

21.4. Градієнт функції.

Згадаємо фізичний зміст „звичайної” похідної функції однієї змінної : це миттєва швидкість зміни функції в точці. При цьому: якщо , то – це швидкість зростання, а якщо , то – це швидкість спадання функції. Або ще так: якщо , то зростає при русі аргумента у додатному напрямку, а при функція зростає при русі аргумента у від’ємному напрямку.

Нехай тепер ми маємо справу з функцією п змінних і – це деяка точка п-вимірного векторного простору. Тоді можливих напрямків руху з точки безліч. Який з напрямків є напрямком найскорішого зростання, а який – напрямком найскорішого спадання? Скажімо, у випадку двох змінних: з початку координат можна рухатись у будь-якому напрямку, що визначається будь-яким кутом від 0о до 360о . Ми загострюємо питання на напрямках найскорішого зростання і спадання, пам’ятаючи тезу Готфріда Вільгельма Лейбніца і Леонарда Ейлера про фундаментальність і „первісність” задач пошуку мінімумів і максимумів.

Відповідь на сформульоване питання дає поняття градієнту.

Означення (градієнту функції). Градієнтом функції в точці називається п-вимірний вектор, утворений зі значень частинних похідних даної функції в даній точці :

.

Щоб трохи зменшити громіздкість запису, використовують ще такий:

.

Координати вектора-градієнта – це частинні похідні, які є фактично звичайними похідними у припущенні, що „дозволений” рух лише певному аргументу. Отже, кожна координата цього вектора визначає напрямок найскорішого зростання і швидкість зростання по своїй осі. Після проведених міркувань стає інтуїтивно ясним твердження:

Теорема (про градієнт функції).

Вектор градієнту функції визначає напрямок найскорішого зростання у відповідній точці, а норма вектору градієнту є миттєвою швидкістю зростання функції.

Виконаємо одне спостереження. Розглянемо функцію . Як вже зазначалось, графічне зображення функцій багатьох змінних є справою „невдячною”, і лише для функцій двох змінних загальну картину прояснює використання ліній рівня. Перетворимо вираз, який визначає функцію , виділивши повні квадрати окремо у доданках, що містять змінні х і у :

.

Тепер усе готово для побудови ліній рівня. І не тільки: тривіальними (так математики називають те, простіше чого вони уявити не можуть) міркуваннями ми виводимо: точкою мінімуму функції є точка з координатами (-2.25; 3.75). І все ж таки, повернемось до ліній рівня. Лінії рівня визначаються рівняннями , де r – деяка (довільна) константа. Отже лінії рівня розглядуваної функції визначативатимуся рівняннями:

.

Надаючи параметру r („рівню”) довільні значення, будемо мати відповідні лінії рівня. Пригадуємо з аналітичної геометрії: – це канонічне рівняння кола з центром в точці і радіусом . Отже, лінії рівня нашої функції – це концентричні кола з центром в одній і тій самій точці і довільним радіусом :

З міркувань неперервності можна зрозуміти, що вся площина (в загальному випадку – весь п-вимірний простір) щільно заповнена лініями рівня (відповідно гіперповерхнями рівня) , через кожну точку проходить відповідна лінія (гіперповерхня) рівня, зокрема, наприклад, через початок координат. Знайдемо вектор градієнту нашої функції в точці :

:

Наша функція , очевидно, необмежена зверху, при необмеженому віддаленні від центру концентричних кіл – точки мінімуму функції – значення функції необмежено зростають до нескінченності. Обернемо вектор градієнту в діаметрально протилежному напрямку, такий вектор називається антиградієнт, він вказує напрямок найскорішого спадання функції:

:

В даному випадку цей вектор точно вказує на точку глобального мінімуму функції . Це має місце не завжди, але завжди вектор градієнту (і, зрозуміло, антиградієнту) перпендикулярний до лінії рівня функції, яка проходить через точку обчислення градієнту точніше, вектор градієнту перпендикулярний до дотичної до лінії рівня, проведеної через точку, в якій обчислено градієнт :

Для посилення внутрішньої впевненості розглянемо ще один приклад: . Виконаємо перетворення виразу, що визначає функцію: . Лінії рівня визначативатимуся рівняннями:

.

Ми отримали рівняння виду: . Це є канонічним рівнянням еліпсу з центром в точці і напівосями відповідно і (коло – це частинний випадок еліпсу:

).

Отже, лініями рівня розглядуваної функції є концентричні еліпси з центром в точці (-2.5; 1.5) , величина напівосей визначається значенням рівня r, наприклад, при r=0 маємо еліпс

з напівосями 2.89 і 1.83 (ця нульова лінія рівня виділена на малюнку); обчислимо також кілька градієнтів:

,

,

.

З урахуванням неточностей малюнку висновок підтвердився. Його можна строго довести, отже щодо вектора градієнту має місце

Теорема (про градієнт і поверхні (лінії) рівня).

Вектор градієнту функції багатьох змінних завжди є перпендикулярним до дотичної до поверхні рівня (лінії рівня – у випадку функції двох змінних), проведеної до поверхні рівня у точці обчислення градієнту.

Цікавим буде ретро-погляд на задачу лінійного програмування з двома змінними, яку ми розглядали в розділі „Аналітична геометрія”. Це задача пошуку точки екстремуму (мінімуму чи максимуму) лінійної функції на допустимій множині, яка визначається системою лінійних нерівностей. Візьмемо, для прикладу, таку лінійну функцію . Усі лінії рівня такої функції – це паралельні прямі з рівняннями ; вони мають спільний нормальний вектор , координати якого є коефіцієнтами при змінних:

Розв’язуючи таку задачу, ми зробили експериментальний висновок: вектор, координати якого дорівнюють коефіцієнтам при змінних у формулі, яка задає функцію, є вектором, що вказує напрямок на максимум. Ув’яжемо цей висновок з нашою теорією щодо функцій багатьох змінних. Нехай тепер – це лінійна функція загального вигляду: . Градієнт цієї функції: – це напрямок найскорішого зростання функції і він співпадає з нормальним вектором, спільним для всіх паралельних між собою ліній рівня лінійної функції, координатами якого є коефіцієнти при змінних у рівнянні функції.

- 264 -

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]