Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
6. Математика в ІТ.docx
Скачиваний:
123
Добавлен:
17.07.2024
Размер:
18.44 Mб
Скачать

6.2. Елементи аналітичної геометрії

6.2.1. Пряма і площина в просторі. Поняття гіперплощини

Пряма або пряма лінія — одне з основних понять геометрії, введене античними математиками для позначення прямих об'єктів (тобто без кривини) з несуттєвою шириною та глибиною. Прямі є ідеалізаціями таких об'єктів.

Евклід описує пряму, як лінію нескінченної довжини, яка розташована однаково по відношенню до будь-якої своєї точки. Він визначив набір постулатів, як основних властивостей, що приймаються без доведень, а вже з них робляться логічні доведення, які і утворюють всю геометрію, яка зараз називається Евклідовою геометрією. Починаючи з кінці 19 сторіччя в активному вжитку знаходяться й інші геометрії, такі як неевклідові геометрії, проективна та афінна геометрії.

В сучасній математиці, в якій є багато геометричних концепцій, поняття лінії здебільшого залежить від способу, яким геометрія описується. Наприклад, в аналітичній геометрії, пряма визначається як множина точок, координати яких задовольняють лінійне рівняння. В більш абстрактних концепціях, таких, як геометрія інцидентності, пряма може бути незалежним об'єктом, відмінним від тих точок, з яких вона складається.

При аксіоматичному опису геометрії, поняття прямої лінії зазвичай залишається невизначеним, приймається за одне з вихідних понять (так зване неозначуване поняття), яке лише опосередковано визначається аксіомами геометрії. Перевагою такого підходу є гнучкість у використанні такої геометрії. Так у диференціальній геометрії, пряму можна розуміти як геодезичну лінію (найкоротший шлях між двома точками), а в проективній геометрії пряма є двовимірним векторним простором (всі лінійні комбінації двох незалежних векторів). Така гнучкість корисна не тільки математикам, а й іншим. Наприклад, фізики можуть мислити шлях проходження світла, як пряму лінію.

Визначення і описання. Всі визначення з рештою є циркулярними[en] за своєю природою, оскільки вони залежать від понять, які також повинні мати визначення, і цей ланцюг залежностей не можна продовжувати нескінченності без повернення назад до початкової точки. Тому, аби уникнути такого зациклювання, певні поняття мають бути прийняти як такі, що не потребують визначення.[1] В геометрії, таким поняттям часто є поняття прямої, що є одним із фундаментальним понять.[2] В тих випадках, коли пряма може бути визначеним поняттям, як у аналітичній геометрії, за фундаментальні поняття обираються якісь інші примітиви. Якщо поняття прямої є фундаментальним невизначеним поняттям, тоді поведінка і властивості прямої визначають за допомогою аксіом, яким вона повинна задовольняти.

При спрощеному або неаксиоматичному трактуванні геометрії, поняття або фундаментальне означення може бути занадто абстрактним, для уявлення. В таких випадках наводять описання або ментальний образ цього первісного поняття, аби сформувати основу для вибудовування поняття, яке формально буде базуватися на (невизначених) аксіомах. Деякі автори можуть наводити таке описання замість визначення, користуючись цим неформальним стилем представлення. Але ці визначення не є вірними, і не можуть використовуватися в формальних виведеннях тверджень. «Визначення» прямої в в математичних трактатах Евкліда підпадає під цю категорію. Навіть, при розгляді певної системи геометрії (наприклад, Евклідової геометрії), між авторами не існує загальноприйнятої згоди, щодо того яким повинно бути неформальне описання прямої, і те що воно не повинно розглядатися формально.

Властивості прямої в евклідовій геометрії:

  • Через будь-яку точку можна провести нескінченно багато прямих.

  • Через будь-які дві незбіжні точки можна провести єдину пряму.

  • Дві незбіжні прямі на площині або перетинаються в єдиній точці, або є паралельними (випливає з попереднього). У тривимірному просторі існують три варіанти взаємного розташування двох прямих.

  • У тривимірному просторі існують три варіанти взаємного розташування двох прямих:

    • прямі перетинаються;

    • прямі паралельні;

    • прямі мимобіжні.

Пряма або пряма лінія — одне з основних понять геометрії, введене античними математиками для позначення прямих об'єктів (тобто без кривини) з несуттєвою шириною та глибиною. Прямі є ідеалізаціями таких об'єктів.

Евклід описує пряму, як лінію нескінченної довжини, яка розташована однаково по відношенню до будь-якої своєї точки. Він визначив набір постулатів, як основних властивостей, що приймаються без доведень, а вже з них робляться логічні доведення, які і утворюють всю геометрію, яка зараз називається Евклідовою геометрією. Починаючи з кінці 19 сторіччя в активному вжитку знаходяться й інші геометрії, такі як неевклідові геометрії, проективна та афінна геометрії.

В сучасній математиці, в якій є багато геометричних концепцій, поняття лінії здебільшого залежить від способу, яким геометрія описується. Наприклад, в аналітичній геометрії, пряма визначається як множина точок, координати яких задовольняють лінійне рівняння. В більш абстрактних концепціях, таких, як геометрія інцидентності, пряма може бути незалежним об'єктом, відмінним від тих точок, з яких вона складається.

При аксіоматичному опису геометрії, поняття прямої лінії зазвичай залишається невизначеним, приймається за одне з вихідних понять (так зване неозначуване поняття), яке лише опосередковано визначається аксіомами геометрії. Перевагою такого підходу є гнучкість у використанні такої геометрії. Так у диференціальній геометрії, пряму можна розуміти як геодезичну лінію (найкоротший шлях між двома точками), а в проективній геометрії пряма є двовимірним векторним простором (всі лінійні комбінації двох незалежних векторів). Така гнучкість корисна не тільки математикам, а й іншим. Наприклад, фізики можуть мислити шлях проходження світла, як пряму лінію.

Всі визначення з рештою є циркулярними за своєю природою, оскільки вони залежать від понять, які також повинні мати визначення, і цей ланцюг залежностей не можна продовжувати нескінченності без повернення назад до початкової точки. Тому, аби уникнути такого зациклювання, певні поняття мають бути прийняти як такі, що не потребують визначення.[1] В геометрії, таким поняттям часто є поняття прямої, що є одним із фундаментальним понять.[2] В тих випадках, коли пряма може бути визначеним поняттям, як у аналітичній геометрії, за фундаментальні поняття обираються якісь інші примітиви. Якщо поняття прямої є фундаментальним невизначеним поняттям, тоді поведінка і властивості прямої визначають за допомогою аксіом, яким вона повинна задовольняти.

При спрощеному або неаксиоматичному трактуванні геометрії, поняття або фундаментальне означення може бути занадто абстрактним, для уявлення. В таких випадках наводять описання або ментальний образ цього первісного поняття, аби сформувати основу для вибудовування поняття, яке формально буде базуватися на (невизначених) аксіомах. Деякі автори можуть наводити таке описання замість визначення, користуючись цим неформальним стилем представлення. Але ці визначення не є вірними, і не можуть використовуватися в формальних виведеннях тверджень. «Визначення» прямої в в математичних трактатах Евкліда підпадає під цю категорію.[2] Навіть, при розгляді певної системи геометрії (наприклад, Евклідової геометрії), між авторами не існує загальноприйнятої згоди, щодо того яким повинно бути неформальне описання прямої, і те що воно не повинно розглядатися формально.

Властивості прямої в евклідовій геометрії:

  • Через будь-яку точку можна провести нескінченно багато прямих.

  • Через будь-які дві незбіжні точки можна провести єдину пряму.

  • Дві незбіжні прямі на площині або перетинаються в єдиній точці, або є паралельними (випливає з попереднього). У тривимірному просторі існують три варіанти взаємного розташування двох прямих.

  • У тривимірному просторі існують три варіанти взаємного розташування двох прямих:

    • прямі перетинаються;

    • прямі паралельні;

    • прямі мимобіжні.

Властивості. Пряма m паралельна площині α тоді та лише тоді, коли в цій площині існує деяка пряма p паралельна прямій m. Якщо пряма m паралельна кожній з площин α та β що перетинаються, то вона паралельна лінії їхнього перетину. Якщо три площини попарно перетинаються та не мають спільної прямої, то лінії їхнього перетину або паралельні або мають спільну точку.

В проективній геометрії. В багатьох моделях проективної геометрії, представлення прямої рідко відповідає поняттю «прямої лінії», як це є в Евклідовій геометрії. Типовий приклад цього, можна побачити в еліптичній геометрії.[7] У випадку сферичного представлення еліптичної геометрії, прямі представлені як великі кола на сфері із визначеними на них діаметрально протилежними точками. У іншій моделі еліптичної геометрії, прямі задаються Евклідовими площинами, які проходять через початок системи координат. Хоча ці представлення візуально є відмінними, вони задовольняють властивостям проективної геометрії (наприклад, що дві точки визначають лише одну пряму), що роблять їх зручною відповідністю поняття прямої в цій геометрії.

Гіперплощина – підпростір, розмірність якого на одиницю менша за розмірність простору, якому він належить. Приклади:

  • Наш тривимірний світ утворює так звану гіперплощину, тобто об'єкти, що мають більш низький вимір, ніж простір, у якому вони перебувають.

  • Для двовимірного простору гіперплощиною є пряма, для тривимірного – площина.

  • У моделі Хойла Всесвіт – це гіперплощина, яка розширюється.

У машинному навчанні гіперплощина – це межа рішення, яка ділить вхідний простір на дві або більше областей, кожна з яких відповідає окремому класу або вихідній мітці. У двовимірному просторі гіперплощина - це пряма лінія, яка ділить простір на дві половини. У 3D-просторі, однак, гіперплощина - це площина, яка ділить простір на дві половини. Тим часом у просторах вищої розмірності гіперплощина - це підпростір на один вимір менший, ніж вхідний простір.

Гіперплощини часто використовуються в алгоритмах класифікації, таких як машини опорних векторів (SVM) і лінійна регресія, для розділення точок даних, що належать до різних класів. Вони також використовуються в алгоритмах кластеризації для виявлення кластерів точок даних у вхідному просторі.

Щоб знайти оптимальну гіперплощину для завдання класифікації, алгоритми часто намагаються максимізувати відстань між гіперплощиною і найближчими точками даних з кожного класу. Це пов'язано з тим, що більша відстань зазвичай призводить до більш надійної та узагальнюючої моделі.

Гіперплощини також можна використовувати в задачах регресії, де метою є прогнозування неперервного вихідного значення, а не мітки класу. У цьому випадку гіперплощина являє собою лінію найкращої відповідності, яка мінімізує суму квадратів похибок між прогнозованими значеннями та істинними значеннями.

Загалом, гіперплощини відіграють центральну роль у багатьох алгоритмах машинного навчання і є важливою концепцією, яку необхідно розуміти, щоб ефективно застосовувати ці алгоритми для вирішення реальних проблем.

Рівняння гіперплощини у n-вимірному просторі має вигляд:

w_1x_1 + w_2x_2 + ... + w_nx_n + b = 0

де w - вектор ваг, а b - член зсуву. Ваги та зсув визначають орієнтацію та положення гіперплощини у вхідному просторі.

Теорема про розділення гіперплощин. Теорема про розділення гіперплощиною стверджує, що для двох класів точок даних, які лінійно розділяються, існує гіперплощина, яка ідеально розділяє ці два класи. Ця теорема важлива, оскільки вона гарантує існування розв'язку для багатьох алгоритмів класифікації, які мають на меті знайти гіперплощину, що розділяє класи.

Опорний гіперплан. Опорна гіперплощина - це гіперплощина, яка торкається принаймні однієї точки даних з кожного класу. У задачі класифікації двох класів може бути декілька гіперплощин, які розділяють класи, але лише одна з них - гіперплощина з максимальним запасом - має максимальну відстань між гіперплощиною і найближчими точками даних з кожного класу. Ця максимальна відстань називається відстанню. Гіперплощині з максимальним відступом часто надають перевагу, оскільки вона має найбільшу відстань між класами, а отже, менш схильна до надмірної підгонки і більш узагальнююча для невидимих даних.

У машинах опорних векторів (SVM) гіперплощину з максимальним запасом знаходять шляхом розв'язання опуклої оптимізаційної задачі, яка має на меті максимізувати запас, одночасно гарантуючи, що всі точки даних класифіковані правильно. Цю оптимізаційну задачу можна ефективно розв'язати за допомогою таких методів, як алгоритм градієнтного спуску або алгоритм первинно-дуальної оптимізації.

Гіперпланування - це процес пошуку гіперплощини в моделі машинного навчання. У задачах класифікації метою гіперпланування є пошук гіперплощини, яка точно розділяє різні класи точок даних у вхідному просторі. У задачах регресії мета полягає в тому, щоб знайти гіперплощину, яка точно прогнозує безперервні вихідні значення на основі вхідних даних.

Ретельне гіперпланування може допомогти підвищити точність та узагальненість моделі.

Ці алгоритми використовують різні підходи для пошуку оптимальної гіперплощини, такі як мінімізація суми квадратів помилок у лінійній регресії або максимізація відстані між гіперплощиною та найближчими точками даних у SVM.

Гіперпланування є важливим кроком у процесі машинного навчання, оскільки гіперплан визначає, як модель буде класифікувати або прогнозувати вихідні значення для нових точок даних.