Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГАК-2026.docx
Скачиваний:
1
Добавлен:
16.06.2026
Размер:
2.66 Mб
Скачать

2.7. Пример

Задача: Классификация изображений кошек и собак.

  • Вход: изображение (пиксели).

  • Выход: метка "кошка" или "собака".

  • Данные: 10 000 размеченных фотографий кошек и собак.

  • Модель: свёрточная нейронная сеть.

  • Процесс: сеть обучается на этих 10 000 примерах, настраивая веса так, чтобы правильно классифицировать как можно больше изображений. После обучения она может классифицировать новые, ранее не виденные фотографии.

3. Обучение без учителя (Unsupervised Learning)

3.1. Определение

Обучение без учителя — это парадигма, при которой модель обучается на неразмеченных данных. Целевые значения (метки) отсутствуют. Модель должна самостоятельно найти скрытые структуры, закономерности или зависимости в данных.

"Учителя" нет — данные не говорят модели, что является правильным ответом.

3.2. Формальная постановка

Дано только множество входных данных X={x1,x2,...,xn}X={x1​,x2​,...,xn​} без меток. Необходимо найти в данных какую-либо структуру:

  • разбить на группы (кластеры);

  • найти признаки, по которым данные хорошо разделяются;

  • сжать данные с минимальной потерей информации;

  • найти часто встречающиеся сочетания.

3.3. Типы задач в обучении без учителя

Тип задачи

Цель

Примеры

Кластеризация (Clustering)

Разбить объекты на группы (кластеры) так, чтобы объекты внутри группы были похожи, а между группами — различны

Сегментация клиентов по поведению, группировка новостей по темам, выделение сообществ в социальных сетях

Поиск ассоциативных правил (Association Rule Learning)

Найти закономерности и часто встречающиеся сочетания

Анализ покупательской корзины (товары, которые часто покупают вместе)

Уменьшение размерности (Dimensionality Reduction)

Сжать данные, сохранив максимум полезной информации

Визуализация многомерных данных, извлечение признаков

Обнаружение аномалий (Anomaly Detection)

Найти объекты, которые сильно отличаются от большинства

Выявление мошеннических транзакций, обнаружение неисправностей оборудования

3.4. Как происходит обучение

В отличие от обучения с учителем, здесь нет прямой цели в виде меток. Алгоритмы без учителя используют различные критерии качества, зависящие от структуры данных:

  • Для кластеризации — минимизация расстояния внутри кластеров и максимизация расстояния между кластерами.

  • Для уменьшения размерности — сохранение дисперсии данных или структуры локальных соседей.

  • Для ассоциативных правил — поиск часто встречающихся наборов (support, confidence).

3.5. Примеры алгоритмов

Тип задачи

Алгоритмы

Кластеризация

K-средних (K-means), иерархическая кластеризация, DBSCAN, Gaussian Mixture Models

Уменьшение размерности

PCA (Principal Component Analysis), t-SNE, UMAP, автокодировщики (autoencoders)

Ассоциативные правила

Apriori, FP-Growth

Обнаружение аномалий

Isolation Forest, One-Class SVM