Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГАК-2026.docx
Скачиваний:
1
Добавлен:
16.06.2026
Размер:
2.66 Mб
Скачать

2.6. Генеративно-состязательные сети (Generative Adversarial Networks, gan)

Описание: Архитектура, состоящая из двух сетей, соревнующихся друг с другом:

  • Генератор (Generator) — создаёт поддельные данные (изображения, текст), пытаясь обмануть дискриминатор.

  • Дискриминатор (Discriminator) — пытается отличить реальные данные от поддельных.

Процесс обучения: Генератор учится создавать всё более реалистичные данные, дискриминатор учится лучше их распознавать. В итоге достигается равновесие, когда генератор создаёт данные, неотличимые от реальных.

Применение:

  • Генерация реалистичных изображений (DeepFakes, генерация лиц несуществующих людей — This Person Does Not Exist).

  • Улучшение разрешения изображений (super-resolution).

  • Стилизация изображений (превращение фото в картину в стиле Ван Гога).

  • Генерация музыки, текста, видео.

2.7. Графовые нейронные сети (Graph Neural Networks, gnn)

Описание: Архитектура для обработки данных, представленных в виде графов (узлы и рёбра). Учитывает как свойства узлов, так и структуру связей.

Применение:

  • Социальные сети (предсказание связей, анализ сообществ).

  • Химия и биология (предсказание свойств молекул).

  • Рекомендательные системы (пользователи и товары как узлы, взаимодействия как рёбра).

  • Транспортные сети, логистика.

3. Сравнительная таблица архитектур

Архитектура

Тип данных

Сильные стороны

Слабые стороны

Основные области

MLP (полносвязная)

Табличные, векторы

Простота, универсальность

Не учитывает структуру, много параметров

Классификация/регрессия на табличных данных

CNN

Изображения, сетки

Учёт локальной структуры, инвариантность к сдвигу

Требует много данных, не для последовательностей

Компьютерное зрение, обработка видео

RNN/LSTM/GRU

Последовательности (текст, временные ряды)

Учёт порядка, память о прошлом

Плохо параллелятся, проблемы с длинными последовательностями

NLP, временные ряды, распознавание речи

Трансформеры

Последовательности (текст, изображения)

Учёт дальних зависимостей, параллелизация

Требуют много данных и вычислительных ресурсов

NLP, генерация текста, мультимодальные задачи

Автокодировщики

Любые

Обучение представлений без учителя, сжатие

Качество реконструкции может быть низким

Уменьшение размерности, шумоподавление

GAN

Изображения, аудио

Генерация реалистичных данных

Сложное обучение (нестабильность)

Генерация контента, DeepFakes

GNN

Графы

Учёт структуры связей

Сложность масштабирования

Соцсети, химия, рекомендации

4. Заключение

Ключевые выводы:

  1. Выбор архитектуры зависит от типа данных и решаемой задачи.

  2. MLP — базовая архитектура для табличных данных.

  3. CNN — стандарт для изображений и любых данных с пространственной структурой.

  4. RNN/LSTM/GRU — для последовательностей (но трансформеры их вытесняют).

  5. Трансформеры — современный стандарт для NLP и всё чаще для других областей.

  6. Автокодировщики, GAN, GNN — специализированные архитектуры для своих ниш.

  7. Часто в реальных проектах используются комбинации архитектур (например, CNN + LSTM для видео с текстовым описанием).