Сравнение производительности алгоритмов детекции объектов

Добавил:

AliceIlina связь https://discord.gg/sRPpSvnP Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский технический университет связи и информатики

Предмет:

Системы искусственного интеллекта

Файл:

Отчет_по_практике_БСТ2104_Первухина_А_А_.doc

Скачиваний:

Добавлен:

11.05.2025

Размер:

2.15 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 85 6 7 8 > Следующая >>>

Сравнение производительности алгоритмов детекции объектов

Технологии детекции эволюционировали от тяжёлых двухэтапных схем к ультрабыстрым однопроходным моделям, поэтому обсуждать производительность приходится сразу по нескольким осям: точность, скорость инференса и требуемые вычислительные ресурсы. На бенчмарке MS COCO Faster R‑CNN с бэкбоном ResNet‑101 долгое время служит «золотым стандартом» по качеству: при пороге IoU 0,5–0,95 сеть стабильно демонстрирует около 42 % mAP, но платой за это становится время отклика порядка 220 мс на одной NVIDIA V100, что делает модель непригодной для задач реального времени.

SSD даже в базовой конфигурации с VGG‑16 резко ускоряет обработку, достигая порядка 46 FPS на том же оборудовании, однако точность снижается до 25–27 % mAP. Компромисс между двумя полюсами предлагают семейства YOLO. Лёгкая версия YOLOv5‑s обрабатывает поток со скоростью свыше 150 FPS при mAP около 37 %, тогда как более тяжёлая YOLOv5‑x поднимает метрику до 51 % mAP, но замедляется до 30 FPS. Обновлённый YOLOv8 улучшил баланс: средняя конфигурация даёт около 53 % mAP при 45 FPS. RetinaNet благодаря функции Focal Loss удерживает планку 39–40 % mAP, хотя по скорости лишь немного опережает Faster R‑CNN.

На практике выбор движка диктуется графиком «точность–скорость». Рисунок на графике 3.3 показывает, как модели естественным образом группируются вдоль нисходящей кривой: каждый дополнительный процент точности обходится потерей десятков кадров в секунду.

Рисунок 3.3 — Кривая «точность–скорость» для современных алгоритмов детекции

Таблица 3.2 сводит ключевые цифры воедино, позволяя быстро оценить, какая модель подходит для мобильных устройств, а какая – для серверного оффлайн‑анализа. В ней отдельно отмечены гибридные схемы, когда тяжёлая сеть периодически переоценивает поток, а облегчённая используется для непрерывного мониторинга; такой подход снижает среднюю задержку без серьёзного ущерба качеству.

Таблица 3.2 — Сводные показатели точности и скорости популярных детекторов

Модель	Версия	mAP@0.5:0.95 (COCO)	Скорость инференса, FPS*	Параметры, млн
Faster R‑CNN (2‑stage)	ResNet‑101‑FPN	39,4	~6	60
RetinaNet	ResNet‑101‑FPN	39,1	~20	44
SSD300	VGG‑16	25,1	~46	34
YOLOv3‑416	Darknet‑53	33,0	~45	61
YOLOv5s	CSPNet	36,7	~140	7
YOLOv5l	CSPNet	46,4	~48	46
YOLOv8m	C2f	50,2	~111	27

Следует помнить, что «сухие» цифры с COCO или Pascal VOC не гарантируют аналогичного поведения на прикладных данных. Перед внедрением любую из перечисленных сетей необходимо дообучить на отраслевом датасете и протестировать в целевой среде, где на результат влияют шум, вариации освещения и ракурсов. Лишь тогда таблица производительности превращается из академической иллюстрации в надёжный инструмент инженерного выбора.

<<< < Предыдущая 1 2 3 45 / 85 6 7 8 > Следующая >>>

Соседние файлы в предмете Системы искусственного интеллекта

#
11.05.2025101.76 Кб13lab4.ipynb
#
11.05.202580.23 Кб14lab5.ipynb
#
11.05.202548.85 Кб14lab6.ipynb
#
11.05.202588.06 Кб23Дневник_по_практике_БСТ2104_Первухина А.А..doc
#
11.05.20254.72 Кб2объявление.txt
#
11.05.20252.15 Mб45Отчет_по_практике_БСТ2104_Первухина_А_А_.doc
#
11.05.202588.06 Кб7Пример_оформления_днвника_по_практике_Системы_искуственного_интеллекта.doc
#
11.05.202521.65 Кб3Примерные_темы_заданий_на_практику_Системы_искусственного_интеллекта.docx
#
11.05.202555.81 Кб4Титульный_лист_отчёта_по_практике_Системы_искусственного_интеллекта.doc