СИИ 3
.docxМинистерство цифрового развития, связи и массовых коммуникаций Российской Федерации Ордена трудового Красного Знамени Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Московский технический университет связи и информатики Кафедра «Сети и системы фиксированной связи» Лабораторная работа №3 «Распознавание надписи содержащей изображение методом Random Forest»
Группа: БОС-2001 Выполнил: Ядринцев С. М. Проверил(а): Матюнина Д.Д. Дата: 19.11.2023
Москва 2023
Цель.
Освоение методики распознавания номеров автомобилей с использованием машинного обучения.
Работа программы.
Обучение:
>> CNR_train('C:\Users\777\Desktop\Train Images', false)
time on char 0 :: 23.53 (sec)
time on char 1 :: 1.55 (sec)
time on char 2 :: 2.05 (sec)
time on char 3 :: 1.17 (sec)
time on char 4 :: 1.30 (sec)
time on char 5 :: 1.55 (sec)
time on char 6 :: 1.42 (sec)
time on char 7 :: 1.19 (sec)
time on char 8 :: 1.03 (sec)
time on char 9 :: 1.23 (sec)
time on char A :: 1.20 (sec)
time on char B :: 1.27 (sec)
time on char C :: 1.52 (sec)
time on char E :: 1.50 (sec)
time on char H :: 1.30 (sec)
time on char K :: 1.17 (sec)
time on char M :: 1.20 (sec)
time on char O :: 1.23 (sec)
time on char P :: 1.11 (sec)
time on char T :: 1.11 (sec)
time on char X :: 1.19 (sec)
time on char Y :: 1.04 (sec)
total time 96.00
ans =
struct with fields:
nrnodes: 4401
ntree: 1000
xbestsplit: [4401×1000 double]
classwt: [22×1 double]
cutoff: [22×1 double]
treemap: [4401×2000 int32]
nodestatus: [4401×1000 int32]
nodeclass: [4401×1000 int32]
bestvar: [4401×1000 int32]
ndbigtree: [4401×1000 int32]
mtry: 15
orig_labels: [22×1 double]
new_labels: [1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22]
nclass: 22
outcl: [2200×1 int32]
counttr: [22×2200 int32]
proximity: []
localImp: 1
importance: [134×1 double]
importanceSD: 0
errtr: [1000×23 double]
inbag: [2200×1 int32]
votes: [2200×22 int32]
oob_times: [2200×1 double]
Проверка:
>> CarNumberRecognition2('C:\Users\777\Desktop\Test Images\17.bmp', true)
C:\Users\777\Desktop\Test Images\17.bmp -> T308KB (origin. T308KB17)
ans = 'T308KB'
Вывод.
В результате проверки было обнаружено, что классификатор не смог правильно определить номер региона на рег. знаке автомобиля. Классификатор показал “Т308КВ17”, однако правильным ответом является “Т308КВ177”
Контрольные вопросы.
1. В чем заключается суть метода Random Forest?
Метод использует ансамбль решающих деревьев. Дерево само по себе плохо справляется с решениями, но это купируется за счет большого количества обучающих изображений.
2. Как осуществляется хранение символов в папке «Train Images»?
Для каждого символа есть папка с соответствующим именем. В самой же папке хранятся разные изображения этого символа.
3. Может ли у одного конкретного символа быть больше одного изображения для обучения?
Да, для каждого символа может быть неограниченное число изображений
4. В чем состоит принцип обучения алгоритма?
Для обучения классификатору передаются изображения каждого символа (классификатор знает какому символу какое изображение соответствует). Формируется ассамблея деревьев. Во время теста с реальными данными определяются весовые коэффициенты для этих деревьев. После чего классификатор принимает решение.
5. Является ли этот метод безошибочным? Почему?
Нет. Некоторые символы могут быть опознаны неправильно, а некоторые и не опознаны вовсе.