Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский национальный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Записка_моя.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

1.69 Mб

Скачать

☆

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

2 Постановка задачи

В ходе выполнения курсового проекта необходимо реализовать приложение, которое должно распознавать ноты на сканированном изображении, воспроизводить распознанные ноты, а также определять длину звучания ноты.

Исходными данными для программы является сканированное изображение нотного стана.

Ограничения:

Формат изображения - *bmp;
Ноты должны относиться к первой октаве;
Распознаются только 7 основных нот;
Длительность ноты может составлять целую, одну вторую, одну четвертую либо одну восьмую;
Размер изображения не должен превышать 1000 х 1000 пикселей;
На вход Персептрону изображения должны подаваться одного размера и не превышать 70 х70 пикселей.

Требуется реализовать следующие этапы:

поворот изображения;
бинаризация изображения;
сегментация изображения, т.е выделение нотного стана;
выделение скрипичного ключа;
распознавание нот и их воспроизведение;
вырезание ноты;
масштабирование;
определение длины ноты с помощью нейросети Персептрон.

Среда разработки приложения – Microsoft Visual Studio 2010.

Тип приложения – Windows Form Application.

Операционная система – Windows 7.

Функциональные схемы приложения в формате IDEF приведены на рисунках 2.1 , 2.2 и 2.3).

Рисунок 2.1 - Схема IDEF (первый уровень)

Рисунок 2.2 - Схема IDEF (второй уровень)

Рисунок 2.3 - Схема IDEF (третий уровень)

3 Описание используемых алгоритмов и подходов

3.1 Алгоритмы бинаризации изображения

3.1.1. Бинаризация по порогу

Так как бинарное изображение легче поддается обработки, то требуется реализовать метод бинаризации загруженного изображения по порогу. Блок – схема данного метода представлена на рисунке 3.1.1.1

Рисунок 3.1.1.1 – Блок-схема алгоритма бинаризации изображения пороговым методом

Цвет пикселя на итоговом изображении рассчитывается согласно формуле:

где - цвет пикселя на исходном изображении,

- цвет пикселя на новом изображении,

- пороговое значение.

Рисунок 3.1.1.2 – Результат бинаризации

3.1.2 Бинаризация по площади

Для каждого элемента изображения, который является центром некоторой окрестности,

Вычисляется среднее и дисперсия по этой окрестности. Присвоение значения выходному

Элементу выполняется по правилу:

Q(i,j) = 1 , если A(i,j) < (S(i,j) + 0,3 D(i,j));

Q(i,j) = 0 , если A(i,j) >= (S(i,j) + 0,3 D(i,j)) ,

Где A(i,j) – значение яркости элемента исходного изображения;

Q(i,j) – значение бинарного изображения;

S(i,j) – значение среднего в зоне анализа исходного изображения;

D(i,j) – значение дисперсии в зоне анализа исходного изображения.

Результат бинаризации представлен на рисунке 3.1.2.1.

Рисунок 3.1.2.1 - Результат бинаризации по площади

Если сравнить результаты бинаризации по порогу и по площади, то можно заметить, что бинаризация по порогу выполнена качественнее. Также бинаризация по порогу более удобна для пользователя, так как имеется самостоятельная возможность настроить изображение.

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
26.03.2016699.53 Кб49Записка.docx
#
26.03.2016515.81 Кб85записка.docx
#
18.12.2018674.99 Кб8Записка1.doc.docx
#
01.05.20255.71 Mб0записка2.doc
#
31.05.20151.07 Mб120ЗАПИСКА_ИСПРАВЛЕННАЯ_ПАША.docx
#
01.05.20251.69 Mб0Записка_моя.doc
#
13.07.2019109.12 Кб7Захаркевич_лаб1_СПО.docx
#
31.05.20159.91 Mб139Защ.нас-я в ЧСdoc1.pdf
#
31.05.201515.61 Mб90Защ.нас-я в ЧСdoc2.pdf
#
31.05.20159.72 Mб79Защ.нас-я в ЧСdoc3.pdf
#
31.05.20152.5 Mб138Защ.нас. 3 Ч. вся.doc