- •Москва 2026
- •1Введение
- •2Технические требования к звуковому вещанию
- •3Классические кодеки
- •4Общи принципы работы нейронных аудио кодеков
- •4.2Свёрточные нейронные сети
- •4.3Вычитатель (Discriminator)
- •4.4Обучение
- •5Нейронные аудио кодеки
- •6Методика тестирования качества звучания
- •6.1Описание методики
- •6.2Результаты тестирования нейронных аудиокодеков
- •7Заключение
- •8Список литературы
- •9Содержание
МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ, СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ РОССИЙСКОЙ ФЕДЕРАЦИИ
ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
МОСКОВСКИЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ СВЯЗИ И ИНФОРМАТИКИ
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
ФАКУЛЬТЕТ
«РАДИО И ТЕЛЕВИДЕНИЕ»
КАФЕДРА
«РАДИОТЕХНИЧЕСКИЕ СИСТЕМЫ (РТС)»
Реферат по дисциплине «Практическая деятельность по системам искусственного интеллекта»
«Применение искусственного интеллекта для повышения качества передачи сигнала звукового вещания в форматах FLAC и WAV»
Выполнил |
|
|
Студент группы БРВ2201 |
______________________ |
Велит А.И. |
Проверил |
|
|
Д.т.н., профессор |
______________________ |
Чиров Д.С. |
Москва 2026
1Введение
В данный момент звуковое вещание в Российской Федерации осуществляется с использованием, в основном, различных реализаций кодека MPEG. Как для передачи со сжатиями с потерями, так и для передачи со сжатием без потерь. Упомянутые кодеки для сжатия звукового сигнала применяют как «математическое» сжатие информации (путём вычислений по заранее известным математическим моделям), так и психоакустические модели. Несмотря на эффективность этих методов, а также сравнительную простоту реализации, у кодеков есть один главный недостаток: невозможно производить сжатие с потерями условно бесконечно, чтобы уменьшить количество передаваемой информации.
Возможно, одним из решений описанной проблемы является применение адаптивных кодеков на основе нейронных сетей, с последующим кодированием результата в кодеки со сжатием без потерь (например, в очень распространённый FLAC – Free Lossless Audio Codec) или в контейнеры (например, в WAV – Waveform Audio File Format).
2Технические требования к звуковому вещанию
На данный момент в Российской федерации существуют два нормативных документа, регламентирующих требования к качеству звукового вещательного сигнала: ГОСТ 11515-91 «Каналы и тракты звукового вещания» и ГОСТ Р 53537-2009 «Основные электрические параметры каналов и трактов передачи студийного качества (с полосой частот 20…20000 Гц)». Ниже представлена таблица с техническими требованиями качеству каналов звукового вещания из ГОСТ Р 53537-2009.
Табл. 2.1
Нормы на электрические параметры качества каналов и трактов
Наименование параметра |
Норма |
Полоса эффективно передаваемых частот, кГц |
0,02—20 |
Отклонение выходного уровня сигнала ЗВ от номинального значения, дБ |
±0.2 |
Неравномерность АЧХ, дБ, не более, в полосах частот, кГц: 0,02—0,125 0,123—10 10—20 |
От +0.1 до −0.5 ±0,2 От +0,1 до −0,5 |
Коэффициент нелинейных искажений, %, не более, в полосах частот, Гц: до 125 свыше 125 |
0,05 0,02 |
Защищённость максимального сигнала от взвешенного шума, дБ, не менее |
70 |
Защищённость максимального сигнала от внятной переходной помехи, дБ, не менее |
84 |
Разность уровней на выходах каналов А и В стереопары, дБ, не более, в полосах частот, кГц: 0,02—0,125 0,125—10 10—20 |
0,5 0,3 1,0 |
Разность фаз на выходах каналов А и В стереопары, град., не более в полосе частот кГц: 0,02—20 |
6,0 |
Защищённость от продуктов внутриполосной перекрёстной модуляции, дБ, не менее |
46 |
Защищённость от продуктов внеполосной перекрёстной модуляции, дБ, не менее |
66 |
Таким образом применение каких-либо кодеков, отличных от используемых при вещании на сегодняшний день, должно согласовываться с этими параметрами.
