практика научная / Практика_отчёт_БИК2205
.pdf
МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ СВЯЗИ И МАССОВЫХ
КОММУНИКАЦИЙ
Ордена Трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования
«МОСКОВСКИЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ СВЯЗИ И ИНФОРМАТИКИ»
ФАКУЛЬТЕТ
«РАДИО И ТЕЛЕВИДЕНИЕ»
КАФЕДРА
«ТЕЛЕВИДЕНИЯ И ЗВУКОВОГО ВЕЩАНИЯ ИМЕНИ С.И. КАТАЕВА»
ОТЧЁТ ПО ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ
на тему: «Моделирование изменения аудиозаписи при применении современных методов сжатия и передачи через радиоканал»
Выполнил |
|
|
Студент группы БИК2205 |
_______________________ |
|
Проверил |
|
|
Ассистент кафедры ТиЗВ |
_______________________ |
Кудряшов В.В. |
Москва 2024
1 СОДЕРЖАНИЕ
1 |
СОДЕРЖАНИЕ .............................................................................................. |
1 |
|
2 |
ТЕОРИТИЧЕСКАЯ ЧАСТЬ ИССЛЕДОВАНИЯ ......................................... |
2 |
|
|
2.1 |
ЦЕЛЬ И ЗАДАЧИ РАБОТЫ, ОБЪЕКТ ИССЛЕДОВАНИЯ.................. |
2 |
|
2.2 |
ОБЗОР СОВРЕМЕННОГО СОСТОЯНИЯ ИЗУЧАЕМОЙ ОБЛАСТИ. 2 |
|
|
2.3 |
ОБЗОР ПУБЛИКАЦИЙ ПО ТЕМЕ ИССЛЕДОВАНИЯ........................ |
5 |
|
2.4 |
СРАВНЕНИЕ МЕТОДОВ В ПРЕДСТАВЛЕННЫХ ПУБЛИКАЦИЯХ6 |
|
|
2.5 |
РЕЗУЛЬТАТ СРАВНЕНИЯ МЕТОДОВ................................................. |
7 |
3 |
ПРАКТИЧЕСКАЯ ЧАСТЬ ИССЛЕДОВАНИЯ ........................................... |
8 |
|
|
3.1 |
ПРЕДСТАВЛЕНИЕ МОДЕЛИ В ВИДЕ СТРУКТУРНОЙ СХЕМЫ .... |
8 |
|
3.2 |
ПРЕДСТАВЛЕНИЕ МЕТОДА В ВИДЕ ФУНКЦИОНАЛЬНОЙ |
|
|
СХЕМЫ ............................................................................................................ |
9 |
|
|
3.3 |
ПОДБОР ВХОДНЫХ И ВЫХОДНЫХ ДАННЫХ ДЛЯ МОДЕЛИ.... |
13 |
|
3.4 |
ВИЗУАЛИЗАЦИЯ РЕЗУЛЬТАТОВ РАБОТЫ МОДЕЛИ ................... |
13 |
|
3.5 |
ВЫВОДЫ ПО РЕЗУЛЬТАТАМ ИССЛЕДОВАНИЯ ........................... |
16 |
4 |
СПИСОК ЛИТЕРАТУРЫ ............................................................................ |
17 |
|
5 |
ПРИЛОЖЕНИЕ............................................................................................ |
18 |
|
|
5.1 |
ИСХОДНЫЙ КОД ПРОГРАММЫ ....................................................... |
18 |
1
2 ТЕОРИТИЧЕСКАЯ ЧАСТЬ ИССЛЕДОВАНИЯ
2.1 ЦЕЛЬ И ЗАДАЧИ РАБОТЫ, ОБЪЕКТ
ИССЛЕДОВАНИЯ
Цель
Целью этой работы является сравнительный анализ распространённых
кодеков передачи аудио с по радиоканалу, конкретно с помощью технологии
Bluetooth.
Задачи
•Изучить распространённые методы передачи аудио (без передачи человеческой речи) с использованием технологии Bluetooth;
•Изучить и кратко изложить принципы работы изученных методов;
•Провести сравнительный анализ изученных методов по основным параметрам;
•Смоделировать один из изученных методов передачи аудио от источника к приёмнику.
Объект исследования
Объектом исследования являются кодеки передачи аудио по
радиоканалу, в частности с помощью технологии Bluetooth.
2.2 ОБЗОР СОВРЕМЕННОГО СОСТОЯНИЯ
ИЗУЧАЕМОЙ ОБЛАСТИ
С развитием технологий человечество всё больше отходит от «проводных технологий» к беспроводным. В большее значение приобретают технологии передачи различных данных «по воздуху». В частности, технологии передачи аудио: речи, музыки и т.д.
2
Передача аудиоконтента по беспроводным каналам связи имеет отдельное значение при развитии беспроводных технологий, так как звук является неотъемлемой частью человеческого восприятия. Передача человеческой речи и аудиоконтента: два основных направления передачи аудиоинформации по беспроводным каналам.
Отдельно выделяется передача аудиоконтента с устройства воспроизведения (телефон, плеер, компьютер и т.д) на устройство воспроизведения (наушники, колонки). Для этого, в основном, используется радиоканал напрямую или технология Bluetooth. Причём передача аудиоинформации по последнему, с появлением и развитием беспроводных комбинированных и TWS (True Wireless Stereo) наушников [6], занимает отдельное важное место в развитии технологий передачи аудио по радиоканалу.
Пропускные возможности канала Bluetooth при передачи информации ограничены, и несмотря на то, что пропускной способности канала, в теории,
хватает на передачу аудио без каких-либо проблем, по факту задача передачи аудиоинформации не так тривиальна из-за технических особенностей работы технологии Bluetooth [1]. Сама технология подразумевает стандартизированные методы кодирования, передачи и декодирования аудио в целом и музыки в частности, однако и сторонние компании, напрямую не относящиеся к развитию самой технологии, предлагают свои решения [1][3].
В настоящее время существуют различные стандартизированные кодеки передачи аудио, но основными являются: SBC, AAC, aptX, LDAC.
SBC (SubBand low-complexity Codec) – это самый «базовый» и гибкий кодек,
который присутствуют на всех устройствах, сертифицированных Bluetooth.
Он достаточно прост по своей сути и позволяет передавать аудио с широким диапазоном битрейта (от 10 до 1500 кбит/с), хотя обычно используется диапазон 128-320 кбит/с. Одна из основных проблем для рядового
3
пользователя – битрейт кодека не стандартизирован, что делает конечное качество воспроизводимого аудио непредсказуемым [1][2].
AAC (Advanced Audio Coding) – кодек, разработанный как приемник формата
MP3, который также используется для потоковой передачи аудио. Является сложным для вычисления кодеком с комплексной психоакустической моделью. Основным плюсом является то, что он позволяет передавать лучшее по качеству аудио при меньшем битрейте. Одними из минусов является то, что это лицензируемый кодек, а лучший вариант кодека предоставляет компания
Apple, что сужает диапазон используемых устройств, а также нивелирует некоторые его полюсы (например, предсказуемость качества звучания) [1].
aptX (audio processing technology X) – простой в вычислениях кодек, не использующий психоакустические модели для сжатия информации. В основе его работы лежит адаптивная дифференциальная импульсно-кодовая модуляция. Сам кодек был разработан до появления технологии Bluetooth,
однако на данный момент принадлежит компании Qualcomm и также используется для потоковой передачи аудио по радиоканалу. Является
«жёстко» стандартизированным лицензированным кодеком, однако поддержка кодека почти всей продукцией компании владельца делает его более распространённым, чем AAC. Основными плюсами являются предсказуемость качества звучания передаваемой аудиоинформации и её сравнительно хорошее качество при простоте кодирования [1][3][6].
LDAC – это проприетарный «Hi-Res» кодек, разработанный компанией Sony.
Специфика кодека, ввиду проприетарности, досконально не известна, однако известно, что в основе лежат модифицированное дискретное косинус-
преобразование и сжатие с применением алгоритма Хаффмана. Основными плюсами кодека являются высокие «цифровые» характеристики: высокая частота дискретизации (до 96 кГц), 24-х битная разрядность (все вышеописанные кодеки 16-ти разрядные) и битрейт до 990 кбит/с. Основные
4
минусы это – сравнительно малая распространённость и сравнительно малая стабильность соединения при максимальном битрейте [1].
2.3 ОБЗОР ПУБЛИКАЦИЙ ПО ТЕМЕ
ИССЛЕДОВАНИЯ
Статья за авторством VladikSS [1] – это сравнительно подробная обзорная статья всех исследуемых методов и их параметров. Так же в статье изложены общие сведения о принципах передачи аудио и речи по радиоканалу, в
частности с помощью технологии Bluetooth.
Статья-отчёт за авторством Кристиана Хёне и Мансура Хайдера [2] – это описание принципов работы кодеков, основанных на поддиапазонном кодировании. Так в статье приводится результаты сравнение этих кодеков, и
описание методики проведения сравнительного анализа.
Вдипломной бакалаврской работе Густава Йохансона, Матиаса Адевага
иЯкоба Милтона [3] приводятся общие принципы передачи аудио с помощью технологии Bluetooth, в частности кодеки LC3, aptX и aptX HD. Так же в работе приводятся результаты сравнения качества звучания описываемых кодеков и сама методика сравнения.
Ввыдержки из статьи Дорошева Д.В. [4] приводится краткое описание принципов работы дифференциальной импульсно-кодовой модуляции
(ДИКМ) и адаптивной дифференциальной импульсно-кодовой модуляции
(АДИКМ). Адаптивная дифференциальная импульсно-кодовая используется в кодеке aptX.
В статье неизвестного автора [5] приводится краткое описание принципов работы импульсно-кодовой модуляции (ИКМ) и
дифференциальной ИКМ.
Статья Роберта Триггса [6] – это краткое обзорное описание кодеков aptX и aptX HD. Также в статье анализируются различные характеристики
5
описанных кодеков и производится их сравнение по различным параметрам
как между собой, так и с кодеком SBC.
2.4 СРАВНЕНИЕ МЕТОДОВ В ПРЕДСТАВЛЕННЫХ
ПУБЛИКАЦИЯХ
Сравнение производится по следующим критериям:
•Частота дискретизации (частота, с которой производится дискретизация исходного сигнала на отсчёты);
•Разрядность (количество бит, которое отводится на хранение информации и каждом отсчёте);
•Битрейт (количество информации, передаваемое кодеком в секунду);
•Типичное время задержки (время, затрачиваемое на кодирование,
передачу и декодирование);
•Качество при низком битрейте (среднее качество воспроизводимого аудио при низких значениях битрейта – меньше 320 кбит/с,
определённое на основе различных тестов звучания);
•Качество при высоком битрейте (среднее качество воспроизводимого аудио при высоких или максимальных значениях битрейта – больше
320 кбит/с, определённое на основе различных тестов звучания).
Таблица 2.4.1 – Сравнение характеристик кодеков
Критерий |
SBC |
AAC |
aptX |
LDAC |
|
|
|
|
|
|
|
Частота |
16, 32, 44.1, |
|
16, 32, 44.1, |
|
|
дискретизации, |
8-96 |
44.1-96 |
|||
48 |
48 |
||||
кГц |
|
|
|||
|
|
|
|
||
|
|
|
|
|
|
Разрядность, |
16 |
16 |
16 |
24 |
|
бит |
|||||
|
|
|
|
||
|
|
|
|
|
|
Битрейт, |
128-320 |
256-320 |
128, 256, |
303, 606, 909 |
|
кбит/с |
352, 384 |
||||
|
|
|
|||
|
|
|
|
|
6
|
|
|
(зависит от |
(для 44.1 и |
|
|
|
частоты |
88.2 кГц) |
|
|
|
дискретизац |
330, 660, 990 |
|
|
|
ии) |
(для 48 и 96 |
|
|
|
|
кГц) |
|
|
|
|
|
Типичное |
|
|
|
|
время |
150-250 |
190-240 |
130-180 |
160-210 |
задержки, мс |
|
|
|
|
|
|
|
|
|
Качество при |
|
|
|
|
низком |
Низкое |
Высокое |
Среднее |
Низкое |
битрейте |
|
|
|
|
|
|
|
|
|
Качество при |
|
|
|
|
высоком |
Хорошее |
Хорошее |
Отличное |
Наилучшее |
битрейте |
|
|
|
|
|
|
|
|
|
2.5 РЕЗУЛЬТАТ СРАВНЕНИЯ МЕТОДОВ
По результатам сравнения различных кодеков для дальнейшего моделирования был выбран кодек aptX, как самый сбалансированный по характеристикам. Кодек обеспечивает достойное качество звучание при любом битрейте, при этом, в максимуме, сильно не превышая «стандартный» битрейт передачи аудио в 320 кбит/с. В дополнение к вышеописанному кодек имеет сравнительно малые задержки передачи из-за простоты вычислений.
7
3 ПРАКТИЧЕСКАЯ ЧАСТЬ ИССЛЕДОВАНИЯ
3.1 ПРЕДСТАВЛЕНИЕ МОДЕЛИ В ВИДЕ
СТРУКТУРНОЙ СХЕМЫ
Рисунок 3.1.1 – Структурная схема модели
Структурная схема состоит из: входного аудиофайла, четырёх цифровых полосовых фильтров (ЦПФ), адаптивного микшера, кодера, декодера,
выходного аудиофайла, качество которого определяется человеком на слух.
•На вход подаётся какой-нибудь аудиофайл, в формате .wav, то есть без сжатия, который считывается моделью для дальнейшей обработки;
•Далее считанный аудиофайл подаётся на четыре цифровых полосовых фильтра, каждый из которых выделяет один из частотных диапазонов из полученного аудио;
•Все четыре отфильтрованных сигнала одновременно подаются на адаптивный микшер, который объединяет все фильтрованные сигналы в один, кодируя значения амплитуды полученных отсчётов сигналов разным количеством байт, в зависимости от принадлежности отсчёта тому или иному диапазону;
•Микшированный сигнал подаётся на кодер, который осуществляет разностное кодирование;
•Кодированный сигнал подаётся на декодер, который из разностных отсчётов восстанавливает исходный сигнал;
8
•Декодированное аудио выводится в файл .wav, то есть без сжатия, для дальнейшего прослушивания пользователем.
3.2ПРЕДСТАВЛЕНИЕ МЕТОДА В ВИДЕ ФУНКЦИОНАЛЬНОЙ СХЕМЫ
Рисунок 3.2.1 – Функциональная схема модели
9
