Формат звука pcm что это – DSD vs PCM / Хабр

Home  /   Формат звука pcm что это – DSD vs PCM / Хабр

Содержание

DSD vs PCM / Хабр

Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.

Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?

Аналоговый сигнал

Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).


Рис. 1. Аналоговый сигнал

Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.

Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.


Рис. 2. АЧХ MP3 файла 256 kbps

Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.

Искажения – не что иное, как отклонение сигнала от оригинала.

Принципы представления звука в цифровом виде

Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).


Рис. 3. Преобразование аналогового сигнала в PCM

Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.

Но это не единственный вариант представления звуковой волны в цифровом виде. Есть способ избавиться от такого параметра, как разрядность, оставить только два уровня амплитуды: -100% и +100% (0 или 1). Чтобы добиться этого, не потеряв в качестве, — нужно многократно увеличить частоту считывания величины сигнала (рис. 4).


Рис. 4. Преобразование аналогового сигнала в DSD

Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.

Восстановление аналогового сигнала из «цифры»

Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20…22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.


Рис. 5. Восстановление аналогового сигнала из DSD

Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.

Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».


Рис. 6. Восстановление аналогового сигнала из PCM

Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.

Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.

Применение PCM и DSD, достоинства/недостатки

Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?

В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.

  1. Первое преимущество, которое любят приводить сторонники DSD, довольно расплывчатое — помехоустойчивость и снижение влияния ошибок. Странно слышать про разную помехоустойчивость в цифровом мире: оба формата подвержены помехам ровно настолько, насколько подвержена помехам книжка в цифровом формате. Длительность хранения любого цифрового формата или качество передачи его между устройствами зависят только от носителя / способа передачи, но не от самого формата. Итак, помехоустойчивость одинаковая. А что по поводу снижения влияния ошибок? Допустим, мы храним 2 альбома на оптических дисках (один PCM, другой DSD), что будет, если диск поцарапать? При чтении поврежденного носителя будут возникать ошибки, но насколько они критичны? В PCM кодировании используются многоразрядные числа, ошибка в старшем разряде очень критична (как пример, разница между десятичными числами 11 и 91): на слух это будет ощущаться, как щелчок. В DSD кодировании один бит информации имеет небольшой вес в общем потоке, нечастые ошибки будут вызывать лишь повышение фонового шума, что на слух будет менее заметно.
  2. Второе преимущество описывается чуть конкретнее: больший динамический диапазон по сравнению с PCM. Что же, и здесь есть некоторое лукавство, ДД больше лишь по сравнению с классическим CDDA форматом: 120 … 140 дБ против 96 дБ. Если же сравнивать, например, с DVD Audio — ДД примерно одинаков.
  3. Третье преимущество: DSD более прост технически. Вот здесь поспорить не с чем: более простое декодирование сигнала, отсутствие необходимости синхронизации и буферизации потока при передаче сигнала с одного устройства на другое — полная победа DSD. Кстати говоря, на фоне этого преимущества странно видеть заоблачные цены на аппаратуру, поддерживающую воспроизведение DSD.
  4. Ну и ещё одно преимущество, которое любят приводить фанаты DSD: музыка в этом формате наиболее близка к оригинальному аналоговому звуку. Аргументируется это тем, что современные аналогово-цифровые преобразователи (АЦП) — работают на принципе дельта-сигма модуляции, то есть эти АЦП выдают цифровой DSD поток. И вот опять лукавство: запись будет полностью оригинальной только в случае прямой записи живого выступления либо при оцифровке готовой аналоговой записи с качественного носителя. Операции сведения, наложения эффектов, мастеринга, даже простой подстройки громкости — всего того, без чего не может обойтись создание студийного альбома, — невозможны для цифрой DSD записи по причине отсутствия нормальных алгоритмов ее обработки. Это означает, что все эти операции производятся с PCM форматом, и только после этого готовая PCM запись конвертируется в DSD. Впрочем, нужно отметить, что преобразование PCM > DSD и обратно — достаточно точное: лишь немного возрастает шум за пределами реального динамического диапазона (рис. 7). А значит, не имеет особого значения, в каком формате слушать запись: PCM Hi-Res или DSD — оба формата по качественным характеристикам очень схожи. Так же, фактически, нет смысла покупать отдельную звуковую карту для воспроизведения DSD, послушав совета приятеля, фаната данного формата.


    Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM

Выводы

Итак, что выбрать DSD или PCM? Однозначного ответа нет и быть не может: PCM 24 бит 92 кГц и DSD128, например, очень схожи по качественным характеристикам, причем эти характеристики лучше, чем у аппаратуры, на которой эти форматы будут проигрываться, а значит дальнейшее увеличение качества цифровых форматов для воспроизведения на данном этапе нецелесообразно. При оценке качества звука разных форматов высокой чёткости на первый план выходят субъективные ощущения, ведь не качеством единым питается человеческий мозг: дизайн аппаратуры, ее стоимость, и, главное, самочувствие и настроение слушателя дают гораздо больший эффект на ощущения от прослушивания музыки. А значит выбирайте то, что нравится лично вам, и не навязывайте другим свое мнение. Всем приятного прослушивания!

habr.com

DSD или PCM, какой формат на самом деле лучше?

Музыка высокого разрешения существует в виде цифровых файлов двух основных форматов — PCM и DSD. Чем они похожи, чем отличаются и какой из них предпочесть?

 

 Что такое PCM

Начнем с того, что PCM (импульсно-кодовая модуляция) изначально старше, первые упоминания о ее успешном использовании относятся к середине прошлого века и связаны, как и многие достижения технического прогресса, с ОПК, а именно — с радарами ВМС. Что же касается бытового применения, то в первую очередь это всем известный компакт-диск с частотой дискретизации 44,1 кГц и уровнем квантования 16 бит.

Что такое DSD
DSD (плотностно-импульсная модуляция) — формат, разработанный компаниями Sony и Philips в конце прошлого века и предназначенный для архивации в цифровой форме аналоговых фонограмм. В качестве физического носителя этого формата выступает SACD. Схожесть у этих двух форматов фактически только одна — оба они цифровые, что для пользователя означает возможность неограниченного копирования без потерь. Что же касается разницы, то применительно скажем к области графического дизайна, это примерно как растровая и векторная графика. А если еще более художественно — то как вышивание крестиком и акварель. И в том и в другом случае получается картинка, но способ ее создания и, как следствие восприятия совершенно различны.

В чем отличие?
PCM, даже в силу возраста, намного более изучен, имеет гораздо лучшую совместимость с огромным количеством самых разных устройств, подразумевает возможность редактирования (эквализации, деления на частотные полосы, преобразования). DSD — формат фактически закрытый, в нем можно записывать, его можно воспроизводить, на этом всё. Однако же, он по своей природе гораздо ближе к первоначальному аналоговому сигналу.

Что же лучше?
Первый и самый главный вывод — с технической точки зрения форматы очень далеки друг от друга по способам реализации, но зачастую практически неотличимы в практическом применении, то есть в звучании итогового файла. Речь идет лишь о небольших различиях в нюансах подачи музыки. Поэтому, при прочих равных, выбирая очередной файл для скачивания и воспроизведения, лучше всего ориентироваться на исходный материал. Если перед вами оцифровка аналога, то DSD вероятно будет предпочтительней и сохранит больше нюансов оригинала. Если это ремастер ранее сделанной цифровой записи в PCM, то логичней ей и оставаться в этом домене.

oppodigital.com.ru

Цифровой звук: DSD vs PCM

Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.

Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?

Аналоговый сигнал

Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).


Рис. 1. Аналоговый сигнал

Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотри три самых важных: частотный диапазон, динамический диапазон, искажения.

Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.


Рис. 2. АЧХ MP3 файла 256 kbps

Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.

Искажения – ни что иное, как отклонение сигнала от оригинала.

Принципы представления звука в цифровом виде

Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).


Рис. 3. Преобразование аналогового сигнала в PCM

Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.

Но это не единственный вариант представления звуковой волны в цифровом виде. Есть способ избавиться от такого параметра, как разрядность, оставить только два уровня амплитуды: -100% и +100% (0 или 1). Чтобы добиться этого, не потеряв в качестве, — нужно многократно увеличить частоту считывания величины сигнала (рис. 4).


Рис. 4. Преобразование аналогового сигнала в DSD

Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.

Восстановление аналогового сигнала из «цифры»

Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20…22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.


Рис. 5. Восстановление аналогового сигнала из DSD

Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.

Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».


Рис. 6. Восстановление аналогового сигнала из PCM

Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.

Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.

Применение PCM и DSD, достоинства/недостатки

Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?

В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.

  1. Первое преимущество, которое любят приводить сторонники DSD, довольно расплывчатое — помехоустойчивость и снижение влияния ошибок. Странно слышать про разную помехоустойчивость в цифровом мире: оба формата подвержены помехам ровно настолько, насколько подвержена помехам книжка в цифровом формате. Длительность хранения любого цифрового формата или качество передачи его между устройствами зависят только от носителя / способа передачи, но не от самого формата. Итак, помехоустойчивость одинаковая. А что по поводу снижения влияния ошибок? Допустим, мы храним 2 альбома на оптических дисках (один PCM, другой DSD), что будет, если диск поцарапать? При чтении поврежденного носителя будут возникать ошибки, но насколько они критичны? В PCM кодировании используются многоразрядные числа, ошибка в старшем разряде очень критична (как пример, разница между десятичными числами 11 и 91): на слух это будет ощущаться, как щелчок. В DSD кодировании один бит информации имеет небольшой вес в общем потоке, нечастые ошибки будут вызывать лишь повышение фонового шума, что на слух будет менее заметно.
  2. Второе преимущество описывается чуть конкретнее: больший динамический диапазон по сравнению с PCM. Что же, и здесь есть некоторое лукавство, ДД больше лишь по сравнению с классическим CDDA форматом: 120 … 140 дБ против 96 дБ. Если же сравнивать, например, с DVD Audio — ДД примерно одинаков.
  3. Третье преимущество: DSD более прост технически. Вот здесь поспорить не с чем: более простое декодирование сигнала, отсутствие необходимости синхронизации и буферизации потока при передаче сигнала с одного устройства на другое — полная победа DSD. Кстати говоря, на фоне этого преимущества странно видеть заоблачные цены на аппаратуру, поддерживающую воспроизведение DSD.
  4. Ну и ещё одно преимущество, которое любят приводить фанаты DSD: музыка в этом формате наиболее близка к оригинальному аналоговому звуку. Аргументируется это тем, что современные аналогово-цифровые преобразователи (АЦП) — работают на принципе дельта-сигма модуляции, то есть эти АЦП выдают цифровой DSD поток. И вот опять лукавство: запись будет полностью оригинальной только в случае прямой записи живого выступления либо при оцифровке готовой аналоговой записи с качественного носителя. Операции сведения, наложения эффектов, мастеринга, даже простой подстройки громкости — всего того, без чего не может обойтись создание студийного альбома, — невозможны для цифрой DSD записи по причине отсутствия нормальных алгоритмов ее обработки. Это означает, что все эти операции производятся с PCM форматом, и только после этого готовая PCM запись конвертируется в DSD. Впрочем, нужно отметить, что преобразование PCM > DSD и обратно — достаточно точное: лишь немного возрастает шум за пределами реального динамического диапазона (рис. 7). А значит, не имеет особого значения, в каком формате слушать запись: PCM Hi-Res или DSD — оба формата по качественным характеристикам очень схожи. Так же, фактически, нет смысла покупать отдельную звуковую карту для воспроизведения DSD, послушав совета приятеля, фаната данного формата.


    Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM

Выводы

Итак, что выбрать DSD или PCM? Однозначного ответа нет и быть не может: PCM 24 бит 92 кГц и DSD128, например, очень схожи по качественным характеристикам, причем эти характеристики лучше, чем у аппаратуры, на которой эти форматы будут проигрываться, а значит дальнейшее увеличение качества цифровых форматов для воспроизведения на данном этапе нецелесообразно. При оценке качества звука разных форматов высокой чёткости на первый план выходят субъективные ощущения, ведь не качеством единым питается человеческий мозг: дизайн аппаратуры, ее стоимость, и, главное, самочувствие и настроение слушателя дают гораздо больший эффект на ощущения от прослушивания музыки. А значит выбирайте то, что нравится лично вам, и не навязывайте другим свое мнение. Всем приятного прослушивания!

Автор: Soolo

Источник

www.pvsm.ru

DSD формат аудио | Простое объяснение

DSD  (Direct Stream Digital) — это формат аудио записей высокого разрешения. Читайте о сравнении качества звука DSD и PCM, ЦАП/DAC ► проигрывателях ► конвертерах ► форматах файлов ► редактировании ► и других вопросах…

Посмотрите и поделитесь: Что такое DSD аудио? Видео-объяснение (русские субтитры)

ПРОЧТИТЕ ВНИМАТЕЛЬНО:
• DSF, DFF, ISO (1-бит аудио) поддержаны в максимальном PROduce-RD и конфигурируемом Modula-R
• Для DSF, DFF, треков ISO длиной более 3 мин. в FREE demo 2 сек. тишины в середине выходного файла
• DVD ISO НЕ поддерживается

Смотрите и делитесь: сравнение DSD vs FLAC (русские субтитры)

Также прочтите DSD vs FLAC (на русском) >

 

1. Параметры DSD

 

Характеристики DSD
Аббревиатура  Direct Stream Digital
Метод кодирования аудио данных сигма-дельта модуляция (читайте подробности и смотрите видео)
Битовая разрядность 1 бит или выше (читайте подробности о качестве звука)
Частота дискретизации DSD 64 (2.8 МГц), DSD 128 (5.6 МГц, double), DSD 256 (11.2 МГц, quad), etc. (читайте подробности)
Количество каналов Стерео и многоканальный
Носители SACD оптический диск, включая hybrid SACD (с CD-аудио слоем), компьютерные файлы [SACD ISO (риппинг альбомов с SACD) и DSF, DFF, CUE+DSF/DFF] (читайте подробности)
Спецификация «Scarlet book» (1999)
Использование Производство музыки, домашнее hifi/hiend аудио

Direct Stream Digital является обним из аудиофильских форматов высокого разрешения (high resolution audio). Он был создан для улучшения динамического диапазона  CD-аудио в слышимой частотной области звука.

Читайте далее о вопросах качества звука (шум, битовая глубина, полоса, частота дискретизации DSD audio по сравнению с PCM).

 


 

 

Как правило, этот формат имеет битовую глубину 1 бит. Поэтому уровнень шума значителен из-за ошибок квантования.

Для снижения уровня шума в низкочастотной слышимой области используется нойз-шейпинг. Нойз-шейпинг (noice shaping, управление формой спектра шума) — это перенос энергии шума из слышимой частотной области в область ультразвука.

 

Нойз-шейпинг (НШ) спектра 1-битного сигнала.
Сигма-дельта модуляция

 

 

В левой части изображения спектр шума имеет уровень соизмеримый с уровнем 1-битного музыкального сигнала. Устройство (или цифровая обработка), называемое сигма-дельта модулятор, «выдавливает» энергию шума из слышимой частотной области 0 … 20 кГц в область ультразвука.

Когда такая 1-битная запись проигрывается, низко-частотный фильтр вырезает «усиленный» высокочастотный шум.

 

DSD DAC (декодер , демодулятор)

 

Таким образом, уровень шума 1-битного сигнала после нойз-шейпинга (сигма-дельта модуляции) становится сравнимым с уровнем шума мультибитного сигнала  PCM (импульсно-кодовая модуляция).

То есть 1-битная сигма-дельта модуляция может иметь разрешение аудио одинаковое с мультибитным сигналом. Читайте подробности и смотрите видео здесь

 

Читайте DSD или FLAC [Сравнение, Инфографика, Объяснение] >

 

 

3. Частоты дискретизации

 

DSD формат использует стандартный ряд частот дискретизации основанный на 44100 Гц:

  • DSD64     = 44100 *   64   =   2 822 400 Гц =   2.8 МГц
  • DSD128   = 44100 *  128  =   5 644 800 Гц =   5.6 МГц
  • DSD256   = 44100 *  256  = 11 289 600 Гц = 11.3 МГц
  • DSD512   = 44100 *  512  = 22 579 200 Гц = 22.6 МГц
  • DSD1024 = 44100 * 1024 = 45 158 400 Гц = 45.2 МГц
  • и т. д.

Также в качестве основы может быть использовано 48000 кГц. С технической точки зрения не существует ограничения на частоту дискретизации сигма-дельта модулированного сигнала. Но возможно возникновение проблем с совместимостью.

 

 

4. Перегрузка и устойчивость

 

Когда разрабатывается сигма-дельта модулятор, инженеры обращают особое внимание на:

  • уровень шума в слышимом звуковом диапазоне и
  • устойчивость к перегрузке.

Для решения этих проблем разработчики могут варьировать:

  • битовой глубиной,
  • частотой дискретизации,
  • нойз-шейпингом.

 

Эти параметры должны рассматриваться в связи друг с другом.

 

Битовая глубина

Увеличение битового разрешения уменьшает шумы квантования (шумы ошибки квантования).

 

Нойз-шейпинг

Нойз-шейпинг «выталкивает» энергию ошибки квантования из слышимого диапазона.

Для «выталкивания» большего количества энергии нужно более крутой нойз-шейпинг.

Более крутой нойз-шейпинг увеличивает вероятность срыва стабильности работы сигма-дельта модулятора при перегрузке на входе.
Когда модулятор в нестабильном состоянии, на его выходе отсутствует сигнал или генерируются колебания.
После срыва стабильности модулятор должен быть принудительно перезапущен.

Устойчивость сигма-дельта модулятора к перегрузке

 

Частота дискретизации

Более высокая частота дискретизации уменьшает уровень спектра ошибки квантования. Потому, что энергия шума распределяется в более широкой полосе. Это позволяет использовать более пологий нойз-шейпинг.

Энергия — это площадь фигуры, заключенной между линеей спектра и горизонтальной осью в полосе 0 … [частота дискретизации]/2.

 

Частота дискретизации и уровень шума квантования

 

В правой и левой частях изображения площади фигур шума одинаковы. Но фигура, более растянутая по горизонтальной оси, дает более низкий уровень шума.

Увеличение частоты дискретизации позволяет снизить уровень шума в полосе слышимого звука. Это позволяет уменьшить крутизну нойз-шейпинга и увеличить устойчивость модулятора к перегрузке.

 

Resume

Мы можем видеть, что более низкий уровень шума и более высокая устойчивость модулятора к перегрузке на входе могут быть достигнуты разными путями.

Например, лучшее качество звука — это вопрос реализации нойз-шейпинга при имеющихся битовом разрешении и частоте дискретизации. Но, с другой стороны, возможно увеличить частоту дискретизации и/или количество бит для снижения ошибки квантования (уровня шума) без улучшения метода нойз-шейпинга.

 

 

 

Профессиональные аудио модуляторы имеют уровень шума в слышимом звуковом диапазоне для частот дискретизации:

  • DSD64  около -125 … -145 дБ (сравнимо с PCM 24 бит)
  • DSD128 около -165 дБ (лучше, чем PCM 24 бит)
  • DSD256 и выше около -170 … -200 дБ (сравнимо с PCM 32 бит)

Уровень шума в слышимом диапазоне почти не зависит от демодулятора. Но уровень шума должен быть максимально подавлен вне этой полосы. Так как ультразвуковой шум может привести к интермодуляционным искажениям.

 

Читайте о  DSD vs DSF vs DFF >

 

 

 

Direct Stream Digital (сигма-дельта модуляция) очень похожа на импульсно-кодовую модуляцию (PCM), но форма спектра уровня шумов квантования изменена для уменьшения уровня шума в звуковом диапазоне.

Также возможно применение нойз-шейпинга для обычной PCM. Но разница заключена в запасе полосы для «выталкивания» энергии шума из звукового диапазона.

 

DSD против PCM

 

PCM имеет меньший резерв полосы (выше звукового диапазона), чем сигма-дельта модуляция, и это обусловлено более высокой битовой глубиной и переходной полосой выходного фильтра  ЦАП (цифрово-аналогового преобразователя).

Нойз-шейпинг также может быть использован и для импульсно-кодовой модуляции.

Таким образом, формат сам по себе не имеет преимуществ. Но его реализация может иметь различия в качестве звука.

Декодер сигма-дельта модуляции (демодулятор) является 2-позиционым (1 / -1) формирователем напряжения и фильтром низких частот. Он проще PCM демодулятора. Потому, что импульсно-кодовый демодулятор содержит либо резисторную матрицу для формирования напряжений (R2R) или цифровой сигма-дельта модулятор с 1-битным декодером. Таким образом у нас есть больше возможностей сделать DSD ЦАП (DAC) более дешевым и лучшим по качеству, чем мультибитный ЦАП.

 

 

 

7. Форматы сжатия DSD

 

  1. Сигма-дельта модуляция реализована как оптический диск SACD (Super Audio CD).
  2. Этот же вид модуляции содержится в файлах DSF, DFF, SACD ISO (SACD образ диска).
  3. WAV, AIFF, FLAC контейнер с DoP-упакованным  (DSD over PCM, DSD через PCM) содержимым.

SACD диск может быть конвертирован без потерь (losslessly) в SACD ISO файл [1], [2], [3].

SACD ISO файл может быть распакован без потерь в DSF или DFF файлы.

Читайте подробности о файлах DSF и DFF.

1-битные аудио файлы (DSF, DFF, SACD ISO) и диски могут быть сжаты по размеру с помощью метода DST (Direct Stream Transfer).

DoP —  это открытый протокол, который позволяет запаковывать 1-битное аудио в мультибитный формат для совместимости с программами и аппаратурой [4]. DoP не может быть воспроизведен как обычный PCM.

 

Также 1-битное аудио может вещаться через сеть.

Несжатое DSD64 требует пропускную способность 2.7 Мбит/с = 44100 Гц * 64 / 1024 / 1024.

 

Источники, носители Direct Stream Digital

 

Также связка индексного файла CUE и DSF/DFF аудио файла может содержать 1-битный альбом.

 

 

8. DSD проигрыватели

 

Для вопроизведения DSD на компьютере используются программные аудио плееры. Они могут проигрывать один или несколько 1-битных форматов файлов. Аппаратные DSD проигрыватели могут проигрывать как оптические SACD диски, так и файлы DSF, DFF.

1-битные файлы могут быть воспроизведены непосредственно через DSD ЦАП/проигрыватель или конвертированы в PCM «на лету» для проигрывания с помощью PCM ЦАП. О конвертировании SACD читайте здесь

1-битное проигрывание может быть реализовано через специальный ASIO-драйвер (программные) под Windows, включая DoP (DSD over PCM) формат упаковки аудио (пример).

Оптический SACD диск может быть проигран на аппаратном плеере. Автор не располагает информацией о доступных  SACD-приводах для обычных компьютеров, чтобы воспроизводить SACD оптические диски.

Стерео проигрыватель может на лету конвертировать (downmix) многоканальный звук в стерео. Как альтернатива, многоканальные файлы могут быть предварительно конвертированы в стерео. Это позволяет сэкономить ограниченное место на жестком диска портативного проигрывателя аудио (DAP). Даунмикс является обработкой с потерями. Его качество зависит от конкретной реализации.

Читайте еще об аудио плеерах здесь > и здесь >

 

9. DSD конвертеры

 

DSD конвертеры предназначены для:

Прочитайте как работают DSD аудио конвертеры здесь >

 

Список конвертеров (конвертируют все или некоторые виды DSD файлов [DSF, DFF, SACD ISO])

 

 

10. Редактирование DSD

 

Читайте основную статью о редактировании DSD >

DSD редактирование достаточно сложный процесс по причине модулирующего шума в области высоких частот. Нелинейные обработки могут привести к слышимым продуктам интермодуляционных искажений ультразвукового шума.

В настоящее время автор не располагает информацией о «естественной» (native) обработке аудио 1-бит (например: изменение уровня, ресемплинг и пр.) без конвертации 1-бит в мильтибитный формат и обратно. Кроме слияния/разрезания аудио файлов.

 

 

Редактирование DSD

 

PCM в данном контексте может быть рассмотрено, как «мультибитное DSD». Импульсно-кодовая модуляция не обязательно обозначает «24 бит / 352 кГц» и т.п. Автор рекоммендует использовать 32- or 64-bit float (с плавающей запятой) форматы. Рассматриваемый PCM содержит высокочастотный модуляционный шум. Но, для конвертирования этого «мультибитного DSD» в 1-бит необходима модуляция с нойз шейпингом.

Потери при редактировании с 1-бит/мультибит преобразованием примерно сравнимы с ресемплингом.

Звукозаписывающие студии могут распространять DSD записи без редактирования.

Также существует DXD формат. Это PCM (как правило, «24 bit / 352 kHz» и т.п.) с высокими частотами дискретизации, битовыми разрешениями и «наследственным» высокочастотным шумом DSD. К сожалению, этот шум может привести к слышимым продуктам нелинейных искажений. рекомендуется вырезать (фильтровать) этот шум перед нелинейными обработками.

Смотрите видео: эксперимент в удалением высокочастотного шума

 

 

 


Читайте статьи

 

 

Тестовая DSD музыка (скачать)

 

Формат DSD — скачать аудио семплы (музыка и тестовые сигналы):

  1. Музыка в формате DSD c сайта #1
  2. Музыкальные семплы DSD скачать c сайта #2
  3. Простые тестовые сигналы (dsf)

Посмотрите еще больше ресурсов DSD загрузок >

 

 

DSD — это 1-битный hi-fi формат аудио данных, основанный на сигма-дельта модуляции.

При одинаковый частоте дискретизации и битовом разрешении этот формат может иметь различное качество звука в зависимости от реализации модулятора и демодулятора.

DSD цифро-аналоговый преобразователь может быть реализован проще, чем PCM ЦАП. Это, потенциально, позволяет получить лучшее качество более простым способом.

DSD может быть редактирован через конверсию 1-бит в мультибит и обратно. Редактирование DSD имеет потери качества, кроме простого слияния/разрезания.

 

Автор: Юрий Корзунов [Google+], разработчик в Audiophile Inventory

 


Читайте статьи об 1-битном формате

  1. DSD vs. PCM. Real competitors? >
  2. DSF vs PCM. What is common base? >
  3. DSD Decoder Audio >
  4. How work sigma delta modulation in audio >
  5. DSD Converter of Audio Files: What Inside? >

 

 


Ссылки

  1. SACD ISO ripping (way #1)
  2. SACD ISO ripping (way #2)
  3. SACD ISO ripping (way #3)
  4. DoP specification

 

 

 

 


Прочтите статьи

samplerateconverter.com

Ликбез от What Hi-Fi: HD-аудио PCM • 24 бит/48 кГц • Без потери качества

Что такое «видео высокого разрешения», многие понимают; но какой смысл говорить об HD-аудио у ДК? Этот термин относится к форматам многоканального звучания, записываемого на Blu-ray-дисках. Для хранения цифрового аудиосигнала используются различные методы, но цель у них одна: лучший звук для вашего домашнего кинотеатра.

Лучший? Насколько лучший?

На порядок. HD-аудио заметно повышает качество, и чтобы услышать это, не нужно быть экспертом. Каждый аспект звучания становится лучше – от динамического диапазона до реалистичности. Как утверждает менеджер по продажам компании Dolby Энди Дауэлл, «Вы слышите именно то, что инженер сведения слышал во время микширования – с точностью до бита». Энтони Уилкинс, директор по маркетингу компании DTS, говорит так: «Когда мы обсуждали компрессию данных для записи звука на DVD, самым корректным термином было бы «урезание», поскольку часть исходного сигнала необратимо терялась в процессе кодирования. У кодеков HD-аудио для Blu-ray этого не происходит; результат идентичен оригиналу».

Идентичен оригиналу? Полностью?

Именно так. Сегодня исходные аудиодорожки к фильмам записываются в формате без сжатия PCM с параметрами 24 бит/48 кГц (лучше, чем на CD). После микширования саундтрек сильно сжимают для воспроизведения в кинотеатре или дома; это похоже на то, как из компакт-диска делают MP3. В системе Dolby Digital, чаще всего применяемой для создания DVD, битрейт соответствует хорошему MP3-файлу – от 384 до 448 кбит/с. Компрессия всегда была нежелательна, но она была необходима для того, чтобы суметь «втиснуть» многоканальный звук целого фильма на катушку или диск ограниченного объема. Однако у Blu-ray-диска объем доходит до 50 ГБ, так что необходимость в компрессии отпадает. Такой диск способен хранить полный саундтрек в формате PCM 7.1 с параметрами 24 бит/48 кГц; даже однослойный 25-гигабайтный диск легко вмещает звуковую дорожку без сжатия в формате PCM 5.1.

Почему тогда не каждый диск содержит звук в PCM?

Он занимает довольно большую долю объема, особенно у менее дорогих дисков на 25 ГБ. Чтобы оставить место для дополнительных материалов, дорожек на иностранных языках, комментариев и собственно видеосоставляющей фильма, студии следуют одному из двух подходов. Один заключается в понижении 24-битного PCM-аудио до 16 бит/48 кГц. Однако более популярно использование двух систем записи звука без потери качества – DTS-HD Master Audio и Dolby TrueHD.

Что означает «без потери качества»?

Эти системы подобны архиваторам файлов: они упаковывают PCM 24 бит/48 кГц в меньший объем памяти. Для воспроизведения требуется «разархивирование» записанного файла обратно в PCM; это может делать как Blu-ray-проигрыватель, так и большинство AV-ресиверов. В результате применения технологии Dolby TrueHD получается звук в PCM 24 бит/48 кГц, но его хранение требует почти вдвое меньше места. Теоретически он должен быть идентичен оригиналу; так утверждают Dolby и DTS. Вот почему эти две технологии так популярны в Голливуде: они обеспечивают очень высокое качество звука, но требуют более скромных объемов дискового пространства в сравнении с PCM. Это снижает стоимость диска (позволяя ограничиться 25-гигабайтным носителем) и оставляет больше места для дополнительных материалов.

Что говорят цифры

Для хранения звуковой дорожки двухчасового фильма в PCM 5.1 (24 бит/48 кГц) требуется 6,2 ГБ памяти. Dolby TrueHD снижает эту цифру до 3 ГБ; чем больше разных аудиоканалов у фильма и чем он длиннее, тем полезнее сжатие. Что до сравнения двух систем, то у DTS-HD Master Audio выше битрейт, чем у Dolby TrueHD (24,5 Мбит/с и 18 Мбит/с), но на практике эти значения почти никогда не достигаются. На некоторых дисках имеются дорожки в обоих форматах. В целом, оба они весьма хороши.

Три основных формата HD-аудио

ЗА: Фантастическое качество, как в фильме «В 3:10 на Юму». Не требует «разархивирования»; доступен и старым Blu-ray-проигрывателям или AV-ресиверам.

ПРОТИВ: Занимает много места: «Юма» в формате 7.1 требует более 8 ГБ.

ЗА: Потрясающее качество звучания; занимает намного меньше места на диске, чем PCM. Саундтрек к фильму «Темный рыцарь» в TrueHD – один из самых замечательных.

ПРОТИВ: В теории, битрейт 18 Мбит/с дает чуть меньше, чем 24,5 у DTS-HD MA.

ЗА: Самый распространенный кодек без потерь на Blu-ray-дисках; звучит чудесно – это доказывает саундтрек к фильму «Аватар».

ПРОТИВ: Кое-кто утверждает, что он на деле лучше Dolby TrueHD; мы в этом не уверены.

 

www.dgl.ru

Звукозапись

DSD (Direct Stream Digital) — однобитный аудиоформат, разработанный компаниями Sony и Philips, в котором используется кодирование плотностно-импульсной модуляции Pulse Density Modulation (PDM), разновидность сигма-дельта-модуляции и применяется для хранения звукозаписей на оптическом носителе SACD (Super Audio CD).

Изначально SACD предполагался как архивный формат звукозаписывающей компании Sony Music для перевода музыкального архива в цифровой формат.

Аналоговый звуковой сигнал конвертируется в цифровой с помощью дельта-сигма модуляции при частоте дискретизации 2 822,4 кГц (в 64 раза больше, чем у CD Audio при частоте 44,1 кГц), но с разрешением 1/16 от разрешения в 16 бит. Для снижения уровня шумов в пределах частного диапазона полезного сигнала используется технология «Формирование шума» (перемещение частотного спектра шума дискретизации в верхнюю или нижнюю октавы за пределы слышимого диапазона) реализуется посредствам использования супердискретизации сигнала 64х для уменьшения шума и искажений, вызванных погрешностью квантования аудиосигнала до одного бита.

Избыточное семплирование имеет большое значение при устранении шумов квантования, вносимых квантователем. Поскольку сигнал передискретизирован, соседние отсчеты коррелируют друг с другом. В итоге так называемого «сетевого эффекта» мощность шума в частотном диапазоне, занимаемом полезным сигналом, уменьшается пропорционально повышению частоты дискретизации. Таким образом, отношение сигнал/ шум увеличивается, когда частота дискретизации становится больше. Передискретизация позволяет избежать необходимости предварительного фильтрования и сохраняет гармоники в их первоначальном состоянии. Фазовая характеристика становится более схожей с высокочастотной характеристикой аналоговых систем.

Положительное изменение амплитуды будет представлено всеми «1». Отрицательное — всеми «0». Нулевая точка будет представлена сменой двоичного числа. Поскольку значение амплитуды аналогового сигнала в каждый момент представлено в виде плотности импульсов, этот метод иногда называют плотностно-импульсной модуляцией Pulse Density Modulation (PDM).

Преимущества формата DSD

  • превосходные частотные и фазовые характеристики
  • помехоустойчивость
  • более простая обработка и коммутация
  • снижение влияния ошибок
  • возможность усовершенствования без ущерба для совместимости носителей
  • oднобитный формат DSD не нуждается в кадровой структуре и не требует многоразрядных шин, что дает несколько важных технических преимуществ:
  • соединение осуществляется одной парой проводников (как в аналоговой технике)
  • нет необходимости создания буфера для хранения многоразрядного слова. Поскольку система одноразрядная, нет также необходимости усложнять её синхронизацией
  • эффекты задержек отсчетов (джиттер) незначительны, поскольку задержка нескольких отсчетов при передискретизации оказывает на аудиосигнал минимальное влияние, так как даже при самой высокой частоте сигнала составляет малую часть периода; в многоразрядных системах задержка на один отсчет будет равняться уже половине периода высокочастотных компонентов сигнала.
  • блоки обработки и микросхемы имеют меньше соединений и могут использовать последовательный интерфейс.
  • DSD способен обеспечить динамический диапазон 120 дБ от 20 Гц до 20 кГц. Значительное повышение уровня шума происходит за границей слышимого диапазона свыше 20 кГц

 

Применение технологии DSD

Используется в носителях SACD


DSD-диск — оптический диск (DVD-R, DVD+R, DVD-RW или DVD+RW), содержащий файлы DSD с расширением *.DSF, который может проигрываться на компьютере или другом оборудовании, поддерживающем воспроизведение этих файлов. Содержит аудиофайлы высокого разрешения с частотой дискретизации 2822,4 кГц. Качество аудиозаписи на DSD-диске такое же, как на SACD, с тем отличием, что на первом не может быть записан многоканальный сигнал. Фирмой Sony разработана спецификация под названием DSD Disc Format, которой пользуются некоторые звукозаписывающие фирмы для выпуска DSD-дисков. Этот формат является открытым, и при наличии специального ПО такой диск может быть подготовлен в бытовых условиях и содержать файлы DSD, полученные, например, через Интернет. Фирма Mytek Digital выпускает отличные ЦАП способные напрямую обрабатывать DSD поток, очень популярен их продукт Mytek Digital Stereo192-DSD DAC Black Preamp Version.

 

С 2010 года в Интернете стали распространяться аудиофайлы DSD, имеющие расширение DSDIFF или DSF. С помощью специального ПО и ЦАПа они могут воспроизводиться на компьютере, либо могут быть преобразованы в ИКМ-файлы для последующего прослушивания.

 

Сравнение DSD с PCM

Звук SACD сохраняется в формате, называемом Direct Stream Digital (DSD), который отличается от обычного PCM (Импульсно-кодовая модуляция — ИКМ) используемого в компакт-дисках или в обычных компьютерных аудио системах.

Рекордер Direct Stream Digital (DSD) использует модуляцию сигма-дельта. Разрешение DSD составляет 1 бит с частотой сэмплирования 2,8224 МГц. Выходной сигнал рекордера DSD чередуется между уровнями положений «включено» и «выключено» и представляет собой двоичный сигнал — bitstream. Долгосрочный средний коэффициент этого сигнала пропорционален исходному сигналу. В DSD используются методы формирования шума для того, чтобы вывести шумы за пределы слышимого диапазона. В принципе, сохранение потока bitstream в DSD позволяет проигрывателю SACD использовать базовую (однобитную) схему ЦАП, которая включает в себя аналоговый фильтр низкого порядка. Формат SACD способен передавать динамический диапазон 120 дБ от 20 Гц до 20 кГц и расширенный частотный диапазон до 100 кГц, хотя большинство имеющихся в настоящее время плееров заявляют верхний предел 80-90 кГц, а 20 кГц является верхним пределом восприятия человеческого слуха.

 


 

 

Процесс создания сигнала DSD концептуально походит на использование 1-битного аналогово- цифрового (A/D) преобразователя дельта-сигма и исключения decimator (прореживателя), который преобразует 1-битный поток bitstream в многобитный PCM. Вместо того, чтобы записывать напрямую 1-битный сигнал, теоретически требуется только низкочастотный фильтр для восстановления исходного аналогового сигнала. На самом деле это сложнее, и аналогия является неполной при таком 1-битном преобразовании сигма-дельта, и в наши дни имеет довольно редкое применение, одна из причин заключается в том, что 1-битный сигнал не может быть должным образом дитерингован: большинство современных преобразователей сигма-дельта являются многобитными.

 

Из-за характера преобразователей сигма-дельта, прямое сравнение между DSD и PCM не представляется возможным. Однако возможно некоторое приближение, если преобразовать DSD в некоторых аспектах сопоставимый с форматом PCM, который имеет разрядность 20 бит и частотную дискретизацию 96 кГц. Дискретизация PCM — 24 бит обеспечивает (теоретически) дополнительный динамический диапазон 24 дБ.

 


 

Ввиду того, что было чрезвычайно трудно осуществить DSP операции (например работу с эквализацией, балансом, панорамированием и другими изменениями в цифровом виде) в 1- битной среде, а также распространенности студийного оборудования, такого как Pro Tools, которое исключительно работает на основе PCM, подавляющее большинство дисков SACD – в особенности рок и современная музыка, которая опирается на многоканальную технику – фактически микшировались в PCM (или микшировалась в аналоге, а записывались на PCM рекордеры), а затем преобразовывалась в DSD для мастеринга в SACD.

 

Для решения некоторых подобных проблем, был разработан новый студийный формат, как правило, его называют «DSDwide», который сохраняет высокую частоту дискретизации стандартного DSD, но использует 8-бит, а не однобитовый digital word length, при этом в значительной мере опирается на принцип «формирования шума». Он становится почти таким же, как PCM (его иногда пренебрежительно называют «PCM — narrow«), но имеет дополнительные преимущества и более практичен при DSP операциях в студии. Главное отличие в том, что «DSD-Wide» по-прежнему сохраняет частоту дискретизации 2,8224 МГц (64Fs) в то время как самая высокая частота РСМ — 352,8 кГц (8FS). Затем сигнал «DSD-Wide» преобразуется с понижением в обычный DSD для мастеринга SACD. В результате этой технологии и других улучшений, в настоящее время существует несколько цифровых аудио рабочих станций (DAWs), которые работают или могут работать в области DSD, в частности Pyramix и некоторые системы SADiE.

 


 

Другой формат для редактирования DSD это DXD (Digital eXtreme Definition), формат PCM с 24- битным разрешением дискретизации 352,8 кГц (или как вариант 384 кГц).

 

Обратите внимание, что PCM высокого разрешения (DVD-Audio, HD DVD и Blu-ray Disc) и DSD (SACD) все еще могут технически отличаться на высоких частотах. Фильтры восстановления обычно используются в системах декодирования PCM, таким же образом как и раньше, поэтому обычно используются ограничивающие фильтры пропускной способности в системах кодирования PCM. Любые ошибки или нежелательные объекты привносимые такими фильтрами, как правило, влияют на конечный результат. Явное преимущество DSD, заключается в том, что подобная фильтрация не используется. Динамический диапазон DSD быстро спадает при частотах свыше 20 кГц благодаря использованию системы подавления шумов, а также во всех плеерах SACD используется дополнительный фильтр низких частот 50 кГц для обеспечения безопасности, в  ситуациях, когда усилители или колонки не будут выдавать искаженный выходной сигнал, если в сигнале присутствует шум свыше 50 кГц.

 

Схематичное объяснение DSD

 

 

Схема PCM  (Pulse Code Modulation) Импульсно-кодовая модуляция — ИКМ

 

 

 

 

Схема DSD (Direct Stream Digital)


 

 

 

Модуляция Дельта-Сигма

 

Спектральный DSD vs. PCM

 

DSD как формат кодирования

 

 

 

DSD как формат кодирования

 

DSD как формат кодирования

 

Результат кодирования PCM 1FS

 

Результат кодирования PCM 2FS

 

Результат кодирования DSD

 

 

Записи DSD

  • Существует много записей, которые были преобразованы из оригинальных записей PCM
  • Лейблы Audiophile имеют большие библиотеки записей DSD, которые используется для SACD
  • Записи DSD все более доступны для скачивания через Интеренет 

 

Показатели скорости загрузки

  • Размеры файлов для 3 минутной песни и время загрузки (при условии скорости подключения к Интернет 5 мб/сек)

 







Redbook (16/44.1kHz)  32 мб  1 мин.
24/88.2kHz   95 мб.2.6 мин.
24/96kHz 103 мб.2.8 мин.
24/176.4kHz190 мб.5 мин.
DXD (24/352.8kHz)380 мб.10 мин.
DSD  127 мб.  3.4 мин.

 

                   

 

Оборудование для проигрывания DSD

  • Cуществует много ЦАПов, в которых используются стандартные готовые чипы, которые либо не понимают DSD, либо конвертируют поток DSD через PCM для преобразования в аналоговый звук
  • Есть производители, которые создают ЦАПы, способные конвертировать DSD в аналог напрямую без обходных путей
  • Уже имеется много программ способных проигрывать как DSD так и PCM файцлы на Mac и PC  

 

Открытый стандарт DSD-over-PCM (DoP)

  • Обеспечивает отправку данных DSD по стандартным интерфейсам PCM (например AES/ EBU, SPDIF, USB и т.д.)

  • Без преобразования в PCM!
  • Поддерживается наибольшим количеством производителей ЦАП и программного обеспечения для воспроизведения 

Ссылки на внешние ЦАП

 

Благодаря DoP (DSD через PCM) любой стандартный интерфейс PCM может использоваться для DSD, а именно:

 

AES / EBU

  • Плюсы: длинный кабель, синхронизация  
  • Минусы: ограниченная частота дискретизации, требуется второй канал для мастер клока

 

S / PDIF

  • Плюсы: синхронизация  
  • Минусы: короткие кабеля, ограниченная частота дискретизации, требуется второй канал для мастер клока

 

HDMI

  • Плюсы: синхронизация, DSD
  • Минусы: ограниченная частота дискретизации, ограниченная длина кабеля, дороговизна, нет настройки мастер клока

 

USB

  • Плюсы: стандартный на всех компьютерах, поддержка стандартных операционных систем, открытость (может поддерживать DSD или любые будущие форматы), нет ограничения по частоте дискретизации, не требуется второй канал для мастер клока
  • Минусы: ограниченная длина кабеля, асинхронность

 

Firewire

  • очень похож на USB, но все менее и менее популярен среди производителей компьютеров 

www.proitems.ru

Звуковые форматы

На DVD звук может присутствовать во дном из следующих форматов:

Dolby Digital или AC3 — от одного (моно) и двух (стерео) каналов до 6 (левый и правый фронт, центр, левый и правый тыл, сабвуфер). Формат с психоакустическим (т.е. необратимым) сжатием, битрейт до 448 Кбит/с.
PCM — несжатый звук, моно или стерео, встречается редко
DTS — многоканальный канал, битрейт выше, чем у AC3, встречается чаще, но всегда имеет в качестве «дублера» AC3
MPEG audio (MPEG-1 layer 1 или 2) — встречается крайне редко, практически только на любительском видео

Частота дискретизации звука, независимо от способа кодирования, равна 48 кГц.

В свою очередь, в видео файлах могут присутствовать звуковые дорожки с различной внутренней структурой:

WAV (PCM WAV) — несжатый моно или стерео звуковой файл с любой частотой дискретизации и разрядностью
AC3 (Dolby Digital) — как правило точная копия звуковой дорожки DVD
MP3 — звук сжат по методу MP3, файловый контейнер WAV или MP3, с любой допускаемой стандартом MP3 частотой дискретизации и постоянным битрейтом
MP3-VBR — MP3 поток с переменным битрейтом, файловый контейнер MP3

Какой же формат звуковой дорожки следует выбрать? Это зависит от назначения файла (окончательный вариант или предполагается дальнейшая обработка звука звуковыми редакторами), исходного формата, качества и характера звукового сопровождения фильма
Использовать PCM-WAV имеет смысл только в промежуточной копии фильма, в предвидении дальнейшей обработки звуковой дорожки аудиоредакторами. В противном случае придется мириться с огромным битрейтом аудио, превосходящим типичный битрейт видеодорожки — при том, что многократно превосходящий по «плотности» MP3 практически неотличим на слух
Многоканальный AC3-звук имеет смысл использовать только тогда, когда это оправдано наличием в фильме «объемных» звуковых эффектов, причем зрители имеют не простую стереосистему, а оборудование «Домашнего кинотеатра»
Моно или стерео AC3 обычно имеет такой же или чуть больший битрейт, чем MP3 того же качества (64 Кбит/с для моно, 192 Кбит/с для стерео). Его можно использовать, чтобы избежать сложных процедур переконвертации в MP3. Все же иногда битрейт оказывается великоват, и к этой процедуре приходится прибегать

MP3 (обычно стерео) используется во всех остальных случаях. Можно дать следующие рекомендации по поводу битрейта (цифры в Кбит/с):

192 и > — музыкальное кино с важными для восприятия оркестровыми моментами, например классика или инструментальный рок
128 — 160 — наличествует обильное музыкальное сопровождение, иные звуки играют важную изобразительную роль
96 — 112 — разговоры, машины, выстрелы… e.t.c.
80 и < — при нехватке места, при таком битрейте слабеет стереоэффект

Приведенные числа касаются стереозвука, при моно достаточен битрейт 64 или 56

Для сравнения: битрейт:

192 — 256 близок к CD-качеству
128 вещанию FM-радио
96 качество воспроизведения FM-радио на стереоаппаратуре

Таким образом, пластмассовые компьютерные колонки, скорее всего, вообще не позволят услышать разницу между дорожками с разным битрейтом
Напоследок замечание об использовании переменного битрейта MP3. По идее, VBR (переменный битрейт) позволяет резко снизить битрейт без потери качества звука. MP3 — кодер кодирует музыкальные номера с максимальным разрешенным битрейтом, разговоры с меньшим, а секунды полной тишины — битрейтом 32. На практике, к сожалению, так не получается. Т.е. полная (созданная искусственно) тишина действительно кодируется битрейтом 32, но равномерный тихий шум в промежутке между звуками речи и т.п. воспринимается как «белый шум», в котором равномерно представлены все частоты, и кодер пытается кодировать его с битрейтом, близким к максимальному. На сегодня кодеры не умеют кодировать неидеально тихие промежутки с битрейтом ниже 112. Таким образом, имеет смысл применять VBR только при высоких битрейтах, причем их удается снизить не очень сильно (несколько приблизив к 112). С другой стороны, использование VBR создает проблемы как при дальнейшей обработке, так и при проигрывании готового видео (при использовании этого формата гораздо чаще возникает рассинхронизация, т.е., не совпадение или плавающий звук. Поэтому использовать этот формат стоит, только если в фильме звучит высококачественная музыка, при этом битрейт критичен.
Наконец, коротко поговорим о случаях хаотической нелинейной рассинхронизации, когда звук «гуляет» относительно видео достаточно случайным образом. Это бывает, во-первых, при использовании звукового файла от другого (перемонтированного) выпуска фильма, а во-вторых, при использовании видео или звука, захваченного аналоговыми устройствами с ТВ-трансляции или стороннего сигнала. В этом случае необходимо, во-первых, устранить эффект регулярного отклонения по скорости (пресловутые 4%, возникающие в треугольнике NTSC-кино-PAL). Если нелинейная рассинхронизация была вызвана работой монтажера, это довольно быстро поправимо, если же плохим аналоговым захватом возможно …

myhouselife.ru

Отправить ответ

avatar
  Подписаться  
Уведомление о