Super Audio CD (SACD)

Sony en Philips introduceren in 1999 de door hun gezamenlijk ontwikkelde “Super Audio CD” (SACD) als de volgende generatie in audioweergave en als de gedoodverfde opvolger van de CD. Het verschil met de dan al 16 jaar oude CD zit ‘m in een aantal zaken als: opslagcapaciteit, opslagmethodiek, sample frequentie, frequentie response en dynamic range. Al deze zaken komen verderop in het artikel nog ter sprake.

Vanaf de ontwikkeling van de SACD speler is een slot op de digitale uitvoer gezet om hoge resolutie kopieën te voorkomen. Dit resulteerde in afgeschakelde delen van de chipset als de SACD laag beluisterd werd, waardoor er geen signaal op de digitale uitgangen aangeboden werd.

Tot voor kort was het (bijna) niet mogelijk om de DSD-laag van een SACD digitaal van het schijfje naar de harde schijf van een PC te transporteren en vandaar af te streamen. Dit alles vanwege het aangebrachte ‘watermerk’, wat in feite niet meer is dan encryptie van de data. Alleen m.b.v. een chip van Sony of Philips, was het mogelijk om de data te decoderen.

Anno 1999

De eerste SACD speler in 1999 is het SCD1 vlaggenschip van Sony, snel gevolgd door bijna even kostbare zware apparaten van Marantz (destijds een volle dochter van Philips). Later komen er weliswaar goedkopere spelers, maar die lieten de klankmatige voordelen van de SACD ook steeds minder geprononceerd doorklinken…

De SACD is nooit echt mainstraim geworden, maar een aantal audiofiele labels als Analogue Productions en MFSL,brengen met regelmaat nieuwe releases uit. In Japan is de situatie tot op de dag van van vandaag veel rooskleuriger en is de zogenaamde ‘SHM SACD’ erg populair met albumreleases die we in Europa nooit mochten meemaken. Saillant detail: de brandnieuwe en geweldig goed klinkende Remasters van Queen, zijn in Europa en de USA op CD uitgebracht, terwijl in Japan de hele serie in het SACD format mag verwelkomen.

SACD data wordt publiek beschikbaar

Het door Sony uitbrengen van een Playstation3 met ingebouwde SACD speler, een aantal jaren geleden, opende de deur voor een aantal techneuten om de, tot aan dat moment goed beschermde, SACD-data beschikbaar te maken voor het publiek. Zij zagen kans om de firmware van de PS3 dusdanig aan te passen, dat het met behulp van software mogelijk werd om een ISO image te maken van deze audio schijfjes.

In eerste instantie kwamen deze ‘geripte’ SACD’s op Internet beschikbaar als kant-en-klare 24bit/88.2kHz albums. Vanwege het steeds breder beschikbaar komen van technologische ontwikkelingen op het gebied van DAC’s, kwam al snel ook 176.4kHz in zwang. Sindsdien worden er discussies gevoerd of het wel zin heeft om deze SACD images om te zetten naar hoog resolutie PCM bestanden met een sample frequentie van 176.4KHz.

Omdat ik er zelf ook mee heb zitten worstelen, ben ik wat dieper in de materie gedoken. Om een antwoord te kunnen geven hoe zinvol conversie van DSD naar 176.4KHz PCM is, is het van belang om te begrijpen hoe DSD en PCM zich tot elkaar verhouden.

DSD is de afkorting van Direct Stream Digital en is een methode die beschrijft hoe het analoge signaal is vastgelegd in het digitale domein. De oorsprong van deze opslagmethodiek ligt bij Sony en was bedoeld voor het archiveren van master tapes, met als achterliggend idee dat deze tapes niet het eeuwigdurend leven hadden.

Hoe zit DSD in elkaar?

Eenvoudig gesteld is DSD een 1 bit signaal, wat betekent dat elk bit een representatie is (een sample) van een gemeten staat van de amplitude van een geluidsgolf op een bepaald moment in de tijd. Omdat een bit maar 2 mogelijke waardes heeft, vertelt elk bit in een DSD-datastroom of de amplitude van een geluidsignaal hoger of lager was dan het voorgaande sample. Omdat er geen mogelijkheid is om aan te geven hoeveelhoger of lager de amplitude is, zijn er enorm veel samples nodig om het signaal precies te beschrijven.

DSD maakt gebruik van oversampling die 64x hoger is dan die van een CD (2822kHz versus 44.1kHz) De factor 64 is niet toevallig gekozen. Het is een macht van twee, wat betekent dat het relatief eenvoudig is om vanuit typische PCM sample frequenties, zoals 44.1 en 88.2kHz, te upsamplen naar DSD (en visa versa).

 

Is dit van belang voor het beantwoorden van onze vraag?

Ja, want de kwaliteit van geluid wordt bepaald door de accuraatheid van het signaal in het tijddomein!

 Waarin verschillen PCM en DSD van elkaar?

PCM (Pulse Code Modulation) is een erg abstracte manier om een analoog signaal op een digitale wijze te beschrijven, maar het was in de tachtiger jaren, toen de CD werd ontwikkeld en geïntroduceerd, de best beschikbare manier. In PCM bestaat elk sample uit een combinatie van bits (afhankelijk van het medium tussen de 14 en 20 bits) die de amplitude van het signaal beschrijft. Het aantal bits bepaalt de resolutie en daarmee de mate van detaillering waarmee het signaal wordt beschreven, waar bij elk extra bit het aantal niveaus verdubbeld wat kan worden onderscheiden.

Conversie van een analoog geluid naar PCM en weer terug naar een analoog geluid, heeft een behoorlijk aantal processtappen nodig zoals kwantisatie (een methode om analoge signalen te digitaliseren) Elke stap in dat proces veroorzaakt meer vervorming (zoals kwantisatie noise, wat veroorzaakt wordt door afrondingsfouten in het digitaliseringsproces) wat er weer uitgefilterd moet worden en derhalve afbreuk doet aan de geluidskwaliteit.

In het onderstaande plaatje wordt weergegeven hoe afrondingsfouten ontstaan bij kwantisatie van een analoog signaal naar PCM.

Door middel van dit plaatje wordt ook direct duidelijk, dat naarmate de sampling frequentie toeneemt, de foutmarge steeds kleiner zal worden en het signaal accurater bij het samplen van een analoog audiosignaal naar een PCM formaat.

 

DSD op zijn beurt, is een extreem eenvoudige manier om analoog om te zetten naar digitaal en visa versa. Het gehele proces is zeer transparant. In feite is de DSD bitstroom zo nauw gerelateerd tot het analoge signaal, dat als je het naar een speaker zou sturen (als een serie van +1 en -1 waarden) je hoorbare muziek terug krijgt. Door het signaal simpelweg door een ‘waveform shaping’ en lowpass filter te sturen, is DSD in staat om het originele audio signaal waarheidsgetrouw te reproduceren.

Naar een conclusie

Technologie heeft zich sinds het uitkomen van de CD verder ontwikkeld en zo ook het inzicht in de menselijke perceptie van geluid. Een voorbeeld hiervan is dat het pas veel later duidelijk werd dat, ondanks het feit dat het menselijk gehoor niet op een directe wijze frequenties kan oppikken onder de 20Hz en boven de 20kHz, deze frequenties van belang zijn voor de wijze waarop we geluiden horen. SACD met DSD heeft een technische frequentie range tot 100kHz, maar wordt hard gefilterd op 50kHz.

Een belangrijk verschil tussen een CD met 44.1kHz 16bit PCM geluidskwaliteit en een SACD met 2822kHz 1bit DSD geluidskwaliteit, is de accuraatheid van het signaal in het tijddomein. Het is gebleken dat het menselijk oor extreem gevoelig is voor zeer kleine timingverschillen. Van al de verschillende hersenfuncties, is plaatsbepaling van geluidsbronnen een erg belangrijke functie. Hierbij wordt vastgesteld wat de verschillen (in de tijd gezien) zijn voor geluiden die ons linker oor bereiken versus die voor het rechter oor. Met een sample frequentie van 44.100 keer per seconde is het lastig om een goede ‘soundstage’ te reproduceren. Dit lukt wèl indien er goede opname technieken zijn gebruikt, maar lang niet alle CD’s zijn in staat om een soundstage neer te zetten zoals een SACD dat doet. Op het gebied van plaatsing en soundstage blinkt DSD uit. Daar komt nog bij dat de ‘Dynamic Range’ van een SACD met 120dB een stuk beter uit de verf komt dan die van een CD (96dB)

De conclusie op basis van technologie

De hoge signaal accuratesse van DSD door zijn 64-voudige sample rate, aangevuld met een groter dynamisch bereik tot 120dB en een frequentiebereik van 50kHz, maken het zeer zinvol om de SACD ISO’s om te zetten naar 24bit 176.4kHz PCM. Het is overigens minder wenselijk om deze conversie uit te voeren naar 192kHz PCM vanwege de afrondingsfouten die ontstaan bij het resamplen van DSD en de vervorming die dit tot gevolg heeft.

Dat er afrondingsverschillen ontstaan, wordt duidelijk in het volgende tabelletje waar we een binaire deling loslaten op de DSD sample rate van 2822,4kHz en de uitkomsten afzetten tegen een 192kHz sample rate.


Zoals eerder in dit artikel beschreven, heeft DSD 44,1kHz als basis met een 1bit datastream en een oversampling rate van 64x. Het converteren van DSD naar 192kHz leidt dus tot een restwaarde van een groot aantal samples, wat ergens tijdens de conversie gecompenseerd moet worden.

 

De reproductie van PCM naar een audiosignaal, is op het niveau van 24bit 176.4kHz gelijkwaardig te noemen aan DSD. ‘Dubbelblinde’ luistertesten (case study Audio Engineering Society 2004) hebben tevens uitgewezen dat er geen hoorbare verschillen waarneembaar zijn op dat niveau.

De conclusie op basis van eigen ervaringen

Ik moet bekennen dat ik met veel plezier luister naar hoge-resolutie albums en dat er bij een groot aantal albums een verschil is te beluisteren in de ruimtewerking oftewel de soundstage. De plaatsing van 176,4 en 192kHz albums is wat beter dan bij 88 en 96kHz albums. Anderzijds zijn er ook hoge-resolutie albums, waarvan ik mij echt zit af te vragen of de weergave nu wel zoveel beter is als hetzelfde album in een lagere resolutie. Er zijn zelfs albums bij (uit de oude doos) waar je gratis Hi-Res ruis bij krijgt. Het is natuurlijk in alle gevallen zo, dat het eindresultaat nooit beter kan zijn dan het bronmateriaal. Met andere woorden: garbage in, garbage out. Maar gelukkig zijn er zat juweeltjes te vinden in het Hi-Res aanbod en luister ik er, zoals eerder gezegd, met veel plezier naar en soms ook met verwondering over de schoonheid van de muziek.

Eerder gepubliceerd:

Audio-Creative   24 augustus 2012

Bronnen:

  • Sony: Super Audio CD DSD Decoder (Pdf)
  • Technoworld: Key Chip for Next Generation of Audio (1999)
  • Georgia State University: Hyperphysics
  • PS3SACD.com
  • Wikipedia

Zoeken naar artikelen

Oudere berichten