Czy dźwięk cyfrowy może kiedykolwiek przewyższyć jakość dźwięku analogowego?
Opublikowany: 2022-06-03 Od czasu pojawienia się płyty kompaktowej i powszechnego dostępu konsumentów do cyfrowego dźwięku, który przyniósł, ludzie debatowali nad tym, czy cyfrowy dźwięk mógłby kiedykolwiek odpowiednio zastąpić swoich analogowych poprzedników.
Wraz ze wzrostem rozpowszechnienia i złożoności cyfrowych formatów do pobrania i przesyłania strumieniowego, dyskusja tylko się nasiliła, a wielu zagorzałych analogowych „purystów” potępia utratę muzycznej duszy, której ich zdaniem brakuje w nowoczesnych cyfrowych formatach audio.
Ale nie jestem tu po to, by polemizować z purystami lub w ich imieniu. Zamiast tego przyjrzyjmy się wymaganiom scenariusza, w którym dźwięk cyfrowy mógłby być równy, a może nawet przewyższyć dźwięk analogowy. I odpowiedź na pytanie: „czy cyfrowy dźwięk może kiedykolwiek przewyższyć analogowy?” faktycznie składa się z dwóch części.
Niedługo wkroczymy mocno w świat matematyki i nauki, więc trzymaj się swoich czapek!
Sygnały ciągłe a dyskretne
Po pierwsze, ważne jest, aby dokładnie zrozumieć, jaka jest różnica między dźwiękiem analogowym a cyfrowym.
Dźwięk analogowy wykorzystuje ciągle zmieniający się sygnał audio ; co oznacza, że fluktuacje ciśnienia podawane do głośnika z jego sygnału są (przynajmniej idealnie) dokładną reprodukcją oryginalnego dźwięku w każdym momencie.
Z drugiej strony dźwięk cyfrowy składa się z szeregu dyskretnych kroków w sygnale audio, które zmieniają się na tyle szybko, że dają złudzenie ciągłego sygnału po podaniu do głośnika. Jest to bardzo podobne do sposobu, w jaki tworzy się wideo z serii nieruchomych obrazów, które są przewijane wystarczająco szybko, aby dać iluzję płynnego ruchu (stąd oryginalna fraza „ruchome obrazy”).
W efekcie dźwięk cyfrowy próbuje zbliżyć się do ciągłego sygnału dźwięku analogowego. Jeśli dyskretne kroki w cyfrowym dźwięku zmieniają się wystarczająco często, a same kroki są w stanie być wystarczająco blisko siebie na poziomie, to wynikowe przybliżenie jest wystarczająco bliskie ciągłemu sygnałowi analogowemu, który może oszukać nasze uszy i mózg.
Rozdzielczość sygnału
Szybkość cyklu dyskretnych kroków w cyfrowym sygnale dźwiękowym jest znana jako częstotliwość próbkowania. Różnica poziomów między każdym krokiem jest określona przez całkowitą liczbę potencjalnych kroków, znaną jako jego głębia bitowa.
Na przykład, pliki audio CD mają częstotliwość próbkowania 44 100 Hz (Hz oznacza herc, który jest jednostką miary opisującą, ile razy zdarzenie powtarza się w ciągu sekundy — co oznacza, że wytwarza 44 100 nowych kroków sygnału audio na sekundę) i bit głębokość 16 bitów (każdy bit jest cyfrą binarną, tak że 16-bitowy sygnał cyfrowy ma w sumie od 2 do potęgi 16, czyli 65 536 możliwych wartości liczbowych między jego wartością minimalną a maksymalną).
Ten wybór wartości dla dźwięku CD nie jest przypadkowy. Zgodnie ze wzorem znanym jako twierdzenie Nyquista, ta częstotliwość próbkowania 44 100 Hz to minimum wymagane do wytworzenia dźwięków o tonach obejmujących pełen zakres typowego ludzkiego słuchu. A 16-bitowa szybkość transmisji była największą, jaką można było łatwo wykorzystać i która nadal mieściła rozsądną ilość materiału dźwiękowego na standardowej płycie kompaktowej.
Można powiedzieć, że ponieważ cyfrowy sygnał dyskretny jest jedynie przybliżeniem rzeczywistego dźwięku, bez względu na to, jak dobry może być, nigdy nie będzie w pełni pasował do rzeczywistego, dokładnego, ciągłego sygnału analogowego, więc to powinien być koniec sporu. Pozostaje jednak pytanie, czy ludzki mózg rzeczywiście jest w stanie odróżnić, szczególnie w przypadku cyfrowego dźwięku o wyższej rozdzielczości.
To jest pytanie dla neuronaukowców, więc dla naszych celów całkowicie unikniemy tej dyskusji i zamiast tego zadamy pytanie: „czy analogowe źródła mediów rzeczywiście wytwarzają prawdziwy ciągły sygnał audio?”
Media analogowe
Rozważmy najpopularniejszy format mediów analogowych, którym jest płyta winylowa. Płyta winylowa ma określone właściwości materiału, które decydują o tym, jak się zachowuje, do czego jest zdolna i jakie są jej ograniczenia. Ponadto gramofon (gramofon) ma swoje właściwości materiałowe, możliwości i ograniczenia.
Płyty winylowe są zazwyczaj wykonane z półsztywnej formy PVC lub polichlorku winylu. Sygnał analogowy jest rzeźbiony bezpośrednio w rowkach na płycie, deformując w ten sposób materiał PVC w odpowiedzi na sygnał. Igła jest używana w gramofonie, aby „odczytać” te mikroskopijne deformacje, a tym samym odtworzyć oryginalny sygnał, który je utworzył.
Materiał winylowy, PVC, ma minimalną wielkość związaną z jego strukturą molekularną i krystaliczną, co w efekcie oznacza, że deformacje materiału w rowkach płyty nie mogą zostać zmienione na drobniejszą skalę, niż pozwalają na to jego właściwości fizyczne. W istocie nie jest więc w stanie wyprodukować idealnie ciągłego sygnału, a raczej przybliżenie tego sygnału ograniczone właściwościami samego materiału winylowego.
Nie można wykonać cięcia w rowkach płyty mniejszego niż rozmiar minimalnej wielkości cząsteczki materiału PVC — pojedynczego monomeru chlorku winylu (znanego również jako cząsteczka chloroetenu).
Rozdzielczość sygnału płyt winylowych
PVC używany do produkcji płyt winylowych ma gęstość około 1,3 grama na centymetr sześcienny. A pojedynczy monomer chlorku winylu (jedna cząsteczka chloroetenu) ma masę około 1,07x10 -22 gramów. Oznacza to, że w winylowych płytach długogrających znajduje się około 12,1x1021 pojedynczych cząsteczek chloroetenu w przestrzeni 1 centymetra sześciennego PVC. Najmniejszy drzazg tego materiału, jaki moglibyśmy odciąć z jednej strony, miałby grubość jednej cząsteczki, którą teraz możemy oszacować na około 4,4x10 -8 cm.
Rowek w płycie winylowej może być wyrzeźbiony do maksymalnej szerokości około 0,008 cm, przy czym jedna połowa rowka jest związana z lewym kanałem, a druga połowa z prawym kanałem. Oznacza to, że igła może wyczuć maksymalną zmianę pozycji dla każdego kanału do 0,004 cm.

Tak więc maksymalna liczba wycinków molekularnych, które moglibyśmy wyciąć, aby uzyskać maksymalną zmianę rozmiaru rowka dla każdego kanału, wynosiłaby około 91 000. Działa to na tej samej zasadzie, co głębia bitowa cyfrowego sygnału audio.
Ponadto, ze względu na prędkość, z jaką płyta obraca się na talerzu obrotowym, średnicę płyty i szerokość poszczególnych rowków wycinanych w płycie, można wykazać, że do wyrzeźbienia jest około 45 000 cm całkowitej długości rowków. sygnał do (z każdej strony rekordu), który, jeśli jest wypełniony w całości, jest odtwarzany przez łączny czas około 1400 sekund z prawidłową prędkością odtwarzania.
Dlatego możemy oszacować, że igła przechodzi średnio około 730 milionów pojedynczych cząsteczek chloroetenu na sekundę podczas pełnego odtwarzania jednej strony płyty LP. Działa to na tej samej zasadzie, co częstotliwość próbkowania dla cyfrowych sygnałów audio. Mówi nam o najmniejszym kroku, który można odtworzyć w przybliżeniu w czasie zmiany oryginalnego sygnału audio.
Porównanie rozdzielczości sygnału
Tak więc za pomocą niektórych metod estymacji (nadmiernie uproszczonych, ale ważnych w sensie ogólnym) możemy zobaczyć, że płyta winylowa daje takie samo dyskretne przybliżenie do ciągłego sygnału dźwiękowego, jak sygnał cyfrowy o głębokości bitowej co najmniej 16 bitów i próbce częstotliwość 730 MHz.
Ale nie ekscytuj się jeszcze. Nie możesz po prostu wziąć wszystkich swoich cyfrowych plików WAV i MP3 i przekonwertować je na 17-bitowe pliki audio 730 MHz i powiedzieć wszystkim, że są równie dobre jak winyl. Twoje przybliżenie prawdziwego ciągłego sygnału audio, czy to za pomocą środków analogowych, czy cyfrowych, musi być utrzymywane w maksymalnej rozdzielczości przez cały proces, aby powiedzieć, że spełnia ten standard.
Większość urządzeń analogowych to robi, ale większość urządzeń cyfrowych nie. Jak tylko zastosujesz metodę cyfrową z czymkolwiek poniżej minimalnego standardu, który odpowiada LP, zmniejszysz dokładność swojej aproksymacji. Każda późniejsza konwersja do wyższej rozdzielczości po prostu lepiej odtworzy najmniej dokładne przybliżenie zastosowane podczas procesu produkcyjnego.
Ponadto, podczas gdy 24-bitowe i 32-bitowe nagrania cyfrowe są obecnie łatwo dostępne, znacznie przewyższając efektywną głębię bitową winylu, w rzeczywistości nawet najlepszy cyfrowy sprzęt do nagrywania dostępny dla większości ludzi ma maksymalną częstotliwość próbkowania 192 kHz, co jest prawie 4000 razy wolniejszy niż musiałby być, aby nadążyć za efektywną częstotliwością próbkowania winylu.
Tak więc odpowiedź na pierwszą część naszego pytania, dotyczącą technicznego porównania dźwięku analogowego z cyfrowym, brzmi: tak, teoretycznie dźwięk cyfrowy może przewyższać dźwięk analogowy. Potencjał techniczny nowoczesnego dźwięku cyfrowego przewyższa dźwięk analogowy pod względem głębi bitowej, ale znacznie odbiega od analogowego pod względem częstotliwości próbkowania (obecnie).
Analogowy smak w łańcuchu produkcyjnym
Druga część pytania dotyczy tego, jak faktycznie brzmi produkt końcowy. Innymi słowy, powiedzmy, że w pewnym momencie w przyszłości technologia umożliwi cyfrowemu audio osiągnięcie częstotliwości próbkowania 730 MHz lub lepszej, którą obliczyliśmy, aby dopasować efektywną częstotliwość próbkowania winylu. Czy w tamtym czasie, gdy cyfrowy dźwięk miał potencjał techniczny do osiągnięcia lub przewyższenia technicznego potencjału dźwięku analogowego, czy dźwięk cyfrowy byłby równie dobry lub lepszy niż analogowy?
Aby odpowiedzieć na to pytanie, ważne jest, aby zdać sobie sprawę, że wiele z tego, co ludzie lubią w dźwięku pochodzącym z winylu, wynika z analogowego sprzętu produkcyjnego używanego do nagrywania i miksowania oraz z jego szczególnego brzmienia .
W ostatnich latach modelowanie cyfrowe stało się bardzo dobre i prawdopodobnie może odpowiadać wielu klasycznym brzmieniom analogowym, które preferują ludzie. Oczywiście, technologia musiałaby pozwolić na zachowanie tej samej maksymalnej rozdzielczości dźwięku przez cały proces.
Ale wydaje się, że można bezpiecznie powiedzieć, że tak – zakładając, że dźwięk cyfrowy w końcu osiągnie ten sam potencjał techniczny w zakresie reprodukcji dźwięku, co obecne metody analogowe i utrzyma tę rozdzielczość przez cały proces produkcji, a używany jest sprzęt analogowy lub cyfrowe modelowanie sprzętu analogowego. w procesie uzyskiwania preferowanego aromatyzowania dźwięku — dźwięk cyfrowy powinien być w stanie osiągnąć lub przewyższyć wydajność dźwięku analogowego zarówno pod względem jakości technicznej, jak i preferencji dźwiękowych.
Praktyczność
Koniec dyskusji? Cóż, spójrzmy na ostatnią kwestię.
Wyobraźmy sobie, że cały proces został wykonany w formacie cyfrowym na poziomie lub wyższym od standardu technicznego, który odpowiada analogowemu i wykorzystuje analogowe efekty modelowania w tym standardzie. Jeśli wyprodukujemy w pełnej jakości nieprzetworzony plik audio WAV z trzyminutowego nagrania, rozmiar pliku cyfrowego na tym poziomie będzie prawie 18 000 razy większy niż plik WAV o tej samej długości w jakości CD audio, co da mu plik rozmiar ponad 500 Gb na jedną, krótką piosenkę.
Biorąc pod uwagę ten ogromny problem z rozmiarem plików, a także fakt, że obecne częstotliwości próbkowania cyfrowego są znacznie poniżej wymagań, aby spełnić standardy dźwięku analogowego, wydaje się jasne, że winyl nadal jest dobrym wyborem.
Jednak ze względu na wszechobecność cyfrowych systemów odtwarzania, ciągłe postępy w technologii dźwięku cyfrowego i możliwość utrzymywania multimediów w całkowicie wirtualnym środowisku, które nie wymaga przechowywania dużej płyty winylowej i specjalnego sprzętu do jej odtwarzania, prawdopodobnie jest to tylko to kwestia czasu, aż w końcu dźwięk cyfrowy, jednoznacznie przewyższy dźwięk analogowy.
Stwórz własną muzyczną stronę internetową, która jest gotowa na urządzenia mobilne i łatwa do aktualizacji w dowolnym momencie! Zbuduj teraz stronę internetową z Bandzoogle.
---
Erik Veach jest właścicielem i głównym inżynierem dźwięku w firmie Crazy Daisy Productions, świadczącej usługi miksowania, masteringu i edycji dźwięku od 2001 roku. Jest pierwotnym pionierem zautomatyzowanych inteligentnych systemów masteringowych, wprowadzając je do użytku w profesjonalnej produkcji muzycznej w 2003 roku.