هل يمكن أن يتفوق الصوت الرقمي على الأداء التناظري؟

نشرت: 2022-06-03

هل يمكن أن يتفوق الصوت الرقمي على الأداء التناظري؟ منذ ظهور القرص المضغوط ، وانتشار وصول المستهلكين إلى الصوت الرقمي الذي جلبه ، ناقش الناس ما إذا كان الصوت الرقمي يمكن أن يحل محل أسلافه التناظرية بشكل كافٍ أم لا.

نظرًا لأن التنسيقات الرقمية القابلة للتنزيل والمتدفقة ازدادت من حيث الانتشار والتعقيد ، فقد تضخمت المناقشة فقط ، حيث شجب العديد من "الأصوليين" التناظريين فقدان الروح الموسيقية التي يشعرون أنها مفقودة بشكل ملحوظ في تنسيقات الصوت الرقمية الحديثة.

لكنني لست هنا لأجادل أو من أجل الأصوليين. بدلاً من ذلك ، دعنا نستكشف متطلبات السيناريو الذي يمكن أن يكون فيه الصوت الرقمي مساويًا للصوت التناظري وربما يتجاوزه. والإجابة على السؤال ، "هل يمكن أن يتفوق الصوت الرقمي على الأداء التناظري؟" في الواقع من جزأين.

نحن على وشك الدخول بقوة في عالم الرياضيات والعلوم ، لذا تمسك بقبعاتك!

الإشارات المستمرة مقابل الإشارات المنفصلة

أولاً ، من المهم أن تفهم بالضبط ما هو الفرق بين الصوت التناظري والرقمي.

يستخدم الصوت التناظري إشارة صوتية متغيرة باستمرار ؛ مما يعني أن تقلبات الضغط التي يتم تغذيتها على مكبر الصوت من إشارته هي (على الأقل من الناحية المثالية) إعادة إنتاج دقيقة للصوت الأصلي في كل لحظة من الزمن.

من ناحية أخرى ، يتكون الصوت الرقمي من سلسلة من الخطوات المنفصلة في إشارة الصوت الخاصة به والتي تتغير بسرعة كافية بحيث تعطي الوهم بوجود إشارة مستمرة عند توصيلها إلى مكبر الصوت. هذا مشابه جدًا للطريقة التي يتم بها إنشاء مقطع فيديو من سلسلة من الصور الثابتة التي يتم تدويرها بسرعة كافية لإعطاء وهم الحركة السلسة (ومن هنا جاءت العبارة الأصلية "الصور المتحركة").

لذلك ، في الواقع ، يحاول الصوت الرقمي تقريب الإشارة المستمرة للصوت التناظري. إذا تغيرت الخطوات المنفصلة في الصوت الرقمي بشكل متكرر بما فيه الكفاية ، وإذا كانت الخطوات نفسها قادرة على أن تكون قريبة بما فيه الكفاية معًا في المستوى ، فإن التقريب الناتج يكون قريبًا بدرجة كافية من الإشارة التناظرية المستمرة التي يمكن أن تخدع آذاننا ودماغنا.

دقة الإشارة

تُعرف سرعة تدوير الخطوات المنفصلة في إشارة صوتية رقمية باسم معدل العينة الخاص بها. يتم تحديد الفرق في المستوى بين كل خطوة من خلال العدد الإجمالي للخطوات المحتملة ، والمعروف باسم عمق البت.

على سبيل المثال ، تحتوي ملفات الصوت المضغوط على معدل عينة يبلغ 44100 هرتز (Hz تعني Hertz ، وهي وحدة القياس التي تصف عدد مرات تكرار الحدث كل ثانية - مما يعني أنه ينتج 44100 خطوة إشارة صوتية جديدة كل ثانية) وقليلًا عمق 16 بت (كل بت عبارة عن رقم ثنائي ، بحيث يكون للإشارة الرقمية 16 بت إجمالي 2 أس 16 ، أو 65.536 قيمة رقمية محتملة بين الحد الأدنى والحد الأقصى لقيمتها).

إن اختيار قيم الأقراص المضغوطة الصوتية ليس مصادفة. من خلال صيغة تُعرف باسم نظرية نيكويست ، فإن معدل العينة هذا البالغ 44100 هرتز هو الحد الأدنى المطلوب لإنتاج أصوات ذات نغمات تغطي النطاق الكامل للسمع البشري النموذجي. وكان معدل البت البالغ 16 بتًا هو الأكبر الذي يمكن استخدامه بسهولة ولا يزال يتناسب مع كمية معقولة من مادة الصوت على قرص مضغوط قياسي.

يمكنك القول أنه نظرًا لأن الإشارة الرقمية المنفصلة هي مجرد تقريب للصوت الفعلي ، فبغض النظر عن مدى جودتها ، فإنها لن تتطابق تمامًا مع الإشارة التناظرية الفعلية المستمرة تمامًا ولذا يجب أن تكون نهاية الحجة. ومع ذلك ، يظل السؤال المطروح هو ما إذا كان بإمكان الدماغ البشري تمييز الفرق أم لا ، خاصةً مع الصوت الرقمي عالي الدقة.

هذا سؤال لعلماء الأعصاب ، لذلك لأغراضنا ، سنتجنب هذا النقاش تمامًا وبدلاً من ذلك نسأل السؤال: "هل تنتج مصادر الوسائط التناظرية في الواقع إشارة صوتية مستمرة حقيقية في المقام الأول؟"

الوسائط التناظرية

لنفكر في تنسيق الوسائط التناظرية الأكثر شيوعًا ، وهو تسجيل الفينيل. يحتوي سجل الفينيل على خصائص مادية معينة تحدد كيف يتصرف ، وما هو قادر عليه ، وما هي حدوده. بالإضافة إلى ذلك ، فإن القرص الدوار (مشغل التسجيلات) له خصائصه المادية وقدراته وقيوده أيضًا.

سجل الأخدود

تُصنع سجلات الفينيل عادةً من شكل شبه صلب من PVC أو بولي فينيل كلوريد. يتم نحت إشارة تناظرية مباشرة في الأخاديد الموجودة في السجل ، مما يؤدي إلى تشويه مادة PVC استجابة للإشارة. تُستخدم إبرة على مشغل التسجيلات "لقراءة" هذه التشوهات المجهرية وبالتالي إعادة إنتاج الإشارة الأصلية التي خلقتها.

مادة الفينيل ، PVC ، لها حجم أدنى مرتبط بهياكلها الجزيئية والبلورية ، مما يعني في الواقع أن التشوهات في المادة داخل أخاديد التسجيل لا يمكن تغييرها إلى أي مقياس أدق مما تسمح به خصائصها الفيزيائية. لذلك ، من حيث الجوهر ، فهي ليست قادرة حقًا على إنتاج إشارة مستمرة تمامًا ، بل إنها تقريبية لتلك الإشارة محدودة بخصائص مادة الفينيل نفسها.

لا يمكنك إجراء قطع داخل أخاديد السجل أصغر من حجم الحد الأدنى للحجم الجزيئي لمادة PVC - مونومر كلوريد الفينيل الفردي (المعروف أيضًا باسم جزيء كلورو إيثين).

دقة إشارة سجلات الفينيل

تبلغ كثافة الـ PVC المستخدم في صناعة سجلات الفينيل حوالي 1.3 جرام لكل سنتيمتر مكعب. ومونومر كلوريد الفينيل الفردي (جزيء واحد من كلورو إيثين) كتلته حوالي 1.07 × 10 ^-22 جرام. هذا يعني أن هناك شيئًا مثل 12.1 × 10 ²¹ جزيء كلورو إيثين فردي ضمن مسافة 1 سم مكعب من PVC في فينيل LPs. أصغر قطعة من هذه المادة يمكن أن نقطعها من جانب واحد ستكون بسمك جزيء واحد ، والذي يمكننا الآن تقدير أن سمكه يبلغ حوالي 4.4x10 ^-8 سم.

يمكن نحت الأخدود في أسطوانة الفينيل حتى عرض بحد أقصى 0.008 سم ، مع ربط نصف الأخدود بالقناة اليسرى والنصف الآخر بالقناة اليمنى. هذا يعني أن الإبرة يمكن أن تشعر بأقصى تغيير في الموضع لكل قناة يصل إلى 0.004 سم.

لذا ، فإن الحد الأقصى لعدد الشرائح الجزيئية التي يمكننا قصها لتكوين هذا الحد الأقصى لتغيير حجم الأخدود لكل قناة سيكون حوالي 91000 فقط. يتبع هذا نفس مبدأ عمق البت للإشارة الصوتية الرقمية.

بالإضافة إلى ذلك ، نظرًا للسرعة التي يدور بها السجل على القرص الدوار ، وقطر السجل ، وعرض الأخاديد الفردية المقطوعة في السجل ، يمكن إثبات أن هناك حوالي 45000 سم من إجمالي طول الأخدود المتاح للنحت الإشارة إلى (على كل جانب من السجل) والتي ، إذا تم ملؤها بالكامل ، يتم تشغيلها على مدار وقت إجمالي يبلغ حوالي 1400 ثانية بسرعة التشغيل الصحيحة.

لذلك ، يمكننا تقدير مرور الإبرة على متوسط ما يقرب من 730 مليون جزيء كلورو إيثين فردي كل ثانية أثناء التشغيل الكامل لجانب واحد من LP. يتبع هذا نفس مبدأ معدل العينة للإشارات الصوتية الرقمية. إنها تخبرنا بأصغر خطوة يمكن إعادة إنتاجها لتقريب التغيير بمرور الوقت للإشارة الصوتية الأصلية.

مقارنة دقة الإشارة

لذلك ، مع بعض طرق التقدير (المبسطة ، ولكنها صالحة بمعنى الملعب) يمكننا أن نرى أن سجل الفينيل ينتج نفس التقريب المنفصل لإشارة صوتية مستمرة مثل إشارة رقمية بعمق قليل لا يقل عن 16 بت وعينة معدل 730 ميجا هرتز.

لكن ، لا تجعل كل شيء متحمسًا الآن. لا يمكنك ببساطة أخذ جميع ملفات WAV و MP3 الرقمية الخاصة بك وتحويلها إلى ملفات صوتية 17 بت و 730 ميجاهرتز وإخبار الجميع بأنها جيدة مثل الفينيل. يجب الحفاظ على التقريب الخاص بك لإشارة صوتية مستمرة حقيقية ، سواء عن طريق الوسائل التناظرية أو الوسائل الرقمية ، بأقصى دقة لها طوال العملية بأكملها لتقول إنها تفي بهذا المعيار.

معظم المعدات التناظرية تفعل ذلك ، لكن معظم المعدات الرقمية لا تفعل ذلك. بمجرد أن تستخدم طريقة رقمية بأي شيء أقل من الحد الأدنى للمعيار الذي يطابق LP ، ستقلل من دقة التقريب. أي تحويل لاحق إلى دقة أعلى سيؤدي ببساطة إلى عمل أفضل في إعادة إنتاج التقريب الأقل دقة المطبق أثناء عملية الإنتاج.

بالإضافة إلى ذلك ، في حين أن التسجيلات الرقمية ذات 24 بت و 32 بت يمكن الحصول عليها بسهولة في الوقت الحاضر ، متجاوزة إلى حد كبير عمق البت الفعال للفينيل ، فإن الحقيقة هي أنه حتى أفضل معدات التسجيل الرقمي المتاحة لمعظم الناس اليوم لديها أقصى معدل عينة من 192 كيلو هرتز ، والذي أبطأ بحوالي 4000 مرة مما يجب أن يكون لمواكبة معدل العينة الفعال للفينيل.

لذا فإن الإجابة على الجزء الأول من سؤالنا ، الذي يتعامل مع المقارنة الفنية بين الصوت التناظري والرقمي ، هي: نعم ، نظريًا يمكن أن يتفوق الصوت الرقمي على الصوت التناظري. تفوق الإمكانات التقنية للصوت الرقمي الحديث على الصوت التناظري من حيث عمق البت ، لكنها أقل بكثير من التناظرية من حيث معدل العينة (حاليًا).

النكهة التناظرية في سلسلة الإنتاج

الجزء الثاني من السؤال يتعلق بكيفية ظهور المنتج النهائي بالفعل. بعبارة أخرى ، دعنا نقول في وقت ما في المستقبل ، تسمح التقنية للصوت الرقمي بتحقيق 730 ميجاهرتز أو معدل عينة أفضل حسبنا أنه مطلوب لمطابقة معدل العينة الفعال للفينيل. في ذلك الوقت ، مع امتلاك الصوت الرقمي القدرة التقنية على تلبية أو تجاوز الإمكانات التقنية للصوت التناظري ، هل سيكون الصوت الرقمي جيدًا أم أفضل من الصوت التناظري؟

للإجابة على هذا ، من المهم أن ندرك أن الكثير مما يحبه الناس في الصوت القادم من الفينيل يرجع إلى معدات الإنتاج التناظرية المستخدمة في التسجيل والخلط ، ونكهتها الصوتية الخاصة.

أصبحت النمذجة الرقمية جيدة جدًا في السنوات الأخيرة ويمكن أن تتطابق على الأرجح مع العديد من الأصوات التناظرية الكلاسيكية التي يفضلها الناس. بالطبع ، سوف تحتاج التكنولوجيا إلى السماح بنفس دقة الصوت القصوى التي يجب الحفاظ عليها طوال العملية بأكملها أيضًا.

ولكن ، قد يبدو من الآمن أن نقول نعم - بافتراض أن الصوت الرقمي سيحقق في النهاية نفس الإمكانات التقنية لإعادة إنتاج الصوت مثل الطرق التناظرية الحالية ، والحفاظ على هذه الدقة طوال عملية الإنتاج بأكملها ، ويتم استخدام المعدات التناظرية أو النمذجة الرقمية للمعدات التناظرية في عملية النكهة الصوتية المفضلة - يجب أن يكون الصوت الرقمي قادرًا على تلبية أو تجاوز أداء الصوت التناظري في كل من الجودة التقنية وتفضيل الصوت.

العملية

نهاية المناقشة؟ حسنًا ، لنلقِ نظرة أخيرة على الاعتبار.

دعنا نتخيل أن العملية برمتها تمت بتنسيق رقمي عند أو أعلى من المعيار التقني الذي يطابق التناظرية ويستخدم تأثيرات النمذجة التناظرية في هذا المعيار. إذا قمنا بإنتاج ملف صوتي خام WAV بجودة كاملة لتسجيل مدته ثلاث دقائق ، فسيكون حجم الملف الرقمي عند هذا المستوى أكبر بنحو 18000 مرة من حجم ملف WAV بجودة صوت القرص المضغوط بنفس الطول ، مما يمنحه ملفًا بحجم يزيد عن 500 جيجابايت لأغنية واحدة قصيرة.

مع هذه المشكلة الضخمة في حجم الملف ، بالإضافة إلى حقيقة أن معدلات أخذ العينات الرقمية الحالية أقل بكثير من متطلبات تلبية معايير الصوت التناظري ، يبدو من الواضح أن الفينيل لا يزال خيارًا جيدًا.

ومع ذلك ، مع انتشار أنظمة التشغيل الرقمي في كل مكان ، والتقدم المستمر في تقنية الصوت الرقمي ، وخيار الاحتفاظ بالوسائط في بيئة افتراضية تمامًا لا تتطلب تخزين سجل فينيل كبير ومعدات خاصة لتشغيلها ، فمن المحتمل فقط مسألة وقت حتى يتفوق الصوت الرقمي بشكل لا لبس فيه على الصوت التناظري.

قم بإنشاء موقع الموسيقى الخاص بك بحيث يكون جاهزًا للجوّال ويسهل تحديثه في أي وقت! بناء موقع على شبكة الإنترنت مع Bandzoogle الآن.

Erik Veach هو المالك ومهندس الصوت الرئيسي في Crazy Daisy Productions ، حيث يقدم خدمات المزج والإتقان وتحرير الصوت منذ عام 2001. وهو الرائد الأصلي لأنظمة إتقان الذكاء الآلي ، حيث قدمها لاستخدامها في الإنتاج الموسيقي الاحترافي في عام 2003.