เสียงดิจิตอลจะมีประสิทธิภาพเหนือกว่าอนาล็อกหรือไม่?
เผยแพร่แล้ว: 2022-06-03 นับตั้งแต่การถือกำเนิดของคอมแพคดิสก์และการเข้าถึงเสียงดิจิทัลของผู้บริโภคอย่างแพร่หลาย ผู้คนต่างถกเถียงกันว่าเสียงดิจิทัลจะแทนที่เสียงอนาล็อกรุ่นก่อนได้หรือไม่
เนื่องจากรูปแบบดิจิทัลที่ดาวน์โหลดและสตรีมได้เพิ่มขึ้นในความแพร่หลายและความซับซ้อน การอภิปรายได้ขยายขอบเขตขึ้นเท่านั้น โดยมี "นักปราชญ์" แอนะล็อกมิจฉาทิฐิหลายคนประณามการสูญเสียจิตวิญญาณแห่งดนตรีที่พวกเขารู้สึกว่าขาดหายไปในรูปแบบเสียงดิจิทัลสมัยใหม่
แต่ฉันไม่ได้อยู่ที่นี่เพื่อโต้เถียงหรือเพื่อพวกเจ้าระเบียบ ให้มาสำรวจข้อกำหนดของสถานการณ์ที่เสียงดิจิทัลอาจเท่ากับหรือเหนือกว่าเสียงอะนาล็อกด้วยซ้ำไป และคำตอบสำหรับคำถามที่ว่า “เสียงดิจิทัลจะมีประสิทธิภาพเหนือกว่าอนาล็อกหรือไม่” จริงๆแล้วมีสองส่วน
เรากำลังก้าวเข้าสู่โลกแห่งคณิตศาสตร์และวิทยาศาสตร์อย่างหนัก ดังนั้นจงสวมหมวกของคุณไว้!
สัญญาณต่อเนื่องกับสัญญาณไม่ต่อเนื่อง
อันดับแรก สิ่งสำคัญคือต้องเข้าใจว่าเสียงแอนะล็อกและดิจิทัลแตกต่างกันอย่างไร
เสียงอะนาล็อก ใช้ สัญญาณเสียงที่เปลี่ยนแปลงอย่างต่อเนื่อง หมายความว่าความผันผวนของแรงดันที่ส่งไปยังลำโพงจากสัญญาณคือ (อย่างน้อยในอุดมคติ) การสร้างเสียงต้นฉบับที่แม่นยำทุกช่วงเวลา
ในทางกลับกัน เสียงดิจิตอล ประกอบด้วยขั้นตอนที่ไม่ต่อเนื่อง ในสัญญาณเสียงที่เปลี่ยนแปลงเร็วพอที่จะทำให้เกิดภาพลวงตาของสัญญาณต่อเนื่องเมื่อป้อนไปยังลำโพง สิ่งนี้คล้ายกันมากกับวิธีการสร้างวิดีโอจากชุดของภาพนิ่งที่วนผ่านเร็วพอที่จะทำให้เกิดภาพลวงตาของการเคลื่อนไหวที่ราบรื่น (ด้วยเหตุนี้วลีดั้งเดิมคือ “ภาพเคลื่อนไหว”)
ดังนั้น เสียงดิจิตอลจึงพยายามประมาณสัญญาณต่อเนื่องของเสียงแอนะล็อก หากขั้นตอนที่ไม่ต่อเนื่องของเสียงดิจิทัลเปลี่ยนแปลงบ่อยเพียงพอ และหากขั้นตอนนั้นสามารถอยู่ใกล้กันมากพอในระดับ การประมาณที่ได้จะใกล้เคียงกับสัญญาณแอนะล็อกต่อเนื่องที่หลอกหูและสมองของเราได้
ความละเอียดของสัญญาณ
ความเร็วของการหมุนเวียนของขั้นที่ไม่ต่อเนื่องในสัญญาณเสียงดิจิทัลเรียกว่าอัตราสุ่มตัวอย่าง ความแตกต่างในระดับระหว่างแต่ละขั้นตอนนั้นพิจารณาจากจำนวนขั้นตอนที่เป็นไปได้ทั้งหมด ซึ่งเรียกว่าความลึกของบิต
ตัวอย่างเช่น ไฟล์เสียงซีดีมีอัตราการสุ่มตัวอย่าง 44,100Hz (Hz ย่อมาจาก Hertz ซึ่งเป็นหน่วยวัดที่อธิบายจำนวนครั้งที่เหตุการณ์เกิดซ้ำในแต่ละวินาที หมายความว่าจะสร้างสัญญาณเสียงใหม่ 44,100 ขั้นตอนต่อวินาที) และบิต ความลึก 16 บิต (แต่ละบิตเป็นเลขฐานสอง เพื่อให้สัญญาณดิจิตอล 16 บิตมีทั้งหมด 2 ยกกำลัง 16 หรือค่าตัวเลขที่เป็นไปได้ 65,536 ระหว่างค่าต่ำสุดและสูงสุด)
การเลือกค่าสำหรับเสียงซีดีนี้ไม่ใช่เรื่องบังเอิญ ด้วยสูตรที่เรียกว่าทฤษฎีบท Nyquist อัตราสุ่มตัวอย่าง 44,100Hz นี้เป็นขั้นต่ำที่จำเป็นในการสร้างเสียงที่มีโทนเสียงที่ครอบคลุมทุกช่วงของการได้ยินของมนุษย์โดยทั่วไป และอัตราบิต 16 บิตนั้นใหญ่ที่สุดที่สามารถใช้งานได้ง่าย และยังใส่วัสดุเสียงในปริมาณที่เหมาะสมลงในคอมแพคดิสก์มาตรฐานได้อีกด้วย
คุณอาจกล่าวได้ว่าเนื่องจากสัญญาณดิจิทัลแบบไม่ต่อเนื่องเป็นเพียงการประมาณค่าของเสียงจริง ไม่ว่าสัญญาณดังกล่าวจะดีแค่ไหนก็ไม่อาจเทียบได้กับสัญญาณอนาล็อกแบบต่อเนื่องที่เกิดขึ้นจริงทั้งหมด และนั่นก็ควรเป็นจุดสิ้นสุดของการโต้แย้ง ทว่าคำถามยังคงมีอยู่ว่าสมองของมนุษย์สามารถบอกความแตกต่างได้จริงหรือไม่ โดยเฉพาะอย่างยิ่งกับเสียงดิจิตอลที่มีความละเอียดสูงกว่า
นี่เป็นคำถามสำหรับนักประสาทวิทยา ดังนั้นเพื่อจุดประสงค์ของเรา เราจะหลีกเลี่ยงการสนทนานั้นทั้งหมดและถามคำถามแทนว่า: "แหล่งสื่อแอนะล็อกสร้างสัญญาณเสียงต่อเนื่องที่แท้จริงได้จริงหรือไม่"
สื่ออนาล็อก
ลองพิจารณารูปแบบสื่อแอนะล็อกที่พบบ่อยที่สุด ซึ่งเป็นแผ่นเสียงไวนิล แผ่นเสียงไวนิลมีคุณสมบัติเฉพาะของวัสดุที่กำหนดลักษณะการทำงาน ความสามารถ และข้อจำกัดของแผ่นเสียง นอกจากนี้ เครื่องเล่นแผ่นเสียง (เครื่องเล่นแผ่นเสียง) มีคุณสมบัติวัสดุ ความสามารถและข้อจำกัดของตัวเองเช่นกัน
แผ่นเสียงไวนิลมักทำจาก PVC หรือโพลีไวนิลคลอไรด์กึ่งแข็ง สัญญาณแอนะล็อกถูกสลักลงในร่องโดยตรงในบันทึก ซึ่งจะทำให้วัสดุพีวีซีเสียรูปตามสัญญาณ มีการใช้เข็มในเครื่องเล่นแผ่นเสียงเพื่อ "อ่าน" การเสียรูปด้วยกล้องจุลทรรศน์เหล่านี้ ดังนั้นจึงสร้างสัญญาณดั้งเดิมที่สร้างขึ้นมาใหม่
วัสดุไวนิล พีวีซี มีขนาดต่ำสุดที่เกี่ยวข้องกับโครงสร้างโมเลกุลและผลึก ซึ่งหมายความว่าการเสียรูปในวัสดุภายในร่องบันทึกไม่สามารถเปลี่ยนแปลงเป็นมาตราส่วนที่ละเอียดกว่าคุณสมบัติทางกายภาพของวัสดุได้ ดังนั้น โดยพื้นฐานแล้ว มันไม่สามารถสร้างสัญญาณที่ต่อเนื่องอย่างสมบูรณ์แบบได้อย่างแท้จริง แต่เป็นการประมาณของสัญญาณนั้นที่จำกัดโดยคุณสมบัติของวัสดุไวนิลเอง
คุณไม่สามารถทำการตัดภายในร่องของเร็กคอร์ดที่เล็กกว่าขนาดโมเลกุลขั้นต่ำของวัสดุพีวีซี—ไวนิลคลอไรด์โมโนเมอร์เดี่ยว
ความละเอียดสัญญาณของแผ่นเสียงไวนิล
พีวีซีที่ใช้ทำแผ่นเสียงไวนิลมีความหนาแน่นประมาณ 1.3 กรัมต่อลูกบาศก์เซนติเมตร และไวนิลคลอไรด์โมโนเมอร์ตัวเดียว (หนึ่งโมเลกุลของคลอโรเอทีน) มีมวลประมาณ 1.07x10 -22 กรัม นั่นหมายความว่ามีโมเลกุลของคลอโรเอทีนขนาด 12.1x10 21 ตัวภายในพื้นที่พีวีซี 1 ลูกบาศก์เซนติเมตรในแผ่นเสียงไวนิล เศษเสี้ยวที่เล็กที่สุดของวัสดุนี้ที่เราสามารถตัดด้านหนึ่งออกจะเป็นหนึ่งโมเลกุลหนา ซึ่งตอนนี้เราสามารถประเมินได้ว่ามีความหนาประมาณ 4.4x10 -8 ซม.
ร่องในแผ่นเสียงไวนิลสามารถแกะสลักได้กว้างสูงสุดประมาณ .008 ซม. โดยครึ่งหนึ่งของร่องที่เกี่ยวข้องกับช่องด้านซ้ายและอีกครึ่งหนึ่งเป็นช่องด้านขวา ซึ่งหมายความว่าเข็มสามารถสัมผัสได้ถึงการเปลี่ยนแปลงตำแหน่งสูงสุดสำหรับแต่ละช่องสัญญาณสูงสุด .004 ซม.

ดังนั้นจำนวนชิ้นโมเลกุลสูงสุดที่เราสามารถโกนออกเพื่อสร้างการเปลี่ยนแปลงขนาดร่องสูงสุดสำหรับแต่ละช่องจะอยู่ที่ประมาณ 91,000 เท่านั้น เป็นไปตามหลักการเดียวกันกับความลึกบิตสำหรับสัญญาณเสียงดิจิตอล
นอกจากนี้ เนื่องจากความเร็วที่บันทึกหมุนไปบนจานหมุน เส้นผ่านศูนย์กลางของแผ่นเสียง และความกว้างของร่องแต่ละร่องที่ตัดเป็นแผ่นบันทึก จึงแสดงให้เห็นได้ว่ามีความยาวร่องทั้งหมดประมาณ 45,000 ซม. ที่สามารถแกะสลักได้ สัญญาณเข้า (ในแต่ละด้านของบันทึก) ซึ่งหากกรอกข้อมูลครบถ้วน จะถูกเล่นเป็นเวลารวมประมาณ 1,400 วินาทีด้วยความเร็วการเล่นที่ถูกต้อง
ดังนั้นเราจึงสามารถประมาณการว่าเข็มจะเคลื่อนผ่านโมเลกุลคลอโรเอธินโดยเฉลี่ยประมาณ 730 ล้านโมเลกุลทุกวินาทีระหว่างการเล่นแผ่นเสียงด้านใดด้านหนึ่งอย่างเต็มรูปแบบ ซึ่งเป็นไปตามหลักการเดียวกันกับอัตราตัวอย่างสำหรับสัญญาณเสียงดิจิตอล มันบอกเราถึงขั้นตอนที่เล็กที่สุดที่สามารถทำซ้ำได้โดยประมาณการเปลี่ยนแปลงในช่วงเวลาของสัญญาณเสียงต้นฉบับ
เปรียบเทียบความละเอียดของสัญญาณ
ดังนั้น ด้วยวิธีการประมาณค่าบางอย่าง (แบบง่ายเกินไป แต่ใช้ได้จริงในความรู้สึกของสนามเบสบอล) เราจะเห็นได้ว่าแผ่นเสียงไวนิลสร้างการประมาณที่ไม่ต่อเนื่องแบบเดียวกันกับสัญญาณเสียงต่อเนื่องเป็นสัญญาณดิจิทัลที่มีความลึกบิตอย่างน้อย 16 บิตและตัวอย่าง อัตรา 730MHz.
แต่อย่าเพิ่งตื่นเต้นไป คุณไม่สามารถเพียงแค่นำไฟล์ WAV และ MP3 ดิจิตอลทั้งหมดของคุณมาแปลงเป็นไฟล์เสียง 17 บิต 730MHz และบอกทุกคนว่าพวกเขาดีพอๆ กับไวนิล ค่าประมาณของสัญญาณเสียงต่อเนื่องที่แท้จริงของคุณ ไม่ว่าจะโดยวิธีแอนะล็อกหรือวิธีการทางดิจิทัล จะต้องคงไว้ซึ่งความละเอียดสูงสุดตลอดกระบวนการทั้งหมดเพื่อบอกว่าเป็นไปตามมาตรฐานนั้น
อุปกรณ์อนาล็อกส่วนใหญ่ทำเช่นนี้ แต่อุปกรณ์ดิจิทัลส่วนใหญ่ไม่ทำเช่นนี้ ทันทีที่คุณใช้วิธีการดิจิทัลที่น้อยกว่ามาตรฐานขั้นต่ำที่ตรงกับ LP คุณจะลดความแม่นยำของการประมาณของคุณลง การแปลงเป็นความละเอียดที่สูงขึ้นในภายหลังจะทำงานได้ดีขึ้นในการทำซ้ำการประมาณที่แม่นยำน้อยที่สุดที่ใช้ในระหว่างกระบวนการผลิตของคุณ
นอกจากนี้ ในขณะที่การบันทึกแบบดิจิทัลแบบ 24 บิตและ 32 บิตสามารถทำได้ง่ายในทุกวันนี้ ซึ่งเหนือกว่าความลึกบิตที่มีประสิทธิภาพของไวนิลอย่างมาก ความจริงก็คือแม้แต่อุปกรณ์บันทึกดิจิทัลที่ดีที่สุดที่มีให้สำหรับคนส่วนใหญ่ในปัจจุบันก็มีอัตราการสุ่มตัวอย่างสูงสุดที่ 192kHz ซึ่ง ช้ากว่าที่ควรจะเป็นเกือบ 4,000 เท่าเพื่อให้ทันกับอัตราการสุ่มตัวอย่างที่มีประสิทธิภาพของไวนิล
ดังนั้น คำตอบสำหรับส่วนแรกของคำถามของเรา เกี่ยวกับการเปรียบเทียบทางเทคนิคระหว่างเสียงแอนะล็อกกับเสียงดิจิทัล คือ ใช่ เสียงดิจิทัลในทางทฤษฎี อาจ ทำได้ดีกว่าเสียงแอนะล็อก ศักยภาพทางเทคนิคของเสียงดิจิตอลสมัยใหม่นั้นเหนือกว่าเสียงแอนะล็อกในแง่ของความลึกบิต แต่ขาดแอนะล็อกอย่างมากในแง่ของอัตราการสุ่มตัวอย่าง (ปัจจุบัน)
รสชาติแบบอะนาล็อกในห่วงโซ่การผลิต
ส่วนที่สองของคำถามเกี่ยวกับเสียงของผลิตภัณฑ์ในขั้นสุดท้ายเป็นอย่างไร กล่าวอีกนัยหนึ่ง ในบางจุดในอนาคต เทคโนโลยีนี้ช่วยให้เสียงดิจิตอลบรรลุ 730MHz หรืออัตราการสุ่มตัวอย่างที่ดีกว่าที่เราคำนวณ ซึ่งจำเป็นเพื่อให้ตรงกับอัตราการสุ่มตัวอย่างที่มีประสิทธิภาพของไวนิล ในขณะนั้น โดยที่เสียงดิจิตอลมีศักยภาพทางเทคนิคที่จะตอบสนองหรือเกินศักยภาพทางเทคนิคของเสียงอนาล็อก เสียงดิจิตอลจะดีหรือดีกว่าอนาล็อก?
เพื่อตอบคำถามนี้ สิ่งสำคัญคือต้องตระหนักว่าสิ่งที่คนส่วนใหญ่ชอบในเสียงที่มาจากแผ่นเสียงนั้นเกิดจากอุปกรณ์การผลิตแบบแอนะล็อกที่ใช้ในการบันทึกและมิกซ์เสียง และ กลิ่นรสเฉพาะของเสียง
การสร้างแบบจำลองดิจิทัลกลายเป็นสิ่งที่ดีมากในช่วงไม่กี่ปีที่ผ่านมา และมีแนวโน้มว่าสามารถจับคู่เสียงแอนะล็อกคลาสสิกหลายๆ แบบที่ผู้คนชื่นชอบได้ แน่นอนว่าเทคโนโลยีจะต้องให้ความละเอียดเสียงสูงสุดเท่ากันตลอดกระบวนการทั้งหมดเช่นกัน
แต่ดูเหมือนว่าปลอดภัยที่จะพูดอย่างนั้น—สมมติว่าในที่สุดเสียงดิจิทัลจะมีศักยภาพทางเทคนิคที่เหมือนกันสำหรับการสร้างเสียงเหมือนวิธีการแบบแอนะล็อกในปัจจุบัน และคงความละเอียดนั้นไว้ตลอดกระบวนการผลิตทั้งหมด และใช้เกียร์แอนะล็อกหรือแบบจำลองดิจิทัลของเกียร์แอนะล็อก ในกระบวนการปรับแต่งเสียงที่ต้องการ—เสียง ดิจิตอลควรสามารถตอบสนองหรือเหนือกว่าประสิทธิภาพของเสียงแอนะล็อกทั้งในด้านคุณภาพทางเทคนิคและการกำหนดลักษณะเสียง
การปฏิบัติจริง
สิ้นสุดการสนทนา? มาดูการพิจารณาขั้นสุดท้ายกัน
ลองนึกภาพว่ากระบวนการทั้งหมดทำในรูปแบบดิจิทัลที่หรือสูงกว่ามาตรฐานทางเทคนิคที่ตรงกับแอนะล็อกและใช้เอฟเฟกต์การสร้างแบบจำลองแอนะล็อกที่มาตรฐานนั้น หากเราผลิตไฟล์เสียง WAV แบบ raw คุณภาพสมบูรณ์ของการบันทึกสามนาที ขนาดของไฟล์ดิจิทัลที่ระดับนั้นจะใหญ่เกือบ 18,000 เท่าของไฟล์ WAV คุณภาพเสียงแบบซีดีที่มีความยาวเท่ากัน ขนาดมากกว่า 500Gb สำหรับเพลงสั้นเพลงเดียว
ด้วยปัญหาเรื่องขนาดไฟล์ที่ใหญ่โตนี้ ตลอดจนข้อเท็จจริงที่ว่าอัตราการสุ่มตัวอย่างแบบดิจิทัลในปัจจุบันไม่เป็นไปตามข้อกำหนดมาตรฐานของเสียงแอนะล็อก ดูเหมือนชัดเจนว่าไวนิลยังคงเป็นทางเลือกที่ดี
อย่างไรก็ตาม ด้วยระบบการเล่นดิจิตอลที่แพร่หลาย ความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยีเสียงดิจิตอล และตัวเลือกในการดูแลสื่อในสภาพแวดล้อมเสมือนจริงที่ไม่ต้องการการจัดเก็บแผ่นเสียงไวนิลขนาดใหญ่และอุปกรณ์พิเศษในการเล่นกลับ เป็นไปได้เพียงเท่านั้น ถึงเวลาที่เสียงดิจิตอลจะเหนือกว่าเสียงอนาล็อกอย่างแจ่มแจ้ง
สร้างเว็บไซต์เพลงของคุณเองที่พร้อมสำหรับมือถือและอัปเดตได้ง่ายทุกเวลา! สร้างเว็บไซต์ด้วย Bandzoogle ตอนนี้
---
Erik Veach เป็นเจ้าของและหัวหน้าวิศวกรเสียงที่ Crazy Daisy Productions โดยให้บริการมิกซ์ มาสเตอร์ และตัดต่อเสียงมาตั้งแต่ปี 2544 เขาเป็นผู้บุกเบิกระบบมาสเตอร์ริ่งอัจฉริยะแบบอัตโนมัติ โดยเริ่มแรกแนะนำระบบนี้เพื่อใช้ในการผลิตเพลงระดับมืออาชีพในปี 2546