ĐỊNH DẠNG ÂM THANH

Có bao giờ khi bạn vào property -> Detail của một file nhạc (mp3, wav,…) bạn thấy các thông số về Bit Rate, Sample Rate hay những con số 44100 Hz hay 16 bit, 32 bit chưa? Những con số đó có liên hệ như thế nào? Hay các chuẩn âm thanh cho CD, VCD hay DVD như thế nào? Hôm nay, các bạn hãy cùng ADAM Muzic tìm hiểu về ý nghĩa các con số này để chúng ta có thể phân biệt cũng như chọn cho mình những chuẩn âm thanh phù hợp nhé.

Trước tiên chúng ta sẽ tìm hiểu quá trình thu âm một nhạc cụ mộc hay một giọng hát như thế nào nhé.

Giọng hát của bạn được xem như một tín hiệu analog, bạn phát ra âm thanh, âm thanh đó đi vào soundcard, được soundcard xử lý và truyền tín hiệu digital vào máy tính dưới dạng sóng. Nhưng có khi bạn cũng nhận ra rằng, có vài lúc bạn nghe lại tiếng hát của bạn trong máy tính thì ít nhiều khác so với giọng thật của bạn…Lý do vì đâu? Đấy chính là mục đích của bài viết hôm nay.

Trước khi giải thích phần trên, chúng ta cần nắm rõ một số các thông số của âm thanh như sau.

  1. TẦN SỐ ÂM THANH (f)

Tần số là gì? Tần số là số lần lặp lại một hiện tượng trên một đơn vị thời gian. Tần số âm thanh là số lần lặp lại của các bước sóng âm thanh trong một giây. Bạn gảy dây đàn, dây đàn rung lên 100 lần/giây, thì bạn gọi tần số của âm thanh đó là f = 100Hz.

Mỗi nốt nhạc có một tần số khác nhau, ví dụ nốt Đô (C) là 262 Hz, nốt Rê (D) là 294Hz, nốt Mi (E) là 330Hz. Âm trầm có tần số thấp hơn âm cao. Tai người nghe được tần số trong khoảng từ 20Hz đến 20KHz, âm thanh trên 20KHz người ta gọi là siêu âm.

  1. SAMPLE RATE

Sample Rate là số sample (mẫu) trong một khoảng thời gian nhất định (thường là 1 giây) của âm thanh kỹ thuật số, nó quyết định đến chất lượng âm thanh có chân thật hay không, đơn vị của sample rate là Hz.

Khi bạn hát vào micro để truyền vào soundcard, thì soundcard sẽ hoạt động bằng cách lấy một số mẫu trên tín hiệu âm thanh đầu vào do bạn hát ra mã hóa và đưa vào máy tính để máy tính ghi lại dưới định dạng digital và số lượng mẫu mà soundcard lấy đó được gọi là sample rate. Như vậy Sample Rate càng cao thì chất lượng âm thanh càng tốt bởi vì số lượng mẫu nhiều hơn nên máy tính có nhiều “gợi ý”  để mã hóa âm thanh của bạn tốt hơn.

Một ví dụ nhỏ. Bạn phát ra âm thanh X có 1000 chu kỳ/giây, hay nói cách khác là có tần số 1000Hz vào soundcard, bạn set soundcard chế độ sample rate là 44100 Hz thì sẽ có 44100 mẫu/giây cung cấp cho máy tính để “phát họa” lại giọng hát của bạn, nghĩa là trong mỗi chu kỳ sẽ có 44,1 mẫu. Vậy nếu bạn phát ra âm thanh Y có f=2000Hz thì sao? cũng như trên nếu bạn set Sample rate là 44100 Hz thì cũng sẽ có tổng cộng 44100 mẫu được lấy ra trên file âm thanh đó, nhưng vì có tới 2000 chu kỳ như vậy mỗi chu kỳ của âm thanh Y sẽ chỉ có 22,05 mẫu được lấy ra để cung cấp cho máy tính, với số lượng mẫu ít như thế này thì khi nghe lại âm thanh Y trên máy tính sẽ “ẹ” hơn âm thanh X lúc đầu. Hiện nay, Sample Rate chuẩn là 44100 Hz.

  1. BIT DEPTH

Bit Depth là một dạng mức (level) biểu diễn chất lượng của một sample (mẫu). Bit depth càng lớn thì mẫu được lấy ở trên càng đúng, do đó âm thanh phát ra càng chất lượng. Các bản nhạc hiện nay thường có chuẩn Bit Depth là 16bit, 24bit,…

Vậy câu hỏi đặt ra là: tại sao âm thanh dạng Sample Rate = 44100Hz lại là chuẩn? Như ví dụ ở trên, thì nếu Sample Rate = 44100Hz thì khi tần số phát ra càng cao thì số mẫu sẽ lấy càng ít và như vậy âm thanh sẽ càng kém?

Trả lời: Từ xa xưa, khi chưa có công nghệ hiện đại, khả năng bấy giờ chỉ lấy mẫu với sample rate là 10KHz, sau đó công nghệ ngày càng phát triển đến hôm nay đã phát triển lên 44100Hz hoặc có khi 48000Hz. Sở dĩ  người ta nói chuẩn âm thanh hiện nay có Sample Rate là 44100Hz là bởi vì các con chip đọc trên các thiết bị hiện nay đều có thể đọc tốt được với mức sample rate đó. Trong một số trường hợp ngoại lệ thì âm thanh có thể lên đến 48000Hz thường thấy ở các chuẩn DVD, nhưng chuẩn này chỉ được đọc tốt trên các con chip tích hợp trên đầu DVD, nếu các đầu VCD đọc được thì nó cũng sẽ bị nhão và rất dở bởi vì con chip VCD đó lại phải lấy mẫu để cho đúng Sample rate của nó nên âm thanh sẽ không tốt như khi bạn dùng đầu DVD. Việc này cũng giống như hiện nay USB chủ yếu là cổng 2.0 và sử dụng được cho tất cả máy tính, còn USB 3.0 thì chỉ dùng tốt nhất trên các máy tính đời mới có cổng 3.0 mà thôi, còn khi cắm vào máy 2.0 thì nó sẽ không đạt tốc độ cao như 3.0 được …Dễ hiểu nhỉ 😀

  1. BIT QUANTIZATION

Quantize là quá trình làm tròn các mẫu lấy được khi đưa vào máy tính. Giả sử bạn có 0.99 VND trong túi,  thì bạn sẽ làm tròn 1 VND. Cũng y như vậy nhưng áp dụng cho các mẫu trong một tín hiệu âm thanh và quá trình làm tròn (Quantize) này phụ thuộc vào chỉ số Bit Depth bên trên, Bit Depth càng lớn thì mức độ “làm tròn” càng ít và dẫn đến tín hiệu càng chân thật. Khi đưa vào máy tính, tín hiệu sẽ được mã hóa thành hai số 0 và 1, và khi Bit Depth càng lớn thì số trường hợp xảy ra của 0 và 1 sẽ càng cao và càng gần với mức độ làm tròn.

Hơi khó hiểu quá nhỉ. Đừng lo! Bạn sẽ hiểu ngay thôi sau ví dụ sau đây:

Bit là một loại thông tin mà nó chỉ bao gồm 0 và 1 để giúp cho máy tính hiểu. Giả sử âm thanh đầu vào của bạn có Bit Depth là 1 Bit tương đương với 0 và 1, theo đó số trường hợp xảy ra là 0 và 1 (xem hình vẽ).

Vì chỉ có 2 “gợi ý” là 1 và 0 (Yes hoặc No) cho nên mẫu nào gần với gợi ý nào hơn sẽ được “làm tròn” sang bên đó. Và điều gì xảy ra? Sóng âm thanh sau khi xử lý sẽ rất “méo mó” so với hình dạng ban đầu, dẫn đến âm thanh phát ra không chân thật và sống động.

Bây giờ chúng ta sẽ thêm 1 bit nữa là 2 bit, lúc này ta sẽ được quyền dùng 2 con số cùng lúc. Như vậy chúng ta 4 gợi ý là 00 01 10 11, chúng ta cùng phát họa tiếp nhé.

Chúng ta thấy rằng, ở trường hợp 2 bit, tín hiệu làm tròn sẽ có hình dạng giống hơn so với khi 1 bit. Cứ như vậy, âm thanh ở định dạng 16bit sẽ có 216 =  65.536 gợi ý để sắp xếp các mẫu, do đó mức độ chính xác sẽ rất cao và âm thanh sẽ rất chân thật.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *