아날로그인 소리를 담아내고 저장을 할 때 우리는 이것을 디지털로 변환을 하게 됩니다. 이때 만나게 되는 샘플 레이트와 비트 뎁스란 도대체 무엇인지 알아보도록 하겠습니다.
샘플 레이트
디지털 사진에서 화소(픽셀)가 높을수록 화질이 선명해지듯이 디지털 음원에서는 샘플레이트가 높을수록 더욱 촘촘하고 선명하게 소리를 저장할 수 있습니다. 즉 샘플 레이트라고 하는 표기는 1초 동안에 재생이 되는 소리를 몇 개의 샘플로 나누었는가를 나타내는 것입니다.
샘플링 레이트가 높을수록 기록되는 샘플의 양이 많기 때문에 더 실제와 가까운, 더 자연스러운 소리를 저장할 수 있으며 대신 저장 공간을 더 많이 필요로 하게 됩니다.
그렇다면 이제 소리를 얼마만큼의 샘플 레이트로 기록을 할 것인가가 문제입니다.
사람이 들을 수 있는 소리의 주파수가 있습니다. 이를 가청 주파수라고 합니다. 가청 주파수는 20~20000Hz(헤르츠)라고 합니다. 다시 말해 사람은 일반적으로 20Hz 이하의 소리와 20KHz 이상의 소리를 듣지 못하는 것입니다.
그렇다면 샘플 레이트를 20KHz 이하로 맞추는게 정답일까요?
나이키스트 정리라고 하는 법칙에 답이 있습니다.
간단히 표현하면 본래의 소리를 왜곡 없이 그대로 재현하려면 샘플링을 그 2배로 해야 한다는 것입니다.
이렇게 해서 20KHz의 소리를 그대로 재연하기 위해서는 40KHz의 샘플링이 필요하다는 것을 알 수 있습니다.
인간은 들을 수 없다지만 40KHz 이상의 소리는 어떻게 해야 할까요?
그대로 둔다면 변환 과정에서 노이즈로 남을 가능성이 있기에 로우패스 필터(Low-pass filter)로 걸러줍니다.
로우패스 필터를 다른 말로 하면 하이컷 필터라고도 하는데요. 즉 40KHz 이상의 소리는 커트해 준다는 말입니다.
하지만 이 필터는 40KHz 이상의 소리를 칼로 자르듯 직각으로 반듯하게 제거하지는 못하고 완만한 곡선으로 소리를 커트해 내게 됩니다.
그래서 정확한 40KHz가 아닌 그 위로 조금 여유를 두게 됩니다. 그래서 CD는 44.1KHz의 샘플 레이트로 소리를 저장하게 됩니다.
CD는 700MB라는 용량의 한계를 가지고 있기에 그에 맞게 44.1KHz, 16bit의 규격을 가지게 됩니다. 하지만 이 CD가 나온 지도 어느덧 수십 년의 시간이 지났습니다. 이제 디지털 음원은 48KHz를 넘어서 96, 192KHz 이상의 샘플 레이트로 기록되고 있습니다. 비록 인간의 가청 주파수가 20KHz 이하라고 하더라도 더 높은 샘플 레이트로 기록을 하면 고음역대의 정보가 손실되는 왜곡을 줄일 수 있고, 실제와 가까운 자연스럽고 선명한 소리를 얻을 수 있습니다. 대신 처리 시간이 오래 걸리고 용량이 커지는 만큼 더 많은 저장 공간이 필요하다는 단점이 있습니다.
비트 뎁스
위에 언급한 샘플 레이트가 파형의 가로축으로 촘촘하게 기록되어 해상도를 나타내게 된다면 비트 뎁스는 파형의 세로축에 촘촘하게 기록되어 음압, 음량에 영향을 줍니다. 웨이브의 파형이 세로축으로 커질수록 음량이 커지는데 그 크기 안에서 데이터를 얼마만큼 빼곡하게 채우는지에 따라 더 정확하고 높은 해상도를 표현할 수 있고 음의 다이내믹 레인지가 증가합니다. 위에 언급했듯 CD는 16bit의 규격인데 이는 2의 16 제곱, 즉 65,536 단계로 채워져서 음량을 기록했다고 하겠습니다.
마무리
이상으로 샘플 레이트와 비트 뎁스에 대해 알아보았습니다.
자연의 소리를 디지털로 변환 저장을 할 때 꼭 거쳐야 할 개념이 바로 이 샘플 레이트와 비트 뎁스입니다.
지금까지 그저 습관적으로 설정해서 기록하고 있다고 해도 한 번쯤 정리를 해보는 것도 나쁘지 않다 생각이 듭니다.
아날로그인 소리를 담아내고 저장을 할 때 우리는 이것을 디지털로 변환을 하게 됩니다. 이때 만나게 되는 샘플 레이트와 비트 뎁스란 도대체 무엇인지 알아보도록 하겠습니다.
샘플 레이트
디지털 사진에서 화소(픽셀)가 높을수록 화질이 선명해지듯이 디지털 음원에서는 샘플레이트가 높을수록 더욱 촘촘하고 선명하게 소리를 저장할 수 있습니다. 즉 샘플 레이트라고 하는 표기는 1초 동안에 재생이 되는 소리를 몇 개의 샘플로 나누었는가를 나타내는 것입니다.
샘플링 레이트가 높을수록 기록되는 샘플의 양이 많기 때문에 더 실제와 가까운, 더 자연스러운 소리를 저장할 수 있으며 대신 저장 공간을 더 많이 필요로 하게 됩니다.
그렇다면 이제 소리를 얼마만큼의 샘플 레이트로 기록을 할 것인가가 문제입니다.
사람이 들을 수 있는 소리의 주파수가 있습니다. 이를 가청 주파수라고 합니다. 가청 주파수는 20~20000Hz(헤르츠)라고 합니다. 다시 말해 사람은 일반적으로 20Hz 이하의 소리와 20KHz 이상의 소리를 듣지 못하는 것입니다.
그렇다면 샘플 레이트를 20KHz 이하로 맞추는게 정답일까요?
나이키스트 정리라고 하는 법칙에 답이 있습니다.
간단히 표현하면 본래의 소리를 왜곡 없이 그대로 재현하려면 샘플링을 그 2배로 해야 한다는 것입니다.
이렇게 해서 20KHz의 소리를 그대로 재연하기 위해서는 40KHz의 샘플링이 필요하다는 것을 알 수 있습니다.
인간은 들을 수 없다지만 40KHz 이상의 소리는 어떻게 해야 할까요?
그대로 둔다면 변환 과정에서 노이즈로 남을 가능성이 있기에 로우패스 필터(Low-pass filter)로 걸러줍니다.
로우패스 필터를 다른 말로 하면 하이컷 필터라고도 하는데요. 즉 40KHz 이상의 소리는 커트해 준다는 말입니다.
하지만 이 필터는 40KHz 이상의 소리를 칼로 자르듯 직각으로 반듯하게 제거하지는 못하고 완만한 곡선으로 소리를 커트해 내게 됩니다.
그래서 정확한 40KHz가 아닌 그 위로 조금 여유를 두게 됩니다. 그래서 CD는 44.1KHz의 샘플 레이트로 소리를 저장하게 됩니다.
CD는 700MB라는 용량의 한계를 가지고 있기에 그에 맞게 44.1KHz, 16bit의 규격을 가지게 됩니다. 하지만 이 CD가 나온 지도 어느덧 수십 년의 시간이 지났습니다. 이제 디지털 음원은 48KHz를 넘어서 96, 192KHz 이상의 샘플 레이트로 기록되고 있습니다. 비록 인간의 가청 주파수가 20KHz 이하라고 하더라도 더 높은 샘플 레이트로 기록을 하면 고음역대의 정보가 손실되는 왜곡을 줄일 수 있고, 실제와 가까운 자연스럽고 선명한 소리를 얻을 수 있습니다. 대신 처리 시간이 오래 걸리고 용량이 커지는 만큼 더 많은 저장 공간이 필요하다는 단점이 있습니다.
비트 뎁스
위에 언급한 샘플 레이트가 파형의 가로축으로 촘촘하게 기록되어 해상도를 나타내게 된다면 비트 뎁스는 파형의 세로축에 촘촘하게 기록되어 음압, 음량에 영향을 줍니다. 웨이브의 파형이 세로축으로 커질수록 음량이 커지는데 그 크기 안에서 데이터를 얼마만큼 빼곡하게 채우는지에 따라 더 정확하고 높은 해상도를 표현할 수 있고 음의 다이내믹 레인지가 증가합니다. 위에 언급했듯 CD는 16bit의 규격인데 이는 2의 16 제곱, 즉 65,536 단계로 채워져서 음량을 기록했다고 하겠습니다.
마무리
이상으로 샘플 레이트와 비트 뎁스에 대해 알아보았습니다.
자연의 소리를 디지털로 변환 저장을 할 때 꼭 거쳐야 할 개념이 바로 이 샘플 레이트와 비트 뎁스입니다.
지금까지 그저 습관적으로 설정해서 기록하고 있다고 해도 한 번쯤 정리를 해보는 것도 나쁘지 않다 생각이 듭니다.