
한국전자통신연구원(ETRI)이 개발한 소리의 ‘음원 위치 지연기술’이 국제표준화기구 MPEG의 몰입형 오디오 국제표준 ‘MPEG-I 몰입형 오디오(immersive audio)’ 표준 최종안에 공식 반영됐다.
이번 성과는 실감형 오디오 분야에서 우리나라가 국제표준을 선도하는 중요한 이정표가 될 전망이다.
이 기술은 전투기처럼 빠르게 이동하거나 천둥 번개처럼 먼 거리에서 발생한 소리가 실제로 보이는 위치보다 약간 지연돼 들리는 현상을 실제와 같이 정밀하게 구현하는 게 핵심이다.
현실 세계에서 소리의 발생시점과 청취시점 간 시간차가 자연스럽게 인지되지만, 가상 오디오 기술에서는 청각적 시간지연 요소가 반영되지 않아 현실감 및 몰입감이 떨어진다.
이번에 개발한 기술은 이 같은 한계를 극복하고 가상환경에서 시간 기반 청각 지각 요소를 구현해 더욱 자연스럽고 현실감 있는 3차원 오디오 경험을 제공한다.
연구진이 개발한 MPEG-I 몰입형 오디오는 청취자의 자유로운 이동과 인터랙션이 가능한 6DoF 공간음향 서비스를 위한 몰입형 실감음향 렌더링 기술과 렌더링에 필요한 메타데이터 부호화 표준화를 목표로 하는 MPEG 오디오 기술 표준화로 구성된다.
음원 위치 지연기술은 원거리에서 빠르게 이동하는 음원의 위치 지연효과를 보상, 시간 기반 청각 요소를 더해 몰입감을 획기적으로 향상시킬 수 있다.
이는 VR, 훈련, 교육 등과 같이 정밀한 현실 시뮬레이션이 요구되는 분야에 핵심적인 요소로 활용할 수 있을 전망이다.
이 기술은 향후 사용자 시점 변화에 따라 3차원 공간상 오디오가 실시간 반응하는 차세대 오디오 기술로, 몰입형 가상현실(VR), 메타버스, 가상회의, 원격교육, 게임, 실감 공연 등 다양한 산업에서 폭넓게 적용할 수 있어 차세대 오디오 시장을 선도할 것으로 기대된다.
ETRI는 이번 기술을 바탕으로 초실감 입체공간 미디어 기술 선도를 위해 동적 입체공간 미디어 획득·생성 및 실시간 콘텐츠 상호작용 기술 개발과 저지연·고품질 동시지원 음향 압축 및 국제표준화에 힘쓸 예정이다.
아울러 초실감 양방향 입체 통신의 구현을 위해 실시간 공간 콘텐츠 생성기술, 공간 상호작용 핵심기술 개발 및 실증(PoC)에 매진할 계획이다.
강정원 ETRI 미디어부호화연구실장은 “이번 성과는 국제표준 수립의 핵심 구성요소로 우리 기술이 인정받은 것”이라며 “실감미디어 분야에서 세계를 선도할 수 있는 오디오기술 확보와 국제표준화 활동을 지속하겠다”고 말했다.
이태진 ETRI 미디어연구본부장도 “그동안 몰입형 오디오 표준은 주로 소리의 방향성과 거리표현 등 공간적 요소에 집중됐지만, 실제 청각 인식에서 중요한 시간 기반 지각 요소는 표준화 논의에서 간과됐었다”며 “이번 기술 반영은 단순한 기능 추가가 아닌 국제표준 수립의 핵심 요소로 인정받은 성과”라고 밝혔다.
