VCM을 위한 학습기반 영상 전·후처리 필터 네트워크
Learned Pre-filter and Post-filter Network for VCM

초록

본 논문에서는 기계를 위한 영상 부호화를 위해, 머신비전 성능 대비 압축 효율을 최적화할 수 있는 학습기반의 영상 전·후처리 필터 네트워크를 제안한다. 제안된 필터 네트워크는 VCM 환경에 특화된 구조로 설계되었으며, 내부 인코딩 과정에서 발생하는 영상의머신비전 품질 저하를 최소화하면서 압축 성능을 개선하기 위한 전처리 필터와 내부 디코딩된 영상의 머신비전 품질을 개선하기 위한후처리 필터로 구성된다. 일반적으로 미분이 불가능한 상용 코덱을 대신하여, 미분이 가능하면서도 압축 왜곡을 효과적으로 모사할 수있는 모사 코덱을 활용하여 필터 네트워크를 종단간 학습할 수 있도록 학습 구조를 설계하였다. 또한 MPEG VCM 표준화의 참조 소프트웨어인 VCM-RS에 효과적으로 적용하기 위해, VTM으로 압축된 영상 및 BDT 모듈을 포함하여 파인 튜닝을 수행하였다. 학습된모델을 VCM-RS v0.11에 적용한 결과, 전·후처리 필터 각각 17%, 13%의 BD-rate 성능 개선을 확인하였다.

키워드

Video Coding for MachinesMachine VisionsMPEGFilter Network
제목
VCM을 위한 학습기반 영상 전·후처리 필터 네트워크
제목 (타언어)
Learned Pre-filter and Post-filter Network for VCM
저자
곽상운정성문고종환정순흥추현곤
DOI
10.5909/JBE.2025.30.6.942
발행일
2025-11
유형
Y
저널명
방송공학회 논문지
30
6
페이지
942 ~ 951