포스텍 전자전기공학과 이재호 교수 연구실 통합과정 옥현종 학생이 2025 한국인공지능학회 하계학술대회에서
“Do Video Models Really Know Where to Look? Diagnosing Attention Failures in Video Language Models” 논문을 발표하여 “우수논문상”을 수상했다.
본 논문은 동영상을 이해할 수 있는 언어모델을 만들기 위해서 흔히 사용되는 시각언어모델(CLIP)이 사실 동영상 내에서 질문과 의미있는 상관관계를 갖는 프레임을 거의 찾지 못한다는 점을 최초로 발견하고, 이를 해결할 수 있는 기술들을 제안하였다.
2025.9