지금까지 영상분야에서 발표된 인공지능 기술을 보면, 유명인을 성대모사하는 기술이나 유명인의 얼굴과 목소리를 사용해 가짜 뉴스를 만드는 기술, 영상에 연예인의 얼굴을 합성하는 기술 정도가 있습니다.
워싱턴 대학교에서 개발한 합성 기술은 오바마 대통령의 영상을 보고 이거 좀 무섭다..라고 생각했었는데, 1년 후 스탠포드 대학에서는 더욱 정교한 영상합성 기술을 발표해 충격을 더했습니다.
▲ 워싱턴 대학교가 개발한 영상합성 기술
▲ 스탠포드 대학교에서 개발한 기술
지난해에는 우리나라 개발자가 문재인 대통령, 손석희 아나운서의 목소리를 성대모사하는 인공지능을 개발해 화제가 되기도 했습니다.
하지만 오늘 소개해 드릴 기술은 이와는 조금 다른 방식의 영상합성 기술입니다. UC Berkely 대학 연구원들이 개발한 이 기술은 피사체의 움직임을 복사한 다음 완전히 다른 사람이 피사체의 동작을 따라하는 비디오를 생성해주는 인공지능 기술입니다.
Everybody Dance Now라는 제목으로 발표된 이 논문은 기존 기술보다 훨씬 많은 움직임을 '위조'하는 기술입니다. 제목처럼 유명 가수의 댄스동작까지 합성해주는 수준인데요.
공개된 영상을 보면 브루노 마스나 전문 댄서의 동작을 연구원들이 따라서 춤추는 합성영상을 확인할 수 있습니다.
이를 위해서는 피사체의 움직임을 간단한 스틱 그림으로 표현하는데, 이를 통해 합성할 사람의 몸을 춤추게하는 데 필요한 동작의 변화를 계산한 후 이 데이터를 사용해 새로운 프레임을 생성하는 방식입니다.
물론 합성된 영상을 보면 품질이 썩 좋다라고는 평가할 수 없지만, 이 또한 시간이 지나면 점차 해결될 문제로 보여집니다.
이 기술이 완성된다면 정말 우리가 영화에서 보는 것처럼 CCTV 영상을 조작하는 일도 누구나 쉽게 할 수 있는 시대가 올 것 같은데요. 그런 분야보다는 사람들을 영화나 뮤직비디오의 주인공으로 합성해주는 서비스 등에서 많이 활용되는 날이 오면 좋겠습니다.