넷마블이 업계 최초로 개발한 '다중작업 방식 음성 기반 얼굴 애니메이션' 기술.(제공=넷마블)

[뉴시안=조현선 기자] 넷마블이 업계 최초로 음성에 맞춰 더욱 자연스러운 얼굴 애니메이션을 자동으로 생성할 수 있는 '다중작업 방식 음성 기반 얼굴 애니메이션'(MTADFA) 기술을 개발했다. 

넷마블은 최근 미국 LA에서 열린 ‘시그라프2019’에서 MTADFA(Multi-Task Audio-Driven Facial Animation) 기술이 담긴 논문을 발표했다고 5일 밝혔다. 시그라프2019는 컴퓨터 그래픽 분야 세계 최고 권위를 가진 행사다.

MTADFA는 넷마블이 자체 개발한 딥 뉴럴 네트워크인 멀타넷(MulTaNet: Multi-Task Deep neural Networks)을 활용한다. 14명의 서로 다른 캐릭터의 음성과 얼굴 애니메이션을 동시 학습해 더 많은 캐릭터의 얼굴 애니메이션을 확장 생성할 수 있는 것이 특징이다. 

개별 캐릭터를 따로 학습시켜야만 하는 기존 방식은 인공지능에 충분한 데이터를 제공하지 못해 최종 생성된 애니메이션에서 떨림 현상이 발생해왔다. 또 새로운 언어에 대한 동기화가 맞지 않는 등의 문제점도 발견됐다.

논문을 발표한 안수남 넷마블 AI센터 팀장은 “이를 해결하고 진화시키는데 초점을 맞췄다”고 설명했다.

인공지능이 자동으로 얼굴 애니메이션을 생성하려면 먼저 음성과 애니메이션이 짝지어진 예시를 보며 학습하는 과정이 필요하다. 이 과정에서 넷마블이 자체 개발한 MTADFA 활용시 인공 지능이 더욱 다양한 예시를 학습할 수 있게 돼 더욱 자연스럽고 안정적으로 애니메이션을 생성할 수 있게 된다는 설명이다.

특히 새로운 언어 음성 입력시에도 입술 움직임을 동기화하는 능력이 우수해 다국어 지원 게임 개발 시에도 활용도가 높을 것으로 기대된다. 

이를 이용해 이용자에게 더 높은 생동감과 몰입감을 제공하는 모바일 게임을 개발할 수 있을 것으로 보고 있다. 애니메이션 등 많은 시간을 소요하는 아트 제작 과정도 자동화해 개발 효율성이 더욱 향상될 전망이다.

넷마블은 향후 자사의 게임 등을 통해 이 기술을 우선 적용해 나갈 계획이다.

키워드

저작권자 © 뉴시안 무단전재 및 재배포 금지