지난 18일, 감정 연기가 가능한 AI 성우 ‘프로소디’ 서비스를 공식으로 출시했다. 흥분, 즐거움, 차분함, 슬픔 등 성우가 연출하는 다양한 감정 표현을 할 수 있는 AI 성우 서비스로 성우 녹음에 필요한 비용의 20% 정도로 녹음을 끝낼 수 있다. 음성 합성을 위한 시간도 30분이면 된다. 인기 연예인이 오디오북 녹음을 30분만 하면 나머지는 프로소디가 알아서 텍스트를 읽는다는 의미다.
이 대표는 카이스트(KAIST) 전산학부에서 컴퓨터공학을 전공했다. 학부와 석사를 하며 AI와 딥러닝을 공부했고, 딥러닝 작곡 AI 기술로 2018년 4월 휴멜로를 설립했다. 휴멜로는 액셀러레이터 퓨처플레이와 SM엔터테인먼트 관계사인 CTGA로부터 각각 2억 원씩 총 4억 원을 유치했다. 이성수 SM 엔터테인먼트 공동대표는 현재 휴멜로의 사외이사로 있다.
휴멜로는 SM 소속 연예인의 목소리를 입은 콘텐츠도 개발했다. 휴멜로 홈페이지에는 그룹 엑소의 멤버 디오의 목소리로 모닝콜, 위로 음성, 생일 축하 음성이 올라와 있다.
이 대표는 “연예인 음성을 서비스할 적절한 유통사를 이미 찾았다”며 “곧 ‘연예인이 내 이름을 불러 주는 서비스’ 등 음성 굿즈 시장이 확 열릴 것”이라고 설명했다. 여기에 더해 AI로 작곡ㆍ작사를 해내는 기술도 개발하고 있다. 근는 “머지않아 AI 연예인이 부른, AI 작곡·작사한 노래가 길거리에 들릴 것”이라고 자신감을 표했다.
그는 “오디오, 비디오 시장이 커지면서 예전보다 훨씬 더 많은 음성이 필요한 상황”이라며 “성우를 포함해 매력적인 목소리를 가진 사람이라면 누구나 본인의 음성을 인공지능화해 가만히 앉아서도 돈을 벌게 될 것”이라고 말했다. 즉 누군가가 콘텐츠를 만들 때 특정 목소리를 사용하면 목소리의 주인이 수익 일부를 가져가는 형태다.
이 대표는 시각장애인, 농아를 위한 서비스도 특화할 수 있다고 밝혔다. 후천적 농아인 경우 장애를 얻기 전 목소리가 있다면 예전 목소리를 녹음해 TTS 서비스를 구현할 수 있다. 혹은 부모님의 목소리를 섞어 본인 목소리를 상상으로 만들어 낼 수도 있다.