엔씨소프트, 음성합성 기술 ‘VocGAN’, 국제학회 논문 발표
엔씨소프트, 음성합성 기술 ‘VocGAN’, 국제학회 논문 발표
  • 김경욱 기자
  • 승인 2020.09.23
  • 댓글 0
이 기사를 공유합니다
이 기사를 번역합니다

자체 개발한 뉴럴 보코더 기술 ‘VocGAN’을 국제학회 ‘인터스피치 2020’에서 10월 발표 예정
엔씨 AI센터 음성합성 기술이 합성음 품질 측면에서 글로벌 수준으로 평가 받아
음성합성 기술을 게임 개발, 영상 내레이션 등 다양한 영역에 활용...공식 블로그 통해 공개
엔씨소프트 음성합성 기술 ‘VocGAN’, 국제학회 논문 발표
엔씨소프트 음성합성 기술 ‘VocGAN’, 국제학회 논문 발표

엔씨소프트(대표 김택진)가 개발한 뉴럴 보코더(Neural Vocoder) 기술 ‘VocGAN’이 오는 10월 ‘인터스피치 2020(INTERSPEECH 2020)’를 통해 정식 발표된다. 인터스피치는 음성인식•합성 분야에서 세계 최고의 권위있는 국제학회다.

인터스피치에서 발표 예정인 ‘VocGAN’은 엔씨(NC) AI센터 산하 Speech AI Lab의 음성합성팀에서 자체 개발한 기술이다. 녹음 음성과 실제 음성의 구분이 어려운 수준의 완벽한 음질, 빠른 속도와 가벼운 무게가 특징이다.

엔씨(NC)는 음성합성 기술을 다양한 영역에 활용하고 있다. ▲‘블레이드 앤 소울’ 프론티어 월드 튜토리얼 영상 '안내서'의 내레이션은 모두 합성음으로 제작했다. 성우가 직접 대사를 익히고 녹음하고, 검수하는 과정이 없어지며 제작 시간이 단축됐다. ▲게임 개발 과정에도 음성합성 기술이 적용된다. 개발 단계에서 캐릭터의 대사 내용과 분량을 검수하는 등 최적화 테스트 과정에도 사용한다. ▲엔씨(NC) 사내 방송을 통해서는 AI 합성음으로 한 권의 책을 소개하는 ‘엔씨 AI 북스’를 운영하기도 했다.

엔씨(NC)는 음성 데이터 축적부터 딥러닝 모델 학습, 합성음 생성 테스트와 최종 서비스까지의 일련의 과정들을 모두 클라우드에 자동화하고 있다.

엔씨(NC) 음성합성 기술에 대한 보다 자세한 내용은 공식 블로그에서 확인할 수 있다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.