"Hume, 나만의 AI 목소리를 만드는 혁신적인 음성 제어 기능 출시!"


News Image
제목 "Hume, 사용자와 개발자가 맞춤형 AI 음성을 만들 수 있는 음성 제어 기능 출시"는 VentureBeat에서 Hume AI의 새로운 기능인 음성 제어의 도입을 다루고 있습니다. 이 기능은 그들의 공감 음성 인터페이스(Empathic Voice Interface, EVI)의 일환입니다.

주요 내용은 다음과 같습니다:

- 음성 제어 기능 : Hume AI는 음성 제어를 출시했습니다. 이는 사용자와 개발자가 맞춤형 AI 음성을 정밀하게 제어할 수 있는 새로운 방법입니다. 이 기능은 음성 복제와 관련된 위험을 피합니다.

- 커스터마이징 옵션 : 음성 제어 도구는 성별, 단호함, 경쾌함, 자신감, 열정, 비음, 편안함, 부드러움, 미지근함, 긴장감 등 10가지 음성 차원을 조정할 수 있게 해줍니다. 이러한 속성은 연속적으로 조정 가능하여 실시간으로 수정할 수 있으며, 세션 간 재현성을 보장합니다.

- 사용자 인터페이스 : 맞춤형 음성을 만드는 과정은 간단합니다. 기본 음성을 선택하고 직관적인 슬라이더를 사용하여 음성 속성을 조정한 후, 실시간으로 변경 사항을 미리 볼 수 있으며, EVI 설정을 통해 맞춤형 음성을 배포합니다.

- 기술적 성취 : Hume AI는 하나의 음성 특성을 수정해도 다른 특성에 중요한 영향을 미치지 않도록 보장하는 비지도 학습 접근 방식을 개발했습니다. 이는 실제 화자의 음성 속성이 높은 상관관계를 가지기 때문에 도전적입니다.

- 미래 개발 계획 : Hume AI는 기본 음성의 범위를 확장하고, 추가적인 해석 가능한 차원을 도입하며, 극단적인 수정에서도 음성 특성을 잘 유지할 수 있도록 개선하고, 음성 특성을 분석하고 시각화하는 고급 도구를 개발하고 있습니다.

- 적용 및 이점 : 이 기능은 개발자가 애플리케이션을 위해 독특한 음성을 만들 수 있도록 설계되었으며, 품질을 저하시킬 걱정을 하지 않아도 됩니다. 이는 기존의 음성을 사용하거나 위험한 음성 복제 방법을 사용하는 문제를 해결합니다. 음성 제어를 포함한 EVI 2 모델은 감정 지능, 빠른 대화 및 사용자 선호도에 적응하는 데 뛰어납니다.

전반적으로 Hume AI의 음성 제어 기능은 AI 음성을 맞춤화하는 강력하고 유연한 방법을 제공하며, 그들의 공감 음성 인터페이스의 능력을 향상시킵니다.