Hume, 다양한 감정을 담은 맞춤형 AI 음성 생성 모델 'Octave' 출시!
"Hume가 감정 조절이 가능한 맞춤형 AI 음성을 생성하는 새로운 음성 합성 모델 Octave를 출시했다"는 제목의 VentureBeat 기사는 Hume AI가 새 모델 OCTAVE를 통해 선보인 AI 음성 기술의 최신 발전에 대해 다룹니다.
다음은 이 기사의 핵심 내용입니다.
OCTAVE 기능
- OCTAVE는 감정, 개성, 말하는 스타일을 조절할 수 있는 다양한 맞춤형 AI 음성을 생성할 수 있는 음성 합성 모델입니다. 이는 고급 음성 언어 모델과 감정 및 음성 복제 기능을 결합한 것입니다.
음성 생성 및 복제
- OCTAVE는 사용자들이 간단한 텍스트 프롬프트를 통해 음성을 생성할 수 있게 해 주며, 복잡한 매개변수 조정이나 extensive 음성 녹음이 필요하지 않습니다. 예를 들어, 사용자는 "거친 목소리" 또는 "부드럽고 공감하는 치료사 목소리"와 같은 특정한 특징을 요청할 수 있습니다.
감정 표현
- 이 모델은 분노, 흥분, 슬픔, 차분함, 짜증, 자부심 등 다양한 감정의 목소리를 생성할 수 있습니다. 미세한 목소리 변화를 포착하여 자연스러운 상호작용을 증진시키고 복잡한 감정을 맥락에 맞게 표현합니다.
동적 개성 조절
- OCTAVE는 대화 중에 다양한 캐릭터로 매끄럽게 전환할 수 있어 유창하고 흥미로운 대화를 유지합니다. 이는 참여형 스토리텔링, 여러 캐릭터가 등장하는 전자책 내레이션, 사용자 상호작용에 따라 개성을 조정하는 가상 비서 등에 특히 유용합니다.
고급 언어 능력
- 이 모델은 생성된 목소리가 그 개성을 유지하면서도 대화의 맥락에 적절히 반응하도록 보장하여 일관되며 자연스러운 음성 인격을 만들어냅니다.
전반적으로 OCTAVE는 AI 음성 기술의 중요한 도약을 의미하며, 음성 생성과 감정 표현에서 전례 없는 유연성과 자연스러움을 제공합니다.