OpenAI 오디오 모델

1 week ago 7

  • 개발자가 OpenAI API의 새로운 텍스트-음성 변환 모델을 시도해 볼 수 있는 인터랙티브 데모
  • 프롬프트로 음성효과, 톤, 속도, 감정, 발음, 일시 정지 등을 상세히 지정 가능

데모

  • 목소리 선택: Alloy, Ash, Ballad, Coral, Echo 등 11가지
  • 다양한 Vibe 선택: Sincere, Friendly, Noir Detective, Robot, Auctioneer 등
  • 예: Sincere Voice Affect: Calm, composed, and reassuring. Competent and in control, instilling trust. Tone: Sincere, empathetic, with genuine concern for the customer and understanding of the situation. Pacing: Slower during the apology to allow for clarity and processing. Faster when offering solutions to signal action and resolution. Emotions: Calm reassurance, empathy, and gratitude. Pronunciation: Clear, precise: Ensures clarity, especially with key details. Focus on key words like "refund" and "patience." Pauses: Before and after the apology to give space for processing the apology.
  • 예: Medieval Knight 보이스 효과: 깊고 명령적이며 약간 드라마틱한 느낌, 고대 영어 이야기의 웅장함을 반영 톤: 고귀하고 영웅적이며 형식적, 중세 기사와 서사적 모험의 본질을 포착 감정: 흥분, 기대, 신비로움, 운명과 의무의 진지함 결합 발음: 명확하고 신중하며 약간 형식적인 리듬, "hast", "thou", "doth" 같은 단어는 고대 영어 발음 패턴을 반영하여 천천히 강조 멈춤: "Lo!", "Hark!" 같은 고대 영어 구문 뒤에 멈춤, "Choose thy path" 같은 절 사이에 멈춤을 두어 결정의 중요성을 강조하고 청자가 퀘스트의 진지함을 반영할 수 있도록 함

Read Entire Article