Providers
Inworld
Inworld est un fournisseur de synthèse vocale (TTS) en streaming. Dans OpenClaw, il synthétise l’audio des réponses sortantes (MP3 par défaut, OGG_OPUS pour les notes vocales) et l’audio PCM pour les canaux de téléphonie comme Voice Call.
OpenClaw publie vers le point de terminaison TTS en streaming d’Inworld, concatène les fragments audio base64 renvoyés dans un seul tampon, puis transmet le résultat au pipeline standard d’audio de réponse.
| Propriété | Valeur |
|---|---|
| ID du fournisseur | inworld |
| Plugin | package externe officiel |
| Contrat | speechProviders (TTS uniquement) |
| Variable d’environnement d’authentification | INWORLD_API_KEY (HTTP Basic, identifiant du tableau de bord en Base64) |
| URL de base | https://api.inworld.ai |
| Voix par défaut | Sarah |
| Modèle par défaut | inworld-tts-1.5-max |
| Sortie | MP3 (par défaut), OGG_OPUS (notes vocales), PCM 22050 Hz (téléphonie) |
| Site web | inworld.ai |
| Documentation | docs.inworld.ai/tts/tts |
Installer le plugin
Installez le plugin officiel, puis redémarrez Gateway :
openclaw plugins install @openclaw/inworld-speechopenclaw gateway restartPremiers pas
Définissez votre clé API
Copiez l’identifiant depuis votre tableau de bord Inworld (Workspace > API Keys) et définissez-le comme variable d’environnement. La valeur est envoyée telle quelle comme identifiant HTTP Basic ; ne l’encodez donc pas à nouveau en Base64 et ne la convertissez pas en jeton bearer.
INWORLD_API_KEY=<base64-credential-from-dashboard>Sélectionnez Inworld dans messages.tts
{ messages: { tts: { auto: "always", provider: "inworld", providers: { inworld: { speakerVoiceId: "Sarah", modelId: "inworld-tts-1.5-max", }, }, }, },}Envoyer un message
Envoyez une réponse via n’importe quel canal connecté. OpenClaw synthétise l’audio avec Inworld et le transmet en MP3 (ou en OGG_OPUS lorsque le canal attend une note vocale).
Options de configuration
| Option | Chemin | Description |
|---|---|---|
apiKey |
messages.tts.providers.inworld.apiKey |
Identifiant du tableau de bord en Base64. Se rabat sur INWORLD_API_KEY. |
baseUrl |
messages.tts.providers.inworld.baseUrl |
Remplace l’URL de base de l’API Inworld (par défaut https://api.inworld.ai). |
speakerVoiceId |
messages.tts.providers.inworld.speakerVoiceId |
Identifiant de voix (par défaut Sarah). |
modelId |
messages.tts.providers.inworld.modelId |
ID du modèle TTS (par défaut inworld-tts-1.5-max). |
temperature |
messages.tts.providers.inworld.temperature |
Température d’échantillonnage 0..2 (facultatif). |
Notes
Authentification
Inworld utilise l’authentification HTTP Basic avec une seule chaîne d’identifiant
encodée en Base64. Copiez-la telle quelle depuis le tableau de bord Inworld. Le fournisseur l’envoie
sous la forme Authorization: Basic <apiKey> sans aucun encodage supplémentaire ; ne
l’encodez donc pas vous-même en Base64 et ne transmettez pas de jeton de type bearer.
Voir les notes d’authentification TTS pour le même rappel.
Modèles
ID de modèles pris en charge : inworld-tts-1.5-max (par défaut),
inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Sorties audio
Les réponses utilisent MP3 par défaut. Lorsque la cible du canal est voice-note,
OpenClaw demande OGG_OPUS à Inworld afin que l’audio soit lu comme une bulle
vocale native. La synthèse de téléphonie utilise du PCM brut à 22050 Hz pour alimenter
le pont de téléphonie.
Points de terminaison personnalisés
Remplacez l’hôte de l’API avec messages.tts.providers.inworld.baseUrl.
Les barres obliques finales sont supprimées avant l’envoi des requêtes.