Providers

Inworld

Inworld est un fournisseur de synthèse vocale (TTS) en streaming. Dans OpenClaw, il synthétise l’audio des réponses sortantes (MP3 par défaut, OGG_OPUS pour les notes vocales) et l’audio PCM pour les canaux de téléphonie comme Voice Call.

OpenClaw publie vers le point de terminaison TTS en streaming d’Inworld, concatène les fragments audio base64 renvoyés dans un seul tampon, puis transmet le résultat au pipeline standard d’audio de réponse.

Propriété Valeur
ID du fournisseur inworld
Plugin package externe officiel
Contrat speechProviders (TTS uniquement)
Variable d’environnement d’authentification INWORLD_API_KEY (HTTP Basic, identifiant du tableau de bord en Base64)
URL de base https://api.inworld.ai
Voix par défaut Sarah
Modèle par défaut inworld-tts-1.5-max
Sortie MP3 (par défaut), OGG_OPUS (notes vocales), PCM 22050 Hz (téléphonie)
Site web inworld.ai
Documentation docs.inworld.ai/tts/tts

Installer le plugin

Installez le plugin officiel, puis redémarrez Gateway :

bash
openclaw plugins install @openclaw/inworld-speechopenclaw gateway restart

Premiers pas

  • Définissez votre clé API

    Copiez l’identifiant depuis votre tableau de bord Inworld (Workspace > API Keys) et définissez-le comme variable d’environnement. La valeur est envoyée telle quelle comme identifiant HTTP Basic ; ne l’encodez donc pas à nouveau en Base64 et ne la convertissez pas en jeton bearer.

    Code
    INWORLD_API_KEY=<base64-credential-from-dashboard>
  • Sélectionnez Inworld dans messages.tts

    json5
    {  messages: {    tts: {      auto: "always",      provider: "inworld",      providers: {        inworld: {          speakerVoiceId: "Sarah",          modelId: "inworld-tts-1.5-max",        },      },    },  },}
  • Envoyer un message

    Envoyez une réponse via n’importe quel canal connecté. OpenClaw synthétise l’audio avec Inworld et le transmet en MP3 (ou en OGG_OPUS lorsque le canal attend une note vocale).

  • Options de configuration

    Option Chemin Description
    apiKey messages.tts.providers.inworld.apiKey Identifiant du tableau de bord en Base64. Se rabat sur INWORLD_API_KEY.
    baseUrl messages.tts.providers.inworld.baseUrl Remplace l’URL de base de l’API Inworld (par défaut https://api.inworld.ai).
    speakerVoiceId messages.tts.providers.inworld.speakerVoiceId Identifiant de voix (par défaut Sarah).
    modelId messages.tts.providers.inworld.modelId ID du modèle TTS (par défaut inworld-tts-1.5-max).
    temperature messages.tts.providers.inworld.temperature Température d’échantillonnage 0..2 (facultatif).

    Notes

    Authentification

    Inworld utilise l’authentification HTTP Basic avec une seule chaîne d’identifiant encodée en Base64. Copiez-la telle quelle depuis le tableau de bord Inworld. Le fournisseur l’envoie sous la forme Authorization: Basic <apiKey> sans aucun encodage supplémentaire ; ne l’encodez donc pas vous-même en Base64 et ne transmettez pas de jeton de type bearer. Voir les notes d’authentification TTS pour le même rappel.

    Modèles

    ID de modèles pris en charge : inworld-tts-1.5-max (par défaut), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

    Sorties audio

    Les réponses utilisent MP3 par défaut. Lorsque la cible du canal est voice-note, OpenClaw demande OGG_OPUS à Inworld afin que l’audio soit lu comme une bulle vocale native. La synthèse de téléphonie utilise du PCM brut à 22050 Hz pour alimenter le pont de téléphonie.

    Points de terminaison personnalisés

    Remplacez l’hôte de l’API avec messages.tts.providers.inworld.baseUrl. Les barres obliques finales sont supprimées avant l’envoi des requêtes.

    Associé

    Was this useful?
    On this page

    On this page