Soft-phone WebRTC dans une page web peut parler directement à l’API OpenAI Realtime
Keyword:
- “The new speech-to-speech model
Votre soft-phone WebRTC dans une page web peut parler directement à l’API OpenAI Realtime pour faire du “speech-in / speech-out” avec un agent IA (STT→LLM→TTS) en temps réel.
- Le flux micro part en WebRTC vers le modèle, et vous recevez un remote audio track (la voix de l’agent) + un data channel pour les événements/contrôles.
- C’est précisément l’usage prévu par l’API Realtime via WebRTC, avec gestion du SDP, des pistes audio et d’un jeton éphémère côté serveur.
En combien de lignes ?
- Un MVP fonctionnel côté navigateur tient en ~30–50 lignes JS (hors boilerplate UI) :
- getUserMedia,
- RTCPeerConnection,
- ajout de la piste micro, createDataChannel,
- génération/échange SDP avec l’endpoint Realtime, et lecture du remoteStream.
- Les docs et exemples officiels montrent exactement ce schéma, y compris la création de tokens éphémères côté serveu > voir. OpenAI Platform+1
Bon à savoir: websocket possible
• Alternative WebSocket (PCM/Opus) si vous ne voulez pas de WebRTC.
Bon à savoir: pont SIP natif
- Depuis le 28 août 2025, il existe aussi un pont SIP natif si vous devez raccorder de la téléphonie IP ;
- mais pour un soft-phone web, le chemin WebRTC direct reste idéal.
Tarifs gpt-realtime
- Une heure complète de dialogue IA temps réel
- avec gpt-realtime coûte environ 11,5 $ par appel. uniquement en coût API.
- avec GPT 4.o mini coûte environ 3,6 $ par appel.
voir la page prix officielle (tokens input/output, cache). > Ci-dessous en savoir plus
À PROPOS DE
En plus, Possibilité de rajouter des RAG hosted by open AI ?
Avec les nouveaux Built-in tools de l’API Platform, vous pouvez désormais :
- Uploader vos propres documents → ils sont vectorisés automatiquement et stockés dans la File Search Storage d’OpenAI.
- Requêter en RAG (Retrieval Augmented Generation) → en appelant le File Search Tool, le modèle peut chercher dans vos embeddings privés et les combiner à la génération.
- Hébergement entièrement géré par OpenAI → plus besoin d’un serveur externe type Pinecone, Weaviate ou autre, sauf si vous préférez garder le contrôle. ( comparaison des approches hosted openAI versus Hosted VPS dans la bouton en Savoir plus