Soft-phone WebRTC dans une page web peut parler directement à l’API OpenAI Realtime 


Keyword: 

  • “The new speech-to-speech model 

Votre soft-phone WebRTC dans une page web peut parler directement à l’API OpenAI Realtime pour faire du “speech-in / speech-out” avec un agent IA (STT→LLM→TTS) en temps réel.

  • Le flux micro part en WebRTC vers le modèle, et vous recevez un remote audio track (la voix de l’agent) + un data channel pour les événements/contrôles. 
  • C’est précisément l’usage prévu par l’API Realtime via WebRTC, avec gestion du SDP, des pistes audio et d’un jeton éphémère côté serveur.

En combien de lignes ?

  • Un MVP fonctionnel côté navigateur tient en ~30–50 lignes JS (hors boilerplate UI)
    • getUserMedia, 
    • RTCPeerConnection, 
    • ajout de la piste micro, createDataChannel
    • génération/échange SDP avec l’endpoint Realtime, et lecture du remoteStream


  • Les docs et exemples officiels montrent exactement ce schéma, y compris la création de tokens éphémères côté serveu > voir. OpenAI Platform+1

 Bon à savoir: websocket possible



 • Alternative WebSocket (PCM/Opus) si vous ne voulez pas de WebRTC.





 Bon à savoir: pont SIP natif


  •  Depuis le 28 août 2025, il existe aussi un pont SIP natif si vous devez raccorder de la téléphonie IP



  • mais pour un soft-phone web, le chemin WebRTC direct reste idéal.

Tarifs gpt-realtime 



  • Une heure complète de dialogue IA temps réel 
    • avec gpt-realtime coûte environ 11,5 $ par appel.  uniquement en coût API.
    • avec GPT 4.o mini coûte environ 3,6 $ par appel. 

voir la page prix officielle (tokens input/output, cache). > Ci-dessous en savoir plus 

À PROPOS DE 

 En plus, Possibilité de rajouter des RAG hosted by open AI ? 


 Avec les nouveaux Built-in tools de l’API Platform, vous pouvez désormais :

  • Uploader vos propres documents → ils sont vectorisés automatiquement et stockés dans la File Search Storage d’OpenAI.


  • Requêter en RAG (Retrieval Augmented Generation) → en appelant le File Search Tool, le modèle peut chercher dans vos embeddings privés et les combiner à la génération.


  • Hébergement entièrement géré par OpenAIplus besoin d’un serveur externe type Pinecone, Weaviate ou autre, sauf si vous préférez garder le contrôle. ( comparaison des approches hosted openAI versus Hosted VPS dans la bouton en Savoir plus 


En savoir plus