Soft-phone WebRTC dans une page web peut parler directement à l’API OpenAI Realtime

Keyword:

“The new speech-to-speech model

Votre soft-phone WebRTC dans une page web peut parler directement à l’API OpenAI Realtime pour faire du “speech-in / speech-out” avec un agent IA (STT→LLM→TTS) en temps réel.

Le flux micro part en WebRTC vers le modèle, et vous recevez un remote audio track (la voix de l’agent) + un data channel pour les événements/contrôles.
C’est précisément l’usage prévu par l’API Realtime via WebRTC, avec gestion du SDP, des pistes audio et d’un jeton éphémère côté serveur.

En combien de lignes ?

Un MVP fonctionnel côté navigateur tient en ~30–50 lignes JS (hors boilerplate UI) :
- getUserMedia,
- RTCPeerConnection,
- ajout de la piste micro, createDataChannel,
- génération/échange SDP avec l’endpoint Realtime, et lecture du remoteStream.

Les docs et exemples officiels montrent exactement ce schéma, y compris la création de tokens éphémères côté serveu > voir. OpenAI Platform+1

Bon à savoir: websocket possible

• Alternative WebSocket (PCM/Opus) si vous ne voulez pas de WebRTC.

Bon à savoir: pont SIP natif

Depuis le 28 août 2025, il existe aussi un pont SIP natif si vous devez raccorder de la téléphonie IP ;

mais pour un soft-phone web, le chemin WebRTC direct reste idéal.

Tarifs gpt-realtime

Une heure complète de dialogue IA temps réel
- avec gpt-realtime coûte environ 11,5 $ par appel. uniquement en coût API.
- avec GPT 4.o mini coûte environ 3,6 $ par appel.

voir la page prix officielle (tokens input/output, cache). > Ci-dessous en savoir plus

À PROPOS DE

En plus, Possibilité de rajouter des RAG hosted by open AI ?

Avec les nouveaux Built-in tools de l’API Platform, vous pouvez désormais :

Uploader vos propres documents → ils sont vectorisés automatiquement et stockés dans la File Search Storage d’OpenAI.

Requêter en RAG (Retrieval Augmented Generation) → en appelant le File Search Tool, le modèle peut chercher dans vos embeddings privés et les combiner à la génération.

Hébergement entièrement géré par OpenAI → plus besoin d’un serveur externe type Pinecone, Weaviate ou autre, sauf si vous préférez garder le contrôle. ( comparaison des approches hosted openAI versus Hosted VPS dans la bouton en Savoir plus