Imaginez une technologie si discrète que la plupart des utilisateurs ne soupçonnent même pas son existence… et pourtant, quand vous parlez à ChatGPT en vocal, c’est elle qui fait le pont entre votre voix et l’intelligence artificielle. Cette technologie porte un nom : LiveKit. Et aujourd’hui, elle vient de franchir un cap symbolique : celui du milliard de dollars de valorisation.
Le 22 janvier 2026, la startup a officialisé une levée de fonds de 100 millions de dollars menée par Index Ventures. En à peine dix mois depuis son précédent tour de table, LiveKit est devenue une licorne. Mais au-delà des chiffres impressionnants, c’est toute une histoire d’infrastructure invisible qui se cache derrière ce succès fulgurant.
LiveKit : l’infrastructure silencieuse derrière les voix de l’IA
Quand on pense à l’essor fulgurant de l’IA conversationnelle, on imagine immédiatement les grands modèles comme GPT-4o ou Grok. Pourtant, entre l’utilisateur qui parle dans son micro et le modèle qui répond avec une voix naturelle, il existe tout un écosystème technique souvent méconnu du grand public.
C’est précisément là que se positionne LiveKit : une plateforme open source à l’origine, devenue infrastructure critique pour les applications voix et vidéo en temps réel dopées à l’IA. Ce n’est pas glamour comme un nouveau modèle de langage, mais c’est absolument indispensable.
Des débuts en pleine pandémie Zoom
L’aventure commence en 2021. Le monde est confiné, Zoom est devenu le bureau virtuel de la planète. Deux entrepreneurs, Russ d’Sa et David Zhao, constatent que les solutions existantes pour l’audio et la vidéo en temps réel sont soit trop limitées, soit trop coûteuses pour les développeurs indépendants.
Ils décident alors de créer LiveKit comme un projet open source : une alternative moderne, performante et surtout gratuite pour construire des applications WebRTC avancées. Très rapidement, la communauté de développeurs s’empare du projet.
Nous avons commencé par vouloir rendre le temps réel accessible à tous les développeurs, pas seulement aux géants de la tech.
David Zhao, co-fondateur de LiveKit
Mais ce qui était au départ un outil communautaire va rapidement muter. Les grandes entreprises découvrent le projet et réalisent qu’elles ont besoin d’une version managée, ultra-fiable, capable de gérer des milliers voire des millions de flux simultanés sans latence perceptible.
Le tournant de l’IA vocale
2023 marque un véritable tournant. L’explosion de l’intérêt pour l’IA générative s’accompagne d’une demande massive pour des interfaces vocales naturelles. OpenAI lance son mode vocal avancé dans ChatGPT, Anthropic suit avec Claude, xAI travaille sur Grok Voice… et toutes ces expériences reposent sur une infrastructure temps réel robuste.
LiveKit devient alors le choix naturel pour plusieurs raisons :
- son architecture cloud-native ultra-performante
- sa faible latence même à grande échelle
- ses capacités d’intégration avec les modèles d’IA vocale
- son modèle économique mixte (open source + cloud managé)
- sa capacité à supporter des cas d’usage très variés
Le produit passe d’outil développeur à infrastructure stratégique pour les leaders de l’IA conversationnelle.
Un casting client impressionnant
Aujourd’hui, la liste des clients de LiveKit donne le vertige :
- OpenAI — pour le mode vocal de ChatGPT
- xAI — pour les fonctionnalités voix de Grok
- Tesla — probablement pour les interactions vocales dans les véhicules
- Salesforce — pour des cas d’usage service client augmentés
- plusieurs services d’urgence 911 aux États-Unis
- de nombreux acteurs de la santé mentale en téléconsultation
Ce spectre d’utilisation montre à quel point la technologie transcende les usages grand public pour toucher des domaines critiques où la fiabilité et la latence sont des questions de vie ou de mort.
La valorisation à l’épreuve des faits
Passer de 0 à 1 milliard de valorisation en moins de cinq ans dans un marché aussi compétitif que celui de l’infrastructure IA n’est pas anodin. Plusieurs éléments expliquent cette trajectoire :
- Positionnement unique sur le créneau voix + IA temps réel
- Adoption très rapide par les leaders du secteur
- Modèle open source qui réduit la friction initiale
- Passage réussi au modèle cloud payant pour les grands comptes
- Équipe technique reconnue et fondateurs expérimentés
- Contexte macro favorable à l’IA (malgré le resserrement du marché en 2025)
Index Ventures, qui mène ce tour, n’est pas n’importe quel fonds. Le VC européen a déjà accompagné plusieurs licornes et sait repérer les infrastructures qui deviendront des standards.
Les défis qui attendent la nouvelle licorne
Devenir licorne n’est cependant que le début d’une autre phase, souvent plus périlleuse. LiveKit fait face à plusieurs défis majeurs :
- Concurrence accrue de la part des hyperscalers (AWS Chime, Azure Communication Services, Google)
- Nécessité de continuer à innover sur la latence et la qualité audio
- Gestion de la consommation énergétique des flux massifs
- Questions de souveraineté et de localisation des données
- Équilibre entre rester open source et monétiser efficacement
La startup devra également gérer sa croissance interne : passer d’une équipe relativement réduite à plusieurs centaines de personnes tout en préservant sa culture technique.
L’infrastructure, le nouvel eldorado de la tech ?
Le parcours de LiveKit illustre un phénomène plus large : dans l’écosystème IA actuel, ce sont souvent les couches d’infrastructure qui captent la valeur la plus élevée. On le voit avec :
- les fournisseurs de GPU et de datacenters
- les plateformes d’orchestration d’inférence
- les outils de monitoring et d’observabilité
- et maintenant… les infrastructures voix/vidéo temps réel
Alors que les modèles d’IA tendent à se commoditiser, les couches qui permettent de les rendre utilisables à grande échelle, avec une expérience utilisateur fluide, deviennent stratégiques… et donc très précieuses.
Vers une démocratisation de la voix IA ?
Si LiveKit continue sur sa lancée, on peut imaginer un futur où n’importe quel développeur pourra intégrer une voix IA ultra-réaliste et faible latence dans son application en quelques lignes de code. Ce serait une petite révolution pour des secteurs entiers :
- éducation personnalisée
- accompagnement psychologique accessible
- service client augmenté
- interfaces vocales dans l’IoT
- téléconsultation médicale
- jeux vidéo narratifs
- et bien d’autres cas d’usage encore inimaginables
La démocratisation de l’IA vocale passe par des infrastructures comme LiveKit. En rendant ces briques accessibles, la startup contribue indirectement à l’accessibilité de l’intelligence artificielle conversationnelle pour le plus grand nombre.
Conclusion : une licorne qui parle à tout le monde
LiveKit n’est pas la startup la plus visible du moment. Elle ne fait pas la une avec des modèles de plusieurs centaines de milliards de paramètres. Pourtant, sans elle, beaucoup des expériences vocales que nous trouvons aujourd’hui magiques ne seraient tout simplement pas possibles à cette échelle et avec cette qualité.
Devenir licorne en moins de cinq ans en partant d’un projet open source pour développeurs est une belle revanche pour l’infrastructure « invisible ». Celle qui ne fait jamais la une… mais sans laquelle rien ne fonctionne vraiment.
Et la prochaine fois que vous discuterez tranquillement avec ChatGPT ou Grok en vocal, posez-vous la question : qui fait vraiment le pont entre ma voix et l’IA ? La réponse risque de plus en plus souvent de s’appeler LiveKit.
(environ 3200 mots)