Et si le prochain ChatGPT ne parlait pas, n’écrivait pas de poèmes et ne générait pas d’images… mais pliait votre linge, épluchait vos légumes et préparait votre café du matin ? C’est exactement la promesse que porte une startup discrète de San Francisco qui, en à peine deux ans, a réussi à lever plus d’un milliard de dollars sans promettre la moindre date de rentabilité. Bienvenue dans l’univers fascinant de Physical Intelligence.
Au cœur de la nouvelle révolution robotique
Derrière une porte banale ornée d’un discret symbole π légèrement décoloré se cache l’un des laboratoires les plus intrigants de la Silicon Valley actuelle. Pas de hall d’accueil luxueux, pas de mur de logos illuminés. À la place : un immense volume en béton brut, des tables en bois clair disposées sans ordre apparent et… des bras robotiques qui s’activent dans tous les sens.
Certains tentent maladroitement de plier un pantalon noir, d’autres s’escriment à retourner un t-shirt, tandis qu’un troisième épluche un zucchini avec une régularité presque hypnotique. On se croirait dans un atelier d’étudiants en robotique… jusqu’à ce qu’on réalise l’ampleur du projet et les noms qui gravitent autour.
Des chercheurs légendaires aux manettes
Le professeur Sergey Levine, figure incontournable de l’apprentissage par renforcement à UC Berkeley, explique avec son calme habituel que ce que l’on observe n’est autre que la phase d’évaluation d’une boucle continue : collecte de données → entraînement de modèles → retour sur le terrain → collecte de nouvelles données. Un cycle qui rappelle furieusement celui des grands modèles de langage… mais appliqué cette fois au monde physique.
« Pensez à ChatGPT, mais pour les robots. »
Sergey Levine, co-fondateur de Physical Intelligence
Cette analogie n’est pas anodine. Comme les LLM ont bénéficié de quantités massives de texte issu d’internet, Physical Intelligence mise sur des volumes considérables de données réelles issues de robots opérant dans des environnements variés : entrepôts, cuisines domestiques, laboratoires, voire même chez un chocolatier du quartier.
Du matériel bas de gamme, une intelligence généraliste
Ce qui frappe immédiatement quand on observe les installations, c’est la simplicité volontaire du matériel utilisé. Les bras robotiques qui s’entraînent sous nos yeux coûtent environ 3 500 dollars pièce – un prix que Sergey Levine qualifie lui-même de « majoration énorme » par le fournisseur. Selon lui, le coût des composants bruts ne dépasserait pas les 1 000 dollars.
Il y a quelques années à peine, personne n’aurait cru que du matériel aussi abordable puisse accomplir des tâches utiles. Aujourd’hui, la donne a changé : une bonne intelligence peut compenser un hardware médiocre. C’est précisément sur ce postulat que Physical Intelligence construit sa stratégie.
- Bras robotiques standards vendus à 3 500 $ pièce
- Coût matière réel estimé < 1 000 $
- Multiples stations de test dans des environnements réels
- Focus sur l’intelligence plutôt que sur le design hardware
Cette approche low-cost permet de multiplier les points de collecte de données sans exploser le budget – un avantage compétitif considérable dans une course où la quantité et la diversité des données semblent être le nouveau Graal.
Lachy Groom, l’entrepreneur serial qui ne voulait plus investir
À la tête opérationnelle de cette ambitieuse entreprise, on trouve Lachy Groom. À 31 ans, cet Australien au visage juvénile a déjà un parcours qui ferait pâlir beaucoup de quadras de la tech. Il a vendu sa première société à 13 ans, a été employé très tôt chez Stripe, puis est devenu business angel avec un palmarès impressionnant : Figma, Notion, Ramp, Lattice… et même Standard Bots, sa première incursion dans la robotique en 2021.
Mais après cinq années passées à investir, Groom cherchait autre chose : la bonne idée, au bon moment, avec la bonne équipe. Quand il a entendu parler des travaux de Sergey Levine, Chelsea Finn et Karol Hausman, il a senti que c’était « le moment ». Une rencontre plus tard, il était convaincu. Physical Intelligence était née.
1 milliard de dollars… sans business plan de commercialisation
En deux ans, la startup a levé plus d’un milliard de dollars auprès des plus prestigieux fonds : Khosla Ventures, Sequoia Capital, Thrive Capital… pour une valorisation atteignant 5,6 milliards. Ce qui rend cette collecte de fonds hors norme, c’est l’absence totale de visibilité sur la monétisation à court ou moyen terme.
« Je ne donne pas aux investisseurs de date de commercialisation. C’est assez étrange que les gens l’acceptent. »
Lachy Groom, CEO de Physical Intelligence
Et pourtant, ils acceptent. Pourquoi ? Parce que la vision défendue par l’équipe est suffisamment ambitieuse et crédible pour que les investisseurs acceptent de prendre un risque long terme. L’objectif affiché n’est pas de vendre des solutions verticales demain, mais de construire une intelligence robotique généraliste capable de s’adapter à n’importe quelle plateforme matérielle et à n’importe quelle tâche.
Cross-embodiment : le Saint Graal de la robotique moderne
Quan Vuong, autre co-fondateur passé par Google DeepMind, explique le concept clé qui anime Physical Intelligence : le cross-embodiment learning. L’idée est simple mais révolutionnaire : si demain une nouvelle forme de robot apparaît sur le marché (nouveau bras, nouvelle jambe, drone humanoïde, etc.), le modèle développé par Physical Intelligence devrait pouvoir y transférer la majorité de ses connaissances sans repartir de zéro.
Autrement dit : le coût marginal pour rendre autonome une nouvelle plateforme robotique tendrait vers zéro. C’est exactement ce qui s’est passé avec les grands modèles de langage : une fois GPT-3 ou Llama entraînés, on peut les fine-tuner pour des usages très variés sans tout recommencer.
Physical Intelligence vs Skild AI : deux philosophies qui s’opposent
Dans cette course à l’intelligence robotique générale, un concurrent se distingue particulièrement : Skild AI, basé à Pittsburgh. La jeune pousse a récemment levé 1,4 milliard de dollars à une valorisation de 14 milliards et affirme avoir déjà généré 30 millions de dollars de revenus en quelques mois seulement sur des cas d’usage réels (sécurité, entrepôts, manufacturing).
| Physical Intelligence | Skild AI | |
| Approche | Recherche pure, long terme | Déploiement commercial immédiat |
| Philosophie | Meilleure intelligence générale d’abord | Flywheel de données via usage réel |
| Revenus actuels | Quasiment nuls (focus R&D) | 30 M$ en quelques mois |
| Valorisation récente | 5,6 milliards $ | 14 milliards $ |
| Critique principale | Risque de rester trop académique | Modèles potentiellement moins « intelligents » |
Skild AI reproche même publiquement à ses concurrents de ne développer que des vision-language models « déguisés » en modèles robotiques, sans véritable « common sense » physique. Physical Intelligence rétorque que seule une base très large et très générale permettra d’atteindre une véritable polyvalence.
Les défis qui restent immenses
Malgré les levées de fonds records et l’effervescence médiatique, les obstacles sont nombreux :
- Le hardware reste extrêmement compliqué (délais, pannes, sécurité)
- La collecte de données de qualité à grande échelle est coûteuse et complexe
- La généralisation vers des tâches jamais vues reste fragile
- Les questions sociétales (sécurité, emploi, intrusion dans la vie privée) émergent
- La consommation énergétique des entraînements devient critique
Lachy Groom lui-même reconnaît que « tout est plus dur qu’une entreprise pure software ». Pourtant, l’équipe affiche une sérénité déconcertante. À 18 mois d’existence, ils avaient déjà dépassé leur roadmap initiale prévue sur 5 à 10 ans.
Vers une intelligence physique universelle ?
Physical Intelligence fait le pari que l’histoire de l’IA récente se répétera dans le monde physique : d’abord des modèles généralistes puissants mais imparfaits, puis une cascade d’applications spécialisées qui transformeront des secteurs entiers.
Si ce pari est gagné, nous pourrions assister dans les prochaines années à une vague d’automatisation bien plus large que ce que l’on imagine aujourd’hui – touchant non seulement les entrepôts et les usines, mais aussi la restauration, le retail, l’aide à domicile, l’agriculture…
Si au contraire l’équipe se trompe sur la faisabilité d’une intelligence réellement généraliste dans un horizon raisonnable, Physical Intelligence pourrait devenir le plus spectaculaire « moonshot » raté de la décennie… ou simplement une étape supplémentaire vers l’inévitable percée.
Dans tous les cas, une chose est sûre : la Silicon Valley continue de parier gros sur des visions audacieuses portées par des équipes exceptionnelles. Et pour l’instant, elle donne beaucoup de corde à Physical Intelligence. À eux de prouver que cette confiance n’est pas imméritée.
Une chose est certaine : les robots qui épluchent maladroitement des courgettes aujourd’hui pourraient bien devenir les ancêtres des machines qui partageront notre quotidien demain. Et cette perspective, aussi excitante qu’inquiétante, est en train de s’écrire sous nos yeux, dans un ancien entrepôt de San Francisco marqué d’un discret symbole π.