Clock IA > NLWeb

NLWeb : Microsoft invente le « HTML pour IA » et veut faire discuter tous les sites web

Imaginez pouvoir interroger n'importe quel site web comme vous parlez à un ami. C'est la promesse de NLWeb, un nouveau protocole qui veut transformer la Toile en un immense interlocuteur intelligent.

Vous souvenez-vous de l'époque où trouver une info sur le web relevait parfois du parcours du combattant, avant que des outils comme RSS ne viennent nous simplifier la vie pour suivre nos sites préférés ? Eh bien, préparez-vous pour un nouveau tour de piste ! Cette fois, il ne s'agit plus seulement de faciliter la vie aux humains, mais aussi... aux intelligences artificielles. Microsoft a récemment levé le voile, lors de sa conférence Build 2025, sur un projet open-source baptisé NLWeb. Son ambition ? Permettre à n'importe quel site web de devenir une application dopée à l'IA, capable de converser avec vous en langage naturel. Alors, simple gadget ou future révolution ?

NLWeb
25 Mai 2025 à 8h47 Par Jérôme

NLWeb : Le web qui vous parle, pour de vrai ?

L'idée derrière NLWeb, pour « Natural Language Web » (ou « web en langage naturel » si on veut frimer en français), est de rendre les sites web aussi faciles à interroger pour une IA que pour un humain. Un peu comme si chaque site se dotait soudainement d'une oreille attentive et d'une bouche éloquente.

Le saviez-vous ?

Le cerveau derrière NLWeb n'est autre que R.V. Guha. Ce nom ne vous dit peut-être rien, mais il a déjà contribué à façonner notre web avec des standards comme RSS (Really Simple Syndication – la syndication vraiment simple de contenu) et schema.org (un vocabulaire pour structurer les données sur internet).

Kevin Scott, le directeur de la technologie chez Microsoft, va même plus loin en qualifiant NLWeb de « HTML pour le web agentique ». Le web agentique, c'est un peu le futur du web où des programmes autonomes, des « agents » IA, pourront naviguer, comprendre et interagir avec les contenus et services en ligne pour nous assister. NLWeb serait donc la brique de base pour construire ce web nouvelle génération.

Autre article : ZeroSearch : l'IA d'Alibaba qui apprend à chercher sans Google, et si c'était une révolution ?

Comment ça marche, ce « traducteur » pour IA ?

Pas de panique, on ne va pas vous noyer sous le jargon. Voici les grandes étapes pour qu'un site devienne « NLWeb-compatible » :

  • On réutilise l'existant : NLWeb est malin, il s'appuie sur les données que les sites publient déjà, comme les flux RSS ou d'autres formats de données structurées souvent cachés dans le code des pages. Pas besoin de tout reconstruire de zéro, ouf !
  • Direction la base de données « intelligente » : Ces informations sont ensuite organisées dans des bases de données vectorielles. Imaginez une bibliothèque super bien rangée où les livres (les données) sont classés non pas par ordre alphabétique, mais par sens, ce qui permet des recherches beaucoup plus fines et pertinentes.
  • L'IA met son grain de sel : C'est là que les LLM (Large Language Models, ou grands modèles de langage, comme ceux qui animent ChatGPT) entrent en jeu. Ils viennent enrichir ces données stockées avec des connaissances externes et du contexte. Par exemple, si vous cherchez des restaurants, le système ne se contente pas de lister des noms ; il peut y ajouter des infos géographiques, des avis, etc.
  • Et voilà, un site qui cause ! Au final, on obtient une interface en langage naturel. Vous posez vos questions en français courant, et le site vous répond. Mais surtout, les systèmes d'IA peuvent aussi utiliser cette interface pour accéder aux informations du site de manière programmatique, notamment via un autre standard appelé MCP (Model Control Protocol), qui est un peu comme un protocole de communication universel pour les IA.

En gros, NLWeb veut rendre la création d'une interface de dialogue avec l'IA aussi simple que l'était la création d'une page web basique aux débuts d'Internet.

Autre article : Google AI Overview et le référencement : la révolution SEO que vous devez comprendre

NLWeb face à la concurrence : Chacun sa route, chacun son chemin ?

Le monde des protocoles pour IA est en pleine ébullition, et NLWeb n'arrive pas en terrain vague. D'autres initiatives existent, mais avec des objectifs parfois différents :

  • Agent2Agent de Google : Celui-ci, comme son nom l'indique, se concentre sur la communication entre différents agents IA. Maria Gorskikh, fondatrice et PDG d'AIA, explique :
    « Il s'agit d'orchestrer et de communiquer l'IA agentique et n'est pas particulièrement axé sur l'activation de l'IA pour les sites Web existants ou le contenu de l'IA ».
  • LLMs.txt : Ce projet vise à aider les LLM à mieux "aspirer" le contenu des sites web, en leur donnant des permissions et des indications. Michael Ni, de Constellation Research, précise que
    « NLWeb ne concurrence pas LLMs.txt ; il est plus comparable aux outils de web scraping qui tentent de déduire l'intention d'un site web ».
    NLWeb, lui, se focalise sur les interactions en temps réel directement sur le site de l'éditeur.

NLWeb, de son côté, semble vouloir jouer les bons élèves en s'appuyant sur des standards existants comme RSS et en intégrant MCP comme couche de transport. Selon Michael Ni, Microsoft verrait MCP et NLWeb comme l'équivalent du duo TCP/IP et HTML pour ce futur web agentique. L'avantage principal de NLWeb, selon Will McKeon-White, analyste chez Forrester, serait un meilleur contrôle sur la manière dont les IA « voient » les sites, permettant une meilleure navigation et compréhension, et donc moins d'erreurs.

Les premiers curieux sont déjà sur les rangs

Microsoft n'a pas lancé son bébé dans la nature sans quelques parrains. Des entreprises comme Chicago Public Media, Allrecipes, Eventbrite, Hearst (via son site Delish), O’Reilly Media, Tripadvisor ou encore Shopify sont déjà en train d'expérimenter NLWeb.

Andrew Odewahn, directeur de la technologie chez O’Reilly Media, un éditeur bien connu dans le monde de la tech, semble conquis. Il a déclaré :

« Les entreprises ont longtemps passé du temps à optimiser ce type de métadonnées pour le SEO et d'autres objectifs marketing, mais maintenant elles peuvent profiter de cette richesse de données pour rendre leur propre IA interne plus intelligente et plus capable avec NLWeb. »

Pour lui, l'avantage est double : que ce soit pour interroger des informations publiques ou pour rendre accessible des informations internes. Et comme c'est open-source et que ça peut tourner sur ses propres serveurs, « vous n'avez rien à perdre et beaucoup à gagner à l'essayer maintenant ».

Autre article : Google I/O 2025 : L'IA dans vos lunettes et au volant, le nouveau pari matériel de Google

Faut-il sauter dans le train NLWeb dès maintenant ?

C'est la grande question ! Les avis divergent, comme souvent avec les technologies naissantes.

  • L'enthousiasme prudent : Michael Ni de Constellation Research estime que NLWeb en est à ses tout débuts et qu'il faudra s'attendre à « 2-3 ans pour une adoption substantielle ». Il suggère que les entreprises pionnières avec des besoins spécifiques pourraient commencer à tester pour aider à façonner le standard.
  • L'appel à l'action (avec des bémols) : Maria Gorskikh, également impliquée dans le projet NANDA au MIT (qui vise à créer un registre décentralisé pour les services agentiques), est plus pressante. Elle affirme :
    « Si vous êtes une entreprise avec une grande surface de contenu, une base de connaissances interne ou des données structurées, piloter NLWeb maintenant est une étape intelligente et nécessaire pour rester en tête ».
    Elle compare ce moment à l'adoption précoce des API ou des applications mobiles. Un bémol important toutefois : les secteurs très réglementés comme l'assurance, la banque ou la santé devraient patienter jusqu'à la mise en place de systèmes de vérification neutres et décentralisés.

Une chose est sûre pour les leaders de l'IA en entreprise : l'IA va interagir avec votre site, et il faudra bien l'y préparer. NLWeb se présente comme une solution particulièrement séduisante, un peu comme RSS est devenu un incontournable au début des années 2000.

NLWeb dessine un futur où nos interactions avec le web pourraient être radicalement transformées, rendant l'information plus accessible et les services plus intuitifs grâce à des IA capables de dialoguer. Bien sûr, le chemin est encore long avant une adoption massive, et des questions de maturité et de standardisation restent en suspens. Mais l'idée d'un web qui comprend et répond en langage naturel, transformant chaque site en un potentiel assistant intelligent, a de quoi faire rêver... ou du moins, de quoi alimenter pas mal de conversations.

Alors, prêts à tchatter avec votre site de recettes préféré pour savoir s'il vous reste assez d'œufs pour ce gâteau au chocolat ? L'avenir nous le dira, mais une chose est sûre : le web n'a pas fini de nous surprendre !

Auteur : Jérôme Chaudier

Expert en développement web, référencement et en intelligence artificielle, mon expérience pratique dans la création de systèmes automatisés remonte à 2009. Aujourd'hui, en plus de rédiger des articles pour décrypter l'actualité et les enjeux de l'IA, je conçois des solutions sur mesure et j'interviens comme consultant et formateur pour une IA éthique, performante et responsable.

Voir mes formations

Partager sur : Facebook - X (Twitter) - Linkedin
Actualité IA - Clock IA > NLWeb
Notre association ne vit que par les adhésions et les dons. Si notre site vous a plu, vous pouvez nous soutenir en cliquant ici.