l'IA va-t-il tuer internet?
Flemme de lire :
L’internet d’aujourd’hui est-il le modèle qu’on doit absolument préserver ?
Salut toi. Aujourd’hui, j’ai envie de te parler d’un sujet qui fait couler pas mal d’encre numérique : l’avenir de notre bon vieil Internet face à la révolution de l’IA. Beaucoup s’inquiètent en mode « Oh là là, et si Internet disparaissait parce que les IA donnent les réponses toutes cuites sans qu’on ait à chercher ? ». On va pas se mentir, l’IA change la donne, mais faut-il pour autant s’accrocher à mort au modèle actuel d’Internet ? Allez, installe-toi, je t’embarque pour un voyage à travers l’histoire et le futur possible du Web, avec quelques anecdotes croustillantes et réflexions perso (et mes biais 😉).
Un petit retour en arrière : Internet et la pub, toute une histoire
Pour comprendre le présent, il faut jeter un œil dans le rétro. Imagine-toi au milieu des années 90, quand Internet commence à sortir des labos pour entrer dans les foyers. À l’époque, pas de Facebook ou de Google encore et pas de pub ciblée ultra-personnalisée non plus. Le modèle économique dominant qui émerge est la publicité en ligne un peu basique : de belles bannières colorées affichées sur les sites web, identiques pour tout le monde. D’ailleurs, fun fact historique : le tout premier bandeau publicitaire du Web est apparu en 1994 sur le site HotWired (la version en ligne du magazine Wired). C’était une pub d’AT&T qui demandait malicieusement « Have you ever clicked your mouse right HERE? You will. » et devine quoi, les internautes, curieux, ont cliqué en masse (le taux de clic a été de 44 %, un record absolu aujourd’hui inimaginable) ! Ce petit bandeau a rapporté quelques dizaines de milliers de dollars et a lancé l’ère de la pub en ligne.
Bien sûr, la fête ne faisait que commencer. Très vite, les sites web ont compris qu’ils pouvaient financer leur contenu en vendant de l’espace aux annonceurs. Au début, c’était assez bon enfant : on affichait des pubs liées au contexte du site (une pub pour des pièces auto sur un forum mécanique, par exemple) sans trop savoir qui était l’internaute derrière l’écran. C’était l’ère des « portails » des années 90 et des premiers sites médias financés par la pub, avec des approches parfois brouillonnes mais sincères. Pour l’anecdote, les premières pubs étaient si nouvelles que même les créateurs de ces formats ne se rendaient pas compte de ce que ça allait devenir. L’inventeur du pop-up (cette fenêtre de pub surgissante qu’on a tous détestée) s’est même excusé publiquement en 2014 en disant « Je suis désolé, nos intentions étaient bonnes ». Oui, il a carrément dit pardon pour avoir involontairement pourri notre expérience en ligne (c’était pas du troll, il le pensait vraiment).
De la bannière à la pub ultra-ciblée : comment nos données sont devenues l’or du web
Revenons à notre histoire. Fin 90s – début 2000s, Internet gagne en popularité, et les marketeurs ont une idée de génie (ou diabolique, c’est selon) : et si on ciblait les pubs en fonction de l’utilisateur, pas juste du site visité ? À ce moment-là, plusieurs inventions technologiques vont changer la donne. D’abord, le fameux cookie : ce petit fichier texte inventé en 1994 et adopté par Netscape, qui permet de te reconnaître d’une page à l’autre. À l’origine, le cookie servait à garder ton panier d’achat en mémoire sur un site en ligne, rien de méchant. Sauf que très vite, des régies publicitaires ont compris qu’en plaçant leurs cookies via les bannières sur plein de sites, elles pouvaient te suivre à la trace sur le web. Hop, on passe d’un internet anonyme à un internet où chaque utilisateur laisse des miettes (de cookie 🍪) derrière lui.
Ensuite, il y a eu la naissance des ad-servers centralisés. Par exemple, dès 1995, la société Focalink lance le premier serveur publicitaire central qui permet de gérer et de suivre les affichages de pubs sur plusieurs sites. Ça paraît technique, mais en gros ça signifie qu’un même réseau publicitaire peut connaître tes visites sur tous les sites qu’il “arrose” en pub, et commencer à créer ton profil. Puis arrivent les moteurs de recherche qui, eux aussi, veulent leur part du gâteau publicitaire : en 2000, Google lance AdWords, son système de publicité lié aux mots-clés de recherche. Révolution : on paye pour apparaître tout en haut des résultats sponsorisés quand quelqu’un cherche “billet d’avion pas cher” par exemple. Et ça marche du tonnerre, la pub devient carrément utile (en théorie) puisqu’elle répond directement à ce que l’utilisateur cherche.
Quelques années plus tard, les réseaux sociaux entrent en scène. MySpace, puis surtout Facebook (2004) et Twitter (2006) changent la donne : des plateformes où l’on s’inscrit avec sa véritable identité, où l’on partage volontiers ses goûts, ses amis, ses photos… Un rêve pour les publicitaires ! À partir des années 2006-2010, on bascule dans l’ère de la pub hyper-ciblée. Facebook, Google et consorts accumulent des montagnes de données sur nous pour affiner toujours plus le ciblage publicitaire. Ton âge, ta ville, tes centres d’intérêt, le temps que tu passes à lire tel article, le fait que tu aies cliqué (ou pas) sur telle pub auparavant, tout est bon pour deviner quelle annonce a le plus de chances de te faire réagir. Aujourd’hui, le paysage publicitaire en ligne est extrêmement sophistiqué, bien loin des simples bannières de 1994 : on a des pubs vidéo, des pubs interactives, du reciblage (la fameuse paire de chaussures que tu as regardée une fois et qui te “suit” partout), et un écosystème tentaculaire de trackers en tout genre qui récoltent des infos sur ton comportement.
Évidemment, cette course à la personnalisation a un revers inquiétant : notre vie privée trinque sérieusement. Le modèle “tout gratuit financé par la pub” s’est mué en modèle “gratuit financé par tes données personnelles”. Comme on dit souvent : si c’est gratuit, c’est toi le produit. Et ce n’est pas qu’une jolie phrase, c’est la réalité de l’économie numérique depuis 15 ans. Les géants du Web ont construit des empires en monétisant l’attention des utilisateurs et en vendant aux annonceurs la capacité de viser des audiences ultra-spécifiques (parfois d’une granularité flippante, genre “femmes de 25-30 ans vivant à Paris, intéressées par les voyages et la cuisine végétarienne, ayant récemment eu un bébé”).
On a ainsi vu apparaître des dérives et scandales liés à cette collecte frénétique de données. Le cas le plus célèbre ? L’affaire Cambridge Analytica en 2018, qui a révélé qu’une entreprise avait aspiré les données personnelles de jusqu’à 87 millions d’utilisateurs Facebook (à leur insu) pour faire du ciblage politique ultra-pointu. En gros, leurs likes et infos perso ont servi à leur afficher des pubs et contenus sur mesure pour influencer leur vote lors de l’élection américaine de 2016. Flippant, non ? Et ce n’est qu’un exemple extrême parmi d’autres : on pourrait citer le suivi publicitaire qui devine que tu es enceinte avant même que tu l’annonces (oui, c’est arrivé via l’analyse des achats ou des recherches), ou encore l’utilisation de tes données de navigation pour te classer dans des catégories sensibles (orientations, opinions) sans que tu t’en doutes. Bref, le ciblage publicitaire est allé très loin, trop loin selon beaucoup, et nos données personnelles sont devenues la matière première qui alimente tout ce système.
D’ailleurs, tu as sûrement remarqué la conséquence directe de ces abus : aujourd’hui, chaque site que tu visites te bombarde d’une bannière de consentement aux cookies (« Acceptez-vous d’être traqué ? Oui/Non/Paramétrer ») c’est pas pour décorer, c’est parce que les régulateurs ont dû légiférer pour essayer de freiner la collecte sauvage de données. On en est là : le modèle actuel d’Internet offre une profusion de services et de contenus “gratuits”, mais en échange on accepte (parfois sans le réaliser pleinement) d’être fliqués en permanence pour recevoir de la pub ciblée. Est-ce vraiment si génial que ça comme modèle ? Je vous laisse juger. Oui, la pub en soi ne me dérange pas plus que ça, après tout, ça a toujours financé médias et divertissements. Mais la pub ciblée à outrance, qui fouille ma vie dans les moindres détails, je trouve ça nul à chier. Surtout qu’ironiquement, on pourrait très bien faire du ciblage sans espionner les gens : par exemple en demandant directement à l’utilisateur quels sont ses centres d’intérêts, ou en ciblant juste par contexte/termes recherchés. D’ailleurs, certaines études montrent que la publicité contextuelle (liée au contenu de la page) peut être presque aussi efficace, voire plus rentable, que le ciblage comportemental, tout en respectant mieux la vie privée. Une étude a même trouvé que des campagnes contextuelles pouvaient coûter 48 % moins cher par conversion que des campagnes basées sur le profilage comportemental c’est dire si on se donne beaucoup de mal à nous profiler pour un gain pas si énorme…
Bref, on vit actuellement une situation paradoxale : Internet n’a jamais regorgé autant d’infos et de services gratuits, mais cette abondance est financée par un modèle publicitaire de plus en plus intrusif et contesté. Et c’est précisément à ce moment qu’arrive un élément perturbateur de taille, j’ai nommé l’Intelligence Artificielle.
L’IA débarque : la fin des sites web et de la pub en ligne telle qu’on la connaît ?
Depuis fin 2022, on entend partout parler de ChatGPT. En l’espace de quelques mois, ces IA capables de répondre directement à tes questions en langage naturel ont conquis des millions d’utilisateurs. C’est super pratique : plus besoin de parcourir quinze sites web et d’éplucher des forums pour trouver la réponse à “comment changer une roue de vélo” ou “quelle est la capitale du Kazakhstan” tu demandes à l’IA et pouf, elle te donne la réponse en quelques secondes, souvent bien formulée en plus. Génial pour l’utilisateur, on gagne du temps, on évite les pages bourrées de pubs clignotantes. Mais… tu le vois venir, c’est beaucoup moins génial pour les sites web qui fournissaient ces réponses jusqu’à présent. Parce que si toi tu ne cliques plus sur les liens Google et que tu ne vas plus rendre visite aux pages web, eh bien leurs compteurs de trafic s’effondrent, et leurs revenus publicitaires avec. Et ouais, c’est un vrai problème : pas de visite = pas d’annonce vue = pas de revenu.
Ce phénomène, on commence déjà à en voir les effets. Par exemple, le site de questions-réponses Stack Overflow, très populaire chez les développeurs, a vu sa fréquentation chuter brutalement quand ChatGPT est devenu à la mode. Normal : un codeur en galère pouvait avant aller chercher la solution sur Stack Overflow (en se tapant éventuellement 2-3 pubs au passage), maintenant il teste d’abord une requête à ChatGPT qui lui sort un bout de code tout cuit. Résultat, moins de gens sur Stack Overflow. Des chiffres ? Au printemps 2023, Stack Overflow a constaté un plongeon d’environ -14 % de trafic en un seul mois, et sur l’année on parle d’une baisse de plus de 50% de l’audience par rapport à 2022 selon certaines analyses – ouch.
Et ce n’est pas qu’une anecdote isolée. Même Google, le mastodonte de la recherche, sent le vent tourner. À partir de 2023, pour la première fois, le nombre de recherches classiques sur Google a commencé à stagner voire légèrement baisser, pendant que les usages d’IA explosaient. Selon une analyse Semrush, le trafic global vers Google a diminué de près de 7,9 % entre 2023 et 2024 après l’arrivée de ChatGPT du jamais vu pour Google qui était en croissance constante depuis sa création. 😮 Pas étonnant que la firme de Mountain View ait réagi en urgence : elle a lancé son propre module de réponses par IA (Search Generative Experience) directement sur la page de résultats. Aujourd’hui (en 2025), environ 13 % des recherches Google affichent en haut une réponse d’IA générative qui te donne directement l’essentiel, un peu comme ferait ChatGPT, avec des sources citées en petits liens. Côté utilisateur c’est peut-être pratique, mais côté sites web c’est moyen : l’internaute a son info sans même avoir à cliquer sur le lien source, du coup le trafic sortant de Google vers les sites a tendance à baisser encore plus.
D’ailleurs, ce phénomène de “zero-click search” (recherche sans clic vers l’extérieur) ne date pas de l’IA, Google nous le faisait déjà un peu avec les encarts type « réponse rapide » ou les infos météo, etc. Mais avec l’IA, on atteint un nouveau palier. En 2024, on estime que près de 60 % des recherches Google se terminent sans aucun clic vers un site web, l’utilisateur a eu sa réponse soit directement via un extrait, soit il a reformulé sa question, etc. 60%, c’est énorme (il y a 5 ans ce taux tournait autour de 50% d’après les études). Et plus l’IA va donner des réponses complètes et pertinentes, plus ce chiffre risque d’augmenter. Google le sait bien, les éditeurs de sites le savent aussi… et commencent à avoir des sueurs froides.
Parce que si plus personne ne visite les sites de contenu, le modèle économique actuel s’écroule. On l’a dit, la plupart des sites vivent de la pub (et de la collecte de data associée). Pas de visiteurs signifie pas de revenus, tout simplement. Quelques exemples concrets : de nombreux médias en ligne et blogs voient leur audience baisser et peinent à boucler les fins de mois. On a vu récemment des fermetures spectaculaires, comme BuzzFeed News (un média en ligne pourtant emblématique de la génération réseaux sociaux) qui a annoncé sa fermeture en 2023 faute de rentabilité. Dans un mémo interne, le patron de BuzzFeed expliquait qu’il avait sur-investi dans ce modèle de news “gratuites” dépendant des réseaux sociaux, mais que les plateformes ne fournissaient plus assez de trafic ni de revenus pour faire tourner la boutique. En clair : le vieux rêve d’un internet 100% financé par la pub commence à montrer de sérieuses limites. Entre les algorithmes de Facebook qui ont cessé de mettre en avant les articles d’actus, le public qui a migré vers les formats vidéo courts, et maintenant l’IA qui pique carrément les réponses sans passer par la page web, les éditeurs web encaissent coup sur coup.
Certains parlent même d’une menace existentielle pour l’open web (le web ouvert). Si rien ne change, on craint un cercle vicieux : moins de trafic = moins de revenus = des sites ferment ou réduisent la voilure = moins de contenu original à trouver pour répondre aux questions… ce qui, à terme, pourrait appauvrir le savoir disponible pour entraîner les IA elles-mêmes. Un internet qui se mord la queue, en somme. Des dirigeants de boîtes en sont conscients : “si les IA continuent de siphonner le contenu des éditeurs sans compensation, ça pourrait démanteler le web ouvert tel qu’on le connaît” préviennent certains. Et là, imagine la catastrophe : plus d’articles de journalistes, plus de posts de blogueurs passionnés, juste des agrégations de contenus automatiques. On voit poindre le spectre du “tout-AI” : des contenus générés par IA recyclant d’autres contenus IA, bref un web de moins en moins qualitatif. Le New York Times a même qualifié ce risque de déferlement de “AI slop” (boue d’IA) : du contenu insipide créé par des machines faute d’humains pour produire de la vraie info. Personne ne veut en arriver là, pas même les entreprises tech (car une IA nourrie uniquement de textes générés par d’autres IA finirait idiote, c’est ce qu’on appelle la menace d’un modèle qui s’auto-intoxique).
Face à cette perspective un peu dystopique, les acteurs du web ne restent pas les bras croisés. On assiste déjà à une fronde des éditeurs contre l’usage non régulé de leur contenu par les IA. Par exemple, Chegg, un site d’aide aux étudiants, a carrément déposé une plainte contre Google en 2023 en accusant son module d’IA d’avoir fait chuter drastiquement son trafic, et en arguant que si ce genre de réponse AI se généralise, c’est toute l’industrie du savoir en ligne qui est menacée. Plusieurs grands médias (le New York Times, Reuters, etc.) ont envoyé des lettres salées à OpenAI ou Microsoft pour leur dire en gros “stoppez net l’utilisation de nos articles pour entraîner vos IA sans autorisation, sinon procès”. Des procès, il y en a déjà : fin 2023, une coalition de journaux locaux américains a poursuivi OpenAI pour violation massive du droit d’auteur, estimant que leurs articles avaient été copiés pour nourrir ChatGPT sans aucune compensation. Même les plateformes qui jusqu’ici profitaient du trafic indirect des moteurs de recherche serrent la vis : Reddit et Stack Overflow (justement) ont annoncé qu’ils allaient faire payer l’accès à leurs données via API aux entreprises d’IA (fini de pomper gratuitement nos discussions pour entraîner vos modèles géants !). On voit donc se dessiner un bras de fer : IA vs. éditeurs de contenus, chacun essayant de préserver son bout de gras.
Faut-il craindre la mort de l’Internet (tel qu’on le connaît) ? Turbulences à l’horizon, nouveau modèle en vue
Respirons un coup 😮💨. Tout ça peut paraître alarmant : on se dit « mince, si ça continue, Internet va devenir un désert, les IA vont nous priver de nos sites préférés, etc. ». Alors, doit-on vraiment pleurer la “mort” de l’Internet actuel et s’accrocher coûte que coûte au modèle basé sur la pub ciblée ? À mon avis, non. D’abord parce que, soyons honnêtes, l’Internet d’aujourd’hui n’est pas un paradis idyllique qu’il faudrait préserver à tout prix. Certes, on a pris nos habitudes avec ce système où tout est gratuit d’accès, mais on a vu les dérives que ça implique (surveillance publicitaire, manipulation des algos pour garder l’utilisateur accro, désinformation virale favorisée par la course au clic, etc.). Internet s’est un peu dévoyé en chemin, loin de l’utopie originelle d’un partage libre des connaissances financé de façon neutre. Si l’arrivée des IA vient bousculer ce château de cartes, ce n’est peut-être pas une si mauvaise chose en soi. Ça va forcer tout le monde à se poser les bonnes questions et, espérons-le, à inventer un modèle plus sain et plus équilibré.
Ensuite, il faut bien comprendre une chose : l’IA a besoin d’un Internet vivant pour exister. ChatGPT, par exemple, n’est pas magique – il a été entraîné sur des milliards de pages web écrites par des humains. Si plus personne n’écrit rien de nouveau, l’IA va tourner en rond, ressasser les mêmes infos et perdre en pertinence. Les entreprises qui développent ces IA l’ont compris : elles doivent soutenir la création de contenu, d’une manière ou d’une autre. Donc non, elles ne vont pas laisser “mourir” Internet en siphonnant toutes les données sans rien donner en retour, ce serait scier la branche sur laquelle elles sont assises.
On voit déjà poindre de nouvelles solutions pour réconcilier IA et créateurs de contenus. Par exemple, certaines startups d’IA (moins connues que ChatGPT) jouent la carte du partenariat avec les éditeurs. Perplexity AI, un moteur de réponse par IA, a lancé en 2024 un programme de partage de revenus avec les médias Le principe : quand Perplexity fournit une réponse à un utilisateur, il affiche en source des articles de médias partenaires ; et si la réponse de l’IA a été rendue possible grâce à tel article, le média en question touche une partie des revenus publicitaires générés par l’IA. Des journaux comme TIME, Der Spiegel ou The Texas Tribune se sont déjà associés à ce programme. L’argument de Perplexity, c’est “on veut aligner les incentives pour que tout le monde y gagne”. En gros, l’IA attire du monde, monétise, et redistribue une part du gâteau aux créateurs de contenu.
Les gros acteurs commencent aussi à mettre la main à la poche : en juillet 2023, OpenAI (la boîte derrière ChatGPT) a signé un accord avec l’Associated Press pour obtenir une licence d’utilisation de leurs articles, avec rémunération à la clé. Microsoft et Google discutent avec des groupes de presse pour trouver comment les rémunérer quand leurs contenus sont utilisés par les IA. On peut imaginer que demain, les chatbots intégrés aux moteurs de recherche auront un modèle du type “abonnement premium” où une partie de l’argent ira dans la poche des sites fournisseurs d’info. Ou pourquoi pas un système de micro-paiements automatiques : tu poses une question, et chaque site dont la réponse a été tirée gagne quelques millièmes de centimes, un peu comme une répartition de droits d’auteur. Ce ne sont que des hypothèses, mais l’idée fait son chemin qu’il faudra rémunérer la production de connaissances à l’ère de l’IA, d’une manière ou d’une autre.
Un autre scénario, c’est que nous, utilisateurs, soyons amenés à payer un peu plus directement pour accéder à du contenu de qualité (via l’IA ou pas). Après tout, payer pour de l’info ou des services, ça existe depuis longtemps (journaux, livres, abonnements divers). L’Internet “tout gratuit” est une anomalie historique rendue possible par la pub, mais comme dit plus haut ce n’était pas vraiment gratuit puisqu’on payait de nos données. Peut-être que demain tu paieras un abonnement mensuel à un super moteur de réponse intelligent qui te filera l’info sans pub, en reversant une part aux créateurs. Un peu comme tu paies Netflix pour avoir des séries au lieu de regarder la TV avec pub. D’ailleurs, de plus en plus de sites ont déjà basculé vers des modèles abonnements ou “paywall” : regarde la presse en ligne (Le Monde, Mediapart…), ou même des créateurs indépendants sur Patreon, etc. Il y a un mouvement vers “si tu apprécies mon contenu, contribue financièrement”. Ça pourrait devenir la norme, avec l’IA en intermédiaire qui agrège tout ça de façon pratique pour toi.
Bien sûr, tout ne va pas se faire sans heurts. On est dans une période de turbulence où l’ancien modèle vacille et le nouveau tâtonne. Les acteurs installés, notamment les géants de la pub ciblée et les data brokers, vont râler, et faire du lobbying pour préserver leurs intérêts. Eux, clairement, ont tout misé sur le pillage de nos vies privées pour vendre de la pub, donc ils ne vont pas applaudir si on change de paradigme. Mais à force de scandales et de désamour du public pour ces pratiques invasives, ils devront s’adapter ou disparaître. Peut-être que la pub en ligne existera toujours, mais qu’elle redeviendra plus sobre (moins personnalisée individuellement, plus centrée sur le contexte ou sur des profils choisis par l’utilisateur).
En résumé : non, il ne faut pas s’accrocher aveuglément au modèle actuel comme si c’était un trésor inestimable. Ce modèle a rendu service un temps, il a permis l’essor d’un Internet mondial et foisonnant, mais il montre ses limites et ses excès. Oui, on va traverser une période de secousses (les éditeurs vont devoir innover pour survivre, les modèles économiques vont changer, il y aura sûrement des pertes en route). Mais non, on ne va pas “perdre” Internet. On va le faire évoluer, comme on l’a toujours fait. L’IA ne va pas tuer Internet, parce que sans Internet, l’IA elle-même meurt. Au contraire, l’IA va forcer Internet à grandir, à passer à l’âge adulte en quelque sorte. Et si on fait les choses bien, on pourrait y gagner un Internet à la fois plus juste pour les créateurs (mieux rémunérés pour leur travail) et plus agréable pour nous, utilisateurs (peut-être un peu moins de pubs invasives, qui sait ?).
Mais garde en tête que le changement fait partie de l’ADN d’Internet. On a survécu à l’ère des pop-ups fous, à l’ère des spams, à l’ère des fermes de contenus putaclic… On survivra à l’ère de l’IA aussi, et peut-être qu’on en sortira avec un Internet meilleur qu’avant. Croisons les doigts 🤞 et restons curieux et vigilants. L’aventure continue ! 🚀