• Lundi 30 Juillet 2025 - 4:01 PM

Soutenez Bonjour

Soutien Journalisme indépendant

Accessible à tous, financé par les lecteurs

Soutenez-nous

L'IA face à ses démons : Quand ChatGPT contamine le cyberespace et menace son propre avenir


Par Futurism .Publié le 2025/06/17 09:29
L'IA face à ses démons : Quand ChatGPT contamine le cyberespace et menace son propre avenir
Juillet. 17, 2025
  1. 0
  2. 20

L'ascension fulgurante de ChatGPT – et la déferlante de modèles génératifs concurrents qui ont suivi – a saturé Internet d'une quantité telle de contenu superflu qu'elle compromet déjà le développement des futurs modèles d'intelligence artificielle.

Le Cercle Vicieux de la Contamination des Données


Alors que les données générées par l'IA obscurcissent les créations humaines dont ces modèles sont si lourdement dépendants pour s'amalgamer, il devient inévitable qu'une part croissante de ce que ces soi-disant intelligences apprennent et imitent est elle-même une création d'IA de substitution. Répétez ce processus suffisamment de fois, et le développement de l'IA commence à ressembler à un jeu du téléphone maximaliste où non seulement la qualité du contenu produit diminue, ressemblant de moins en moins à ce qu'il est censé remplacer à l'origine, mais où les participants eux-mêmes deviennent activement plus "stupides". L'industrie aime à décrire ce scénario comme "l'effondrement des modèles" (AI model collapse).

La Valeur Inestimable des Données "Pures"

Par conséquent, la quantité finie de données précédant l'essor de ChatGPT devient extrêmement précieuse. Dans un nouvel article, The Register compare cette situation à la demande d'"acier à faible radioactivité" (low-background steel), c'est-à-dire l'acier produit avant la détonation des premières bombes nucléaires, à commencer par l'essai Trinity des États-Unis en juillet 1945.

Parallèle Historique : L'Acier à Faible Radioactivité

De même que l'explosion des chatbots IA a irréversiblement pollué Internet, la détonation de la bombe atomique a libéré des radionucléides et d'autres particules qui se sont infiltrés dans pratiquement tout l'acier produit par la suite. Cela rend les métaux modernes impropres à l'utilisation dans certains équipements scientifiques et médicaux très sensibles. Ainsi, le vieux redevient neuf : une source majeure d'acier à faible radioactivité, même aujourd'hui, provient des navires de guerre des Première et Seconde Guerres mondiales, y compris une immense flotte navale sabordée par l'amiral allemand Ludwig von Reuter en 1919. Maurice Chiodo, chercheur associé au Centre d'étude des risques existentiels de l'Université de Cambridge, a qualifié les actions de l'amiral de "plus grande contribution à la médecine nucléaire au monde". "Cela nous a permis d'avoir cette offre presque infinie d'acier à faible radioactivité. Sans cela, nous serions en quelque sorte bloqués", a-t-il déclaré à The Register. "L'analogie fonctionne ici car vous avez besoin de quelque chose qui s'est produit avant une certaine date".

La Distinction Cruciale des Données Pré-2022

"Mais si vous collectez des données avant 2022, vous êtes assez confiant qu'elles présentent une contamination minimale, voire nulle, par l'IA générative", a-t-il ajouté. "Tout ce qui précède cette date est 'sûr, bon, propre', tout ce qui vient après est 'sale'".

Concurrence Équitable et "Données Propres"

En 2024, Chiodo a co-écrit un article plaidant pour la nécessité d'une source de données "propres", non seulement pour prévenir l'effondrement des modèles, mais aussi pour garantir une concurrence équitable entre les développeurs d'IA. Autrement, les pionniers de cette technologie, après avoir ruiné Internet pour tous les autres avec les déchets de leur IA, bénéficieraient d'un avantage considérable en étant les seuls à avoir profité d'une source de données d'entraînement plus pure.

L'Imminence de la Menace et ses Coûts

La question de savoir si l'effondrement des modèles, en particulier en raison de données contaminées, constitue une menace imminente fait l'objet de débats. Cependant, de nombreux chercheurs, dont Chiodo, tirent la sonnette d'alarme depuis des années. "Maintenant, il n'est pas clair dans quelle mesure l'effondrement des modèles sera un problème, mais si c'en est un, et que nous avons contaminé cet environnement de données, le nettoyage sera prohibitif, probablement impossible", a-t-il confié à The Register.

Les Conséquences Actuelles sur la RAG

Un domaine où le problème a déjà fait surface est celui de la technique appelée "génération augmentée par récupération" (RAG), que les modèles d'IA utilisent pour compléter leurs données d'entraînement obsolètes avec des informations tirées d'Internet en temps réel. Cependant, ces nouvelles données ne sont pas garanties sans altération par l'IA, et certaines recherches ont montré que cela entraînait la production de réponses bien plus "dangereuses" par les chatbots.

Le "Mur" de la Mise à l'Échelle de l'IA

Le dilemme est également le reflet du débat plus large autour de la "mise à l'échelle", c'est-à-dire l'amélioration des modèles d'IA par l'ajout de davantage de données et de puissance de traitement. Après que OpenAI et d'autres développeurs aient signalé des rendements décroissants avec leurs modèles les plus récents fin 2024, certains experts ont proclamé que la mise à l'échelle avait atteint un "mur". Et si ces données sont de plus en plus chargées de "déchets", ce mur deviendrait d'autant plus infranchissable.

Vers une Réglementation Difficile mais Nécessaire

Chiodo spécule que des réglementations plus strictes, comme l'étiquetage du contenu généré par l'IA, pourraient aider à "nettoyer" une partie de cette pollution, mais cela serait difficile à appliquer. À cet égard, l'industrie de l'IA, qui a crié au scandale face à toute interférence gouvernementale, pourrait bien être son pire ennemi. "Actuellement, nous sommes dans une première phase de réglementation où nous nous écartons un peu de la réglementation parce que nous pensons que nous devons être innovants", a déclaré Rupprecht Podszun, professeur de droit civil et de la concurrence à l'Université Heinrich Heine de Düsseldorf, qui a co-écrit l'article de 2024 avec Chiodo, à The Register. "Et c'est très typique pour toute innovation que nous proposons. L'IA est la grande chose, laissons-la faire et tout ira bien".

Source: Futurism

Notez ce sujet



sport

Référendum

Les principaux obstacles auxquels sont confrontés les immigrants

  1. 83%
  2. 16%
  3. 0%

6 Votes

DESSUS