• Samedi 11 Octobre 2025 - 8:09 PM

Soutenez Bonjour

Soutien Journalisme indépendant

Accessible à tous, financé par les lecteurs

Soutenez-nous

44 métiers : l'IA se rapproche du niveau des experts


Par Victor Tangermann .Publié le 2025/10/04 14:34
 44 métiers : l'IA se rapproche du niveau des experts
Octobre. 04, 2025
  1. 0
  2. 12

Dans un contexte où l'intelligence artificielle s'impose comme une force motrice incontournable dans l'économie mondiale et sur le marché du travail, la controverse s'intensifie quant à son impact réel sur la productivité et l'avenir des professions. Si les enthousiastes considèrent les modèles d'IA comme la clé de l'efficacité et de l'innovation, les sceptiques continuent de soulever des questions fondamentales sur leur capacité à aller au-delà des tâches routinières, et sur la possibilité de s'y fier pour des décisions complexes exigeant une expertise et une précision humaines.

C'est dans ce climat qu'OpenAI, le créateur de ChatGPT, a publié une nouvelle évaluation, baptisée GDPval, destinée à mesurer les performances de ses IA sur des « tâches réelles à valeur économique, couvrant 44 professions ».

« Les gens spéculent souvent sur l'impact plus large de l'IA sur la société, mais la manière la plus claire de comprendre son potentiel est d'examiner ce que les modèles sont déjà capables de faire », a écrit l'entreprise dans un billet de blog accompagnateur.

« Des évaluations comme GDPval aident à ancrer les conversations sur les futures améliorations de l'IA dans des preuves plutôt que dans des conjectures, et peuvent nous aider à suivre l'amélioration des modèles au fil du temps », a ajouté OpenAI.

Il s'agit là de l'une des tentatives les plus directes à ce jour de justifier la viabilité financière de ses modèles, faisant suite au scepticisme selon lequel cette technologie pourrait s'avérer être une impasse. Les experts ont souvent critiqué le marketing vantard de l'entreprise, à l'image du PDG Sam Altman affirmant que son modèle GPT-5 avait atteint une intelligence de "niveau doctorat".

L'IA face aux professionnels de 44 secteurs

Selon les « premiers résultats », GDPval a constaté que « les meilleurs modèles de pointe d'aujourd'hui se rapprochent déjà de la qualité de travail produite par les experts de l'industrie » – un tir de sommation clair adressé aux critiques qui estiment que la technologie n'est pas à la hauteur des exigences du monde du travail.

Les 44 professions où « l'IA pourrait avoir le plus grand impact sur la productivité du monde réel » comprenaient une longue liste de métiers, parmi lesquels les agents immobiliers, les travailleurs sociaux, les ingénieurs industriels, les développeurs de logiciels, les avocats, les infirmiers diplômés, les représentants du service client, les pharmaciens, les détectives privés et les conseillers financiers.

Les tâches spécifiques, telles que décrites dans un article, vont de la création d'un « paysage concurrentiel pour la livraison du dernier kilomètre » pour un analyste financier, à l'évaluation d'« images de lésions cutanées » pour un infirmier, ou à la conception d'une brochure de vente pour un agent immobilier.

Étonnamment, l'entreprise a constaté que le modèle de son concurrent Anthropic, Claude Opus 4.1, était le « modèle le plus performant » après avoir été noté par des experts de l'industrie sur 220 tâches, suivi par GPT-5, qui « a excellé notamment en matière de précision ».

Une version extra-puissante de GPT-5, appelée GPT-5-high, a été jugée « meilleure ou à égalité avec les livrables d'experts de l'industrie » dans un peu plus de 40 % des cas. GPT-4o, lancé il y a plus d'un an, n'a obtenu qu'un score de 13,7 %.

Les limites de la "prise en charge"

Il est clair qu'OpenAI marche sur des œufs concernant le remplacement total des emplois humains. Son langage suggère que l'IA va « soutenir les gens dans le travail qu'ils font tous les jours » au lieu d'affirmer que n'importe qui pourrait bientôt se retrouver au chômage à cause de l'IA. Cela n'est guère surprenant, compte tenu de la perception négative que générerait la célébration de la perte d'emplois.

En même temps, il est permis de douter que cette interprétation soit véritablement honnête quant aux motivations et aux objectifs finaux de l'industrie. Les dirigeants de l'IA se sont longtemps vantés de remplacer le travail humain par l'IA — des mesures drastiques de réduction des coûts qui commencent déjà à se retourner contre certaines entreprises.

Il y a également de bonnes raisons de prendre les derniers résultats d'évaluation d'OpenAI avec un grain de sel massif. Nous avons déjà vu l'utilisation de l'IA causer des maux de tête majeurs aux développeurs de logiciels, aux avocats et même aux représentants du service client, nécessitant souvent plus de supervision humaine, et non moins.

Les hallucinations, en particulier, restent un point de friction majeur, sapant le rendement des outils basés sur les grands modèles de langage et obligeant les utilisateurs à passer plus de temps à vérifier les informations fausses générées par les IA.

Et bien que l'IA excelle souvent à générer des explosions de texte dans un style particulier, il lui est facile de déraper lors de tâches plus longues et moins prévisibles.

Les tâches du monde réel sont rarement « clairement définies avec une seule instruction et des fichiers de référence », a admis OpenAI.

« Les premiers résultats de GDPval montrent que les modèles peuvent déjà prendre en charge certaines tâches répétitives et bien spécifiées plus rapidement et à moindre coût que les experts », a écrit l'entreprise. « Cependant, la plupart des emplois sont plus qu'une simple collection de tâches qui peuvent être écrites. »

Notez ce sujet



sport

Référendum

Les principaux obstacles auxquels sont confrontés les immigrants

  1. 83%
  2. 16%
  3. 0%

6 Votes

DESSUS