Meta : Le sans valeur justifie-t-il le piratage ?
Par Futurism .Publié le
2025/04/20 09:33

Avril. 20, 2025
Accusé de violation de copyright pour son IA, le géant de la tech se réfugie dans une justification fallacieuse.
Meta, la multinationale technologique derrière les plateformes tentaculaires Facebook et Instagram, se retrouve au cœur d'une tourmente juridique. En cause : l'utilisation présumée illégale de contenus protégés par le droit d'auteur pour alimenter les algorithmes sophistiqués de ses modèles d'intelligence artificielle.
Face à ces accusations graves, la défense adoptée par le colosse de la Silicon Valley confine à l'absurde. Meta argue sans vergogne que les millions de livres ainsi ingérés dans ses systèmes seraient dépourvus de toute "valeur économique". Une pirouette intellectuelle qui soulève une indignation légitime dans le monde de la création et interroge profondément l'avenir des droits de propriété intellectuelle à l'ère de l'IA. Cette tentative de justification suffira-t-elle à exonérer Meta ou ouvrira-t-elle la voie à une bataille judiciaire retentissante ?
Alors que Meta est dans le collimateur pour son usage contestable de matériaux copyrightés dans le dressage de ses IA, la riposte du géant numérique apparaît d'une indigence affligeante.
Dans le cadre de la procédure judiciaire initiée par Richard Kadrey et d'autres, dont les lauréats du prix Pulitzer Andrew Sean Greer et du National Book Award Ta-Nehisi Coates, la firme dirigée par Mark Zuckerberg soutient que le "scraping" – l'aspiration – de plus de sept millions d'ouvrages issus de la bibliothèque pirate LibGen relèverait du "fair use" (usage loyal), et ne saurait donc être qualifié d'illégal.
Mais les arguties spécieuses ne s'arrêtent pas là. Comme le met en lumière une récente enquête de Vanity Fair, les avocats de Meta vont jusqu'à affirmer que les innombrables livres ayant servi à l'entraînement de ses modèles linguistiques, dont le coût se chiffre en milliards de dollars et qui ont propulsé l'entreprise dans la course effrénée à l'IA, seraient en réalité dénués de toute valeur.
Pour étayer cette thèse, Meta a fait appel à un expert témoin qui a minimisé l'importance intrinsèque de chaque livre, avançant qu'un seul ouvrage n'améliorait la performance de son grand modèle linguistique (LLM) que de "moins de 0,06 % sur les benchmarks standard de l'industrie, une variation insignifiante, indiscernable du bruit".
Dès lors, selon Meta, il n'existerait aucun marché justifiant de rémunérer les auteurs pour l'utilisation de leurs œuvres protégées, car "pour qu'il y ait un marché, il faut qu'il y ait quelque chose de valeur à échanger", cite Vanity Fair – "mais aucune des œuvres [des auteurs] n'a de valeur économique, individuellement, en tant que données d'entraînement". D'autres échanges internes ont révélé que des employés de Meta ont pris soin de supprimer les pages de copyright des livres téléchargés.
Cette stratégie illustre parfaitement les manœuvres dilatoires et la logique à double tranchant que Meta, et l'industrie de l'IA dans son ensemble, déploient lorsqu'elles sont pressées de rendre des comptes sur la consommation massive de contenus créés par des humains.
Étrangement, ces créations seraient à la fois insignifiantes en termes de valeur, et nous devrions cesser de nous offusquer de la sacralité de l'art, un algorithme étant désormais capable d'écrire une prose aussi bien qu'un être humain – mais elles seraient également absolument essentielles à l'édification de nos nouvelles divinités synthétiques qui résoudront le changement climatique, alors, s'il vous plaît, ne nous faites pas payer pour leur utilisation. Ce dernier point est littéralement ce qu'OpenAI a plaidé devant le Parlement britannique l'année dernière : le domaine public ne suffirait pas à étoffer ses modèles d'IA, il faudrait donc l'autoriser à puiser dans les trésors des œuvres contemporaines protégées sans bourse délier.
Il semblerait qu'un accord tacite règne au sommet des entreprises d'IA. Selon Vanity Fair, citant des messages internes versés au dossier, lorsqu'un chercheur de Meta a demandé si l'équipe juridique de l'entreprise avait validé l'utilisation de LibGen, un autre a répondu : "Je n'ai pas posé de questions, mais c'est ce que font OpenAI avec GPT3, Google avec PALM et Deepmind avec Chinchilla, alors nous le ferons aussi."
De manière révélatrice, la politique officieuse semble être de ne pas en parler du tout.
"En aucun cas nous ne divulguerions publiquement que nous nous sommes entraînés sur LibGen, cependant, il existe un risque pratique que des parties externes puissent déduire notre utilisation de cet ensemble de données", pouvait-on lire dans une présentation interne de Meta. Le document notait que "si une couverture médiatique suggère que nous avons utilisé un ensemble de données que nous savons être piraté, tel que LibGen, cela pourrait nuire à notre position de négociation avec les régulateurs sur ces questions."
Source : Futurism
Notez ce sujet