Une nouvelle affaire judiciaire frappe Meta, la société mère de Facebook, Instagram et WhatsApp. En cause, l’entraînement de ses modèles d’intelligence artificielle à partir d’œuvres protégées par le droit d’auteur et issues d’une vaste base de données piratée.
L’utilisation controversée de la base de données LibGen
La plainte déposée en janvier dernier contre Meta repose sur des documents compromettants qui allèguent que la société a utilisé des œuvres provenant de Library Genesis, aussi connue sous le nom de LibGen, pour entraîner son modèle d’IA baptisé LLaMA. LibGen est une immense base de données reconnue pour contenir du contenu piraté, sujet de nombreuses plaintes et critiques.
Inscrivez-vous à la newsletter
En vous inscrivant vous acceptez notre politique de protection des données personnelles.
D’après les plaignants, Mark Zuckerberg, PDG de Meta, aurait personnellement approuvé l’usage de cette base de données, bien que les dirigeants internes savaient qu’elle était composée d’œuvres protégées par le copyright. Selon les avocats des auteurs, Meta a agi en toute connaissance de cause malgré les risques juridiques.
Des décisions éthiques internes mises en doute
Les échanges internes entre les employés de Meta, divulgués lors de la procédure, montrent que plusieurs membres de la société étaient conscients des complications potentielles. Une partie des employés avait exprimé leurs réticences quant à l’utilisation de LibGen, la qualifiant de décision risquée pouvant entacher la réputation de l’entreprise.
Un mémo interne, présenté au tribunal, indique que malgré ces préoccupations, Meta a continué à utiliser cette base de données. Les discussions mentionnaient explicitement les implications éthiques et légales du recours à des fichiers piratés, mais ces considérations n’ont pas empêché l’approbation finale.
Réponse de Meta face aux accusations
Lors de sa défense, Meta a argumenté qu’ils n’ont enfreint aucune loi sur les droits d’auteur. Ils mettent en avant le principe de « fair use » (usage raisonnable), un concept juridique américain permettant l’utilisation limitée de matériel protégé sans autorisation préalable dans certaines circonstances comme la recherche ou l’éducation.
Les avocats de Meta affirment qu’il n’y a pas de preuves tangibles montrant que LibGen a effectivement été utilisée pour former leurs modèles d’IA. Ils maintiennent que toute utilisation éventuelle serait conforme aux dispositions légales prévues par le « fair use ».
La réaction des créateurs impactés
La communauté des créateurs a vivement réagi à cette affaire. De nombreux écrivains et artistes craignent que l’utilisation non autorisée de leurs œuvres pour entraîner des IA menace leur propriété intellectuelle et leurs revenus. Cette situation crée un précédent inquiétant dans l’industrie technologique où les enjeux autour de l’utilisation éthique des œuvres protégées par le droit d’auteur sont de plus en plus présents.
Les auteurs plaignants considèrent que cet usage illégal constitue une violation flagrante de leurs droits et appellent à une régulation stricte des pratiques de formation des modèles d’IA.
Les perspectives judiciaires et réglementaires
Le juge de district américain Vince Chhabria a récemment permis aux plaignants de déposer une plainte amendée, renforçant ainsi leurs revendications de violation des droits d’auteur et ajoutant une nouvelle allégation de fraude informatique. Ces développements juridiques suggèrent que l’affaire pourrait avoir des conséquences significatives pour Meta et possiblement pour d’autres entreprises technologiques.
Cette affaire relance le débat sur la réglementation nécessaire pour superviser l’utilisation des ressources protégées dans le développement d’intelligences artificielles. La question reste ouverte quant à savoir comment équilibrer innovation technologique et respect des droits des créateurs.