Meta prévoit de remplacer 90 % de son personnel de modération de contenu par une IA

D’ici au 31 décembre prochain, les posts, commentaires ainsi que l’analyse de la conformité publicitaire seront quasi intégralement géré par le modèle d’IA maison de Meta. Pour justifier ce déploiement massif, l’entreprise va même jusqu’à affirmer que ses propres LLM font 13% d’erreurs de moins que les modérateurs humains tout en identifiant 10% de violations des règles (notamment publicitaires) en plus. Vu comme cela, l’annonce paraît imparable mais le tableau n’est peut-être pas si idyllique que cela.

La faille qui fait mal

Le déploiement massif ne surprendra pas grand monde quand on voit de quelle manière Meta ne jure désormais que par l’IA mais c’est plutôt le timing qui a de quoi surprendre. Il y a quelques semaines de cela, ce sont environ 20 000 comptes Instagram qui se sont retrouvés être compromis à cause d’un assistant IA. Tout simplement cet assistant a envoyé des codes de vérification à des personnes malveillantes impactant des milliers de comptes. Ici, pas de hackers chevronnés avides de lignes de code, mais simplement un prompt savamment préparé et une exécution classique de la part de l’IA. Rapidement la faille a été fixé mais elle demeure symptomatique d’un phénomène plus global&nbsp: plus on prend soin de confier des missions nombreuses à des systèmes avec lesquels on peut intéreagir en langage naturel (sans ligne) plus on expose ces mêmes systèmes à n’importe quelle personne en droit d’interroger ces outils via de simples phrases. Le hacking change littéralement de de dimension.

Des méthodes qui sont encore à éprouver

Au-delà de cette histoire de modération, c’est bien une histoire économique qui se joue puisque l’IA continue d’engloutir des fortunes colossales pour son déploiement. Et Meta doit rapidement pouvoir convaincre d’autres entreprises de miser sur ses modèles d’IA. Mais avant cela, encore faut-il faire la preuve de la robustesse de leurs systèmes et montrer qu’un gain effectif peut avoir lieu et non une casse généralisée du système.

20 000 comptes Instagram compromis par une IA, à cause d’un simple prompt.

Dans ces conditions, la modération quasi intégralement gérée par l’IA devient une vitrine qu’il convient de rendre attrayante. Ce coup de barre généralisé vers l’IA n’est d’ailleurs qu’un marqueur de plus dans une trajectoire générale qui touche à la structure même de l’entreprise puisque le groupe préparait depuis mai la plus grande vague de licenciements de son histoire avec jusqu’à 16 000 postes volatilisés à la clé.

Meta affirme que ses propres LLM font 13% d’erreurs de moins que les modérateurs humains.

Le défi n’est pas gagné pour autant au travers de cette seule annonce et les annonceurs vont devoir être très vigilants dans les mois à venir. Plusieurs situations risquent de mettre à mal les algorithmes. Une modération plus rapide ne va pas nécessairement correspondre à une modération plus fiable. Pour s’en convaincre, il suffit de prendre quelques exemples. Les algorithmes vont sans doute être mis à rude épreuve lorsqu’ils vont être mis face à du sarcasme, des nouveaux mots d’argot ou des nuances culturelles fines. On le sait, les IA ne sont pas du tout agiles face à ces situations et les couacs se produiront nécessairement. Il est fort à parier que des publications inoffensives se retrouveront pénalisées sans explication, de façon arbitraire. Pourtant, Meta avait anticipé cela en testant le modèle participatif Community Notes inspiré de X mais cela sera-t-il suffisant&nbsp? Peu importe les solutions employées, le constat demeure et la modération humaine devient trop chère et Meta veut la bannir.

De tout cela, une question essentielle reste et ne semble pas résolue. Est-ce que Meta va-t-il trop loin avec cette annonce&nbsp? Car à vouloir démontrer tout le potentiel opérationnel de son IA, l’entreprise n’est-elle pas déjà en train d’ouvrir de nouvelles failles avant même d’avoir refermé les précédentes&nbsp?

SOURCE