Vous avez dj soupir de frustration face aux trois ou quatre pauvres dialogues que vous proposait un jeu face un PNJ ? Avec Nvidia ACE, ce sera bientt de lhistoire ancienne : vous converserez en totale libert avec des personnages boosts lintelligence artificielle.
Quelques pas dans lhostile toundra, battue par la pluie, puis une porte rouille qui souvre sur un abri de fortune. Reprenant votre souffle, vous rangez votre pistolet Makarov dans son holster et vous lancez un regard au patibulaire mercenaire qui semble viss au comptoir. Vous tes nouveau ici, pas vrai ?, vous lance-t-il dun air moqueur. Pour ragir, trois dialogues soffrent vous : Vous avez du boulot pour moi ?, Tu peux me dire ce qui se trame ? et Au revoir. Et pas un choix de plus.
Nous sommes en novembre 2009 et cette scne ouvre S.T.A.L.K.E.R.: Call of Pripyat, le troisime volet de la saga dveloppe par le studio ukrainien GSC Game World. Quinze ans plus tard, mme lacclam Baldurs Gate 3 qui brille par limmense diversit de ses chemins narratifs reste cantonn au mme modle dchange avec les PNJ (Personnage Non-Joueur), avec une srie de dialogues prdfinis choisir parmi trois ou quatre propositions.
Mais en coulisses, une rvolution se prpare dj sous lgide du leader du march des cartes graphiques, Nvidia. Biberonns lintelligence artificielle, tous ces personnages qui habitent nos univers vidoludiques seront trs prochainement plus vrais que nature et appelleront des interactions elles aussi plus intuitives et naturelles. la cl, dinfinies possibilits pour tendre lunivers des futurs jeux vido et les rendre plus vivants, plus riches et plus immersifs que jamais. Et S.T.A.L.K.E.R. 2: Heart of Chornobyl prvu pour le 5 septembre 2024 devrait tre lun des premiers titres en profiter.
Vers des conversations sans limite
Pour nous en convaincre, Nvidia nous a invits dans ses locaux afin de nous faire essayer sa nouvelle technologie Avatar Cloud Engine (ACE). Un PC quip dune GeForce RTX srie 40 et un simple microphone : tout est prt pour nous faire dcouvrir cette nouvelle technologie propulse par lintelligence artificielle. La dmo se lance et on pntre dans un bar ramen futuriste stri de nons flashy, faon Cyberpunk 2077, en interrompant la conversation entre le cuisinier et une experte en scurit, accoude au comptoir. Et pour la premire fois, vous vous adressez eux de la manire la plus naturelle qui soit : en prononant vos questions et en relanant la conversation face au microphone. Exit le choix entre trois ou quatre propositions de dialogue figes : vous pouvez littralement dire tout ce qui vous passe par la tte. Et les PNJ vous rpondent, bienveillants, curieux ou outrs comme on pourrait limaginer dans la vie relle, avec une infinie diversit de possibilits.

On commence timidement demander la fille ce quelle boit ou ce quelle conseille de manger, dans cet tal de street-food. En franais de surcrot, elle recommande des plats prcis ou nous aiguille dans le menu, avec une synchronisation labiale ultra-convaincante. Plus assurs, on teste alors tout type de requtes saugrenues, en lui expliquant quon a lintention de refaire notre salle de bain par exemple, et quon aimerait bien ses conseils clairs. Elle nous aiguille alors vers un ou deux choix intressants ses yeux, une vasque en bton cir ou une douche marbre, avant de nous relancer et de nous demander pourquoi on sollicite son avis sur un sujet aussi inattendu. La discussion se poursuit sur la mto, le climat politique ou litinraire entre Paris et Rouen, avant que lon se tourne vers le cuisinier et quon lui demande sil peut rallumer la lumire. Bougon mais conciliant, il se lve de sa chaise et sexcute. On comprend alors quau-del de linfinie diversit de sujets voquer, lIA sert aussi excuter des commandes et proposer des actions auprs des PNJ. Adjuvant, opposant ou simple personnage lambda sans impact sur laventure, votre interlocuteur peut ainsi faire progresser lintrigue ou la faire partir dans une toute autre direction insouponne. Aprs avoir demand (avec succs) que lon nous montre lune des bouteilles ranges derrire le comptoir, on gagne en assurance et on propose la fille daller voir ailleurs. Il faut croire quon y a mis le ton : convaincue, elle rassemble ses affaires et se lve pour nous suivre.

Aux open-worlds sajoute lopen-mind
LIA et les premiers assistants conversationnels, vous les avez probablement dj essays avec ChatGPT, DALL-E ou Midjourney, qui dfraient la chronique depuis fin 2022. Mais vous devez bien comprendre que Nvidia ne sest pas content de les greffer tels quels aux futurs jeux vido, mme si en apparence les interactions que nous avons essayes peuvent sapparenter leur champ daction type. Le spcialiste des cartes graphiques propose en ralit une solution logicielle et matrielle pour aider les dveloppeurs btir de tels avatars en amont et mieux les intgrer leurs productions. Avec le soutien dautres jeunes entreprises spcialises dans lIA, comme Convai, il offre ainsi aux studios une bote outils complte : les dveloppeurs doivent dfinir le background de leurs PNJ, mais aussi leur rle dans lintrigue ou leurs intentions gnrales – des modles de langage spcifiques en dcoulent, pour sintgrer au mieux lhistoire et au gameplay. Le talent cratif reste au cur de lexprience. Lexperte en scurit, par exemple, ramenait souvent la discussion son domaine de comptence, en faisant preuve dun ton assur, l o le cuisinier paraissait peut-tre moins arrogant et sr de lui.

Techniquement, pour assurer un tel rsultat, Nvidia exploite la fois les NPU de ses GeForce RTX (de srie 20, 30 ou 40) et un serveur dport dans le cloud. Lorsque le joueur parle dans son microphone, le GPU transforme la voix en texte avant de lenvoyer vers les serveurs de Nvidia. La technologie ACE analyse alors la question et produit une rponse partir de ses modles de langage. Cette rponse est ensuite transforme en voix et renvoye vers la GeForce du PC local. Cest la carte qui gre enfin les animations du visage du PNJ, avec la synchronisation labiale (Audio2Face).

Et la technologie avance dj grands pas, avec la promesse dune vraie concrtisation sur le march ds le second semestre de cette anne. Pour en profiter sur PC, des GeForce RTX de srie 30 devraient suffire – noubliez pas qu ce traitement IA doit aussi sajouter le ray-tracing par exemple pour renforcer limmersion et le ralisme des scnes. La dmo nous a dj emballs par ses infinies possibilits : aux open-worlds et leur promesse de libert sajouteront bientt des interactions tout aussi illimites.
MAJ du 19 aot 2025 : NVIDIA annonce que le jeu The Oversight Bureau profitera de sa technologie ACE, ce qui promet des interactions pousses avec les PNJ, grce une bibliothque de dialogues pr-enregistrs et un moteur IA qui dterminera les interactions les plus cohrentes : “NVIDIA ACE est une suite de technologies qui donne vie aux personnages de jeux vido grce l’IA. Elle permet de crer une nouvelle gnration de mondes vivants, peupls de compagnons cultivs, d’agents dynamiques et d’acteurs conversationnels.
The Oversight Bureau d’Iconic Interactive est optimis par NVIDIA ACE. Il utilise notre dernier modle de reconnaissance vocale automatique (ASR) NVIDIA Riva intgr l’appareil pour offrir une grande prcision des mots en temps rel et une faible latence, avec des fonctionnalits d’amlioration des mots et de streaming pour la transcription en anglais. Le moteur narratif d’Iconic, en instance de brevet, utilise un modle d’IA pour analyser et comprendre la transcription, et un autre modle pour dterminer et fournir les dialogues, les comportements et les performances thtrales qui correspondent le mieux la situation.
Dans The Oversight Bureau, vous incarnez le candidat 404, pig dans un centre de reconditionnement souterrain. Chaque jour, vous tes contraint de participer des simulations alors que le Bureau tente de reprogrammer votre esprit et de faire de vous un membre plus docile de la socit. Le joueur interagit avec le jeu l’aide de la parole, que le modle ACE transcrit ensuite en texte.
Traduit avec DeepL.com”

