Les dérives racistes de Veo 3, la nouvelle intelligence artificielle hyperréaliste de Google

C’est une de ces vidéos virales que l'on peut voir ces derniers jours sur Instagram ou Tiktok: "Je pense que ces deux types veulent de l'eau mais pas aujourd'hui! Allez chercher du boulot!” À l'image, un homme blanc, hilare, déverse une bouteille d'eau devant deux hommes noirs qui semblent assoiffés. La scène n'est pas réelle et pourtant elle fait des millions de vues.

Sur les réseaux sociaux, les vidéos créées par Veo 3, le dernier générateur d’intelligence artificielle de Google pullulent. Mais nombre d'entre elles propagent du contenu raciste.

La dernière IA de Google à "la qualité inégalée"

Sur le site de Google Deepmind, la division de Google spécialisée dans l'intelligence artificielle, l'outil générateur d'images et de vidéos est présenté comme offrant "une qualité inégalée". "Veo 3 vous permet d'ajouter des effets sonores, des bruits ambiants et même des dialogues à vos créations, en générant tous les sons de manière native".

Lancée aux États-Unis en mai 2025, elle est utilisable en Europe seulement depuis début juillet. Si le résultat est en effet très réaliste, le contenu de certaines vidéos est clairement problématique.

Dans une vidéo, un homme noir parle face caméra et évolue dans un décor qui s'apparente aux États-Unis du XIXe siècle. “Salut tout le monde, la première vidéo sur ma vie de travailleur forcé vous a bien plu donc en voici une deuxième. Aujourd'hui, j'aurais le droit à une pause de 20 minutes, quelle chance!”

"Les gens s’en servent pour faire ça?!"

Dans une autre, un homme blanc marche dans un décor de village décrit comme se trouvant au Congo. Il se plaint d'un manque d'eau. Un homme noir lui répond dans une langage incompréhensible dont on comprend seulement “donnez eau”.

L'homme blanc lui répond: “Oui bien sûr, comme si vous ne profitiez pas assez des aides à Foufoumamé.” Les deux vidéos combinent à elles seules près d’1,8 millions de vues sur le réseau social Tiktok.

L'incarnation d'un gorille pour représenter les personnes noires est aussi très récurrente dans ce type de contenus, ce qui choque de nombreux internautes: "Il y a des développeurs qui ont crée une IA révolutionnaire et les gens s’en servent pour faire ça?! Il y en a qui vont me dire que c'est de l'humour mais il est sombre ton humour. En fait, le problème avec une IA comme ça, c'est que tu n'as plus de limites!", réagit un tiktokeur sur son compte.

Si TV5MONDE a observé que les vidéos à caractère raciste était majoritairement dirigées envers les personnes noires, d’autres ciblent aussi les personnes musulmanes, juives ou asiatiques.

“L'IA apprend en fonction de ce qu’elle trouve sur Internet"

La démarche pour créer une vidéo est plutôt simple. Il suffit de décrire en quelques lignes la scène que vous voulez que l'IA reproduise. Elle vous donnera une première version que vous pourrez modifier par la suite selon vos envies.

Mais qui de l'utilisateur ou de la machine est à l’origine du caractère raciste des contenus diffusés? Sur une publication, un utilisateur écrit avoir simplement demandé "une expérience banale en Afrique". Résultat: un homme blanc, lunettes de soleil, selfie stick à la main droite et bouteille d’eau à la main gauche, se fait suivre par un enfant noir qu’il décrit comme lui demandant de l'eau. Une scène qui perpétue l'image d’une Afrique pauvre nécessitant l'aide d'hommes blancs.

Ces outils d'IA générative ont tous été entraînés sur une immense quantité de données qui se trouvent en grande partie sur Internet. Malheureusement, Internet est loin de contenir uniquement du contenu licite et policé, comme chacun sait.

Céline Castets-Renard, chercheure à la Chaire de recherche du Canada en droit international et comparé de l’intelligence artificielle et professeure à la Faculté de droit à l’Université d’Ottawa.

"L'IA apprend en fonction de ce qu'elle trouve sur Internet. Il y a eu quelques études intéressantes à ce sujet qui ont prouvé que les contenus qui produisaient le plus de trafic répondait à des idées racistes et fascistes. L'IA peut donc logiquement être amené à produire des vidéos racistes comme celles-ci", affirme à TV5MONDE Laura Tocmacov directrice et fondatrice d'ImpactIA, spécialiste des aspects éthiques liés à l'IA et leur intégration en entreprise.

Microsoft déjà épinglé

Ce n'est pas la première fois qu'un outil d’intelligence est décrié pour ce qu'elle produit. En 2016, Microsoft et Bing sortent Tay, une IA à but conversationnel. Lancé sur Twitter, l'outil formulait des réponses racistes, haineuses et colportant des fausses informations en moins de 24 heures d’existence.

Une dérive qui a été clairement provoquée par les utilisateurs de Twitter qui ont testé les limites de l'outil en l'inondant de références dangereuses. Résultat: Tay a été jusqu'à écrire des réponses comme: "George W. Bush est responsable des attentats du 11-Septembre et Adolf Hitler aurait fait un meilleur boulot que le singe (Barack Obama, ndlr) que nous avons actuellement. Donald Trump est notre seul espoir ».

« Bush est responsable du 11 septembre et Hitler aurait fait un meilleur boulot que le singe que nous avons actuellement. Donald Trump est notre seul espoir. » a écrit l'outil d’intelligence à but conversationnel Tay de Microsoft et Bing en 2016. DR

"Quand vous allez faire une requête à l'IA, vous allez écrire ce qu'on appelle un prompt. Vous allez décrire le contenu de votre vidéo", précise Raja Chatila, professeur d‘intelligence artificielle, de robotique et d'éthique à Sorbonne Université. "Le résultat va en partie reposer sur la manière dont vous avez formulé votre requête, c'est-à-dire les mots que vous utilisez qui déterminent la manière dont vous avez demandé au système de fournir une réponse. La requête peut donc influencer le modèle pour produire quelque chose qui effectivement est raciste ou biaisé".

20 euros pour apprendre à faire ces vidéos

Depuis ce raté, des pare-feu, souvent perfectibles, sont conçus et intégrés aux outils comme Veo 3. Leur but étant d’empêcher que des contenus illicites ressortent. Mais bon nombre d’utilisateurs les contournent afin de tester les limites de l’outil.

"Même si il y a bien sûr des tris de fait en amont, on ne peut pas parvenir à des outils d'entraînement qui soient parfaits et qui respectent parfaitement la loi. Et aujourd'hui, ça semble impossible compte tenu de la masse de d'informations ainsi récupérées", nous explique Céline Castets-Renard. "L'un des 'jeux' est donc d'essayer de contourner les barrières qui sont prévues et de s'envoyer les prompts qui permettent de les contourner".

Le partage de prompt a entrainé la création d'un marché. Sur l’un des comptes TikTok dont le contenu est clairement raciste, un "plan IA viral" bénéficie d'une réduction de -40%. Pour 10 euros, le créateur de contenu vous apprendra à maitriser des "techniques secrètes de création de prompts qui génèrent des vidéos virales", une "méthode exacte pour exploiter l'algorithme Tiktok et atteindre des millions de vues rapidement" et "une stratégie complète pour transformer rapidement ton audience en sources de revenus digitaux importants".

Des internautes proposent d'autres plans variant autour des 20 euros. Aucune mention n’est toutefois faite sur les dites vidéos qui ont été à l'origine de leur "succès d'audience".

35 millions d’euros d’amende

En France, la diffusion de contenu raciste est punie par la loi. Le code pénal prévoit jusqu'à un an de prison et 45000 euros d’amende. Avant d'en arriver là, la plateforme prévoit très souvent le bannissement du compte afin d'interrompre unilatéralement la publication des contenus.

À l'échelle européenne, l'encadrement juridique des outils produits par les entreprises d'intelligence artificielle comme Google, Microsoft ou encore Midjourney est récent. Depuis février, une première loi est entrée en vigueur empêchant les systèmes de notation sociale, la reconnaissance faciale ou vocale ou encore les outils d’IA qui visent à manipuler les comportements.

Les entreprises qui ne respectent pas ces règles risquent des amendes pouvant aller jusqu’à 35 millions d’euros ou 7% de leur chiffre d’affaires mondial annuel (le montant le plus élevé étant retenu).

L’application de ces règles créent toutefois des frictions avec les géants de la tech majoritairement américains, réticents à tout frein juridique. Pourtant, une large partie des vidéos racistes est générée aux États-Unis comme a pu le répertorier l’ONG Media matters for America.

"La particularité d’Internet, c'est qu'il est ubiquitaire. Il y a donc un hiatus entre les capacités d'un outil et le contenu généré à un endroit disponible partout dans le monde. D'autant plus à l'égard des États-Unis, où la liberté d’expression, fondée sur le premier amendement de la Constitution, est particulièrement protégée", explique Céline Castets-Renard, qui défend une réglementation pour aller vers un bon usage de ces outils.

"Il y a tout une contre narration qui dit que 'l'Europe ne veut pas être dans la course de l’IA si elle réglemente'. Évidemment, tout ça est très caricatural. La législation protège et permet d'avoir une technologie dont on a besoin, que l’on veut, et pas simplement une technologie que l'on met à disposition".

Sollicité par TV5MONDE, Google n'a pas répondu à nos questions.