Info

L'intelligence artificielle pour mieux comprendre la libération de parole de #BalanceTonPorc

La libération de parole via Twitter avec le mot dièse #BalanceTonPorc est devenue très rapidement un sujet de société qui continue de créer le débat. Une entreprise spécialisée dans l'intelligence artificielle et le traitement statistique des données a effectué une étude pour comprendre ce que représentait le phénomène #BalanceTonPorc sur le réseau social. Les algorithmes d'apprentissage profond peuvent-ils nous éclairer sur la qualité des témoignages par Twitter ?

dans
Une entreprise spécialisée dans le traitement des "données ouvertes" (open data) et des "méga données" (big data), Spella, a publié le résultat d'une analyse des témoignages de femmes par Twitter utilisant le mot-dièse #BalanceTonPorc. Les milliers de tweets décrivant des harcèlements, agressions sexuelles (et même des viols) ont donc été analysés par des algorithmes qui ont pu ainsi établir des statistiques. L'intérêt de cette étude est potentiellement l'équivalent d'un sondage de grande échelle, mais basé sur la spontanéité des témoignages, Twitter oblige. Il est donc possible de visionner une sorte de "photographie" des agressions à caractère sexuel que les femmes ont twitté.

Types et parties du corps agressées

Le harcèlement sexuel, l'agression et le viol sont les trois types d'actes qui resortent des tweets #BalanceTonPorc. Si le harcèlement est le plus fréquent, le viol est un témoignage qui est revenu très souvent : 

Dans le cas des agressions sexuelles, les témoignages indiquent que la main aux fesses semble le plus fréquent, alors que la main posée sur la jambe est en deuxième position, avant les seins. 

Où quand et par qui ?

La rue et lieu de travail sont les lieux les plus fréquents des agressions et harcèlements alors que le métro est étonnamment peu présent (12%) dans les témoignages :
Le moment où ont lieu ces agressions est indifféremment de jour ou de nuit, et au cours de la journée, plutôt que le matin :
Les agresseurs, quant à eux, sont majoritairement des hommes ayant une autorité sur leurs victimes, puisqu'il sont des patrons ou des enseignants à 58% cumulés, mais aussi de la sphère intime (25% d'amis).
 

Quel enseignement tirer de cette étude ?

Le principal intérêt des statistiques issues de l'étude de Spella réside dans la possibilité de voir en un coup d'œil les grandes tendances des flots de témoignages que le phénomène #BalanceTonPorc a engendré. Pour la partie concernant les harcèlement et les agressions sexuelles, la plupart ont eu lieu dans la rue ou au travail et dans le cas d'agresseurs connus, ce sont majoritairement des supérieurs hiérarchiques. Le harcèlement est le principal sujet de témoignage de #BalanceTonPorc, quant au viol, l'étude ne permet pas de connaître correctement les tenants et aboutissants de ce crime, puisque l'on sait qu'il a lieu à 80% du temps par un proche, sur des lieux privés.

L'analyse de tweets opérée par les outils de cette entreprise parvient à résumer des grandes tendances et donne quelques clés sur les témoignages de #BalanceTonPorc, mais l'intelligence artificielle (algorithmes de type deep learning) est-elle nécessaire pour parvenir à ce tri ? Rien n'est moins sûr… Les données sur l'âge, la profession des victimes qui témoignent, des agresseurs aussi, auraient pu — si elles avaient été traitées —  permettre une meilleure analyse du phénomène. Au final, les instituts de sondage, avec leurs questions ouvertes ou fermées ont encore, semble-t-il un intérêt certain…