Au soir de la rencontre entre les présidents Trump et Zelensky, nous nous sommes intéressés aux messages partagés sur X/Twitter en France sur ce sujet. Si cette analyse a été déclenchée sans aucun but ou objectif fixé, nous avons vite découvert des activités anormales.
Nous avons publié nos conclusions au plus vite sur nos réseaux sociaux, cet article a pour but de détailler notre approche et donner une analyse plus complète. Ce qui nous pousse à détailler notre travail est un engagement de transparence : la confiance envers nos études commence par la compréhension et la reproductibilité de nos méthodes.
L’étude porte sur tous les tweets francophones contenant le mot “Zelensky” dans les 24 heures ayant suivi la rencontre. Les données analysées représentent 77 951 tweets au total, provenant de 34 588 comptes différents.
Il est important de noter que tous les tweets mentionnant "Zelensky" ont été analysés pour cette étude.
Nous n’avons pas cherché à orienter notre analyse sur le comportement d’un camp en particulier : une campagne de manipulation pro-UE aurait pu être détectée de la même manière qu’une campagne anti-Zelensky sur ce sujet. L’un des grands principes d’Agoratlas est de réduire au maximum les biais d’étude en se concentrant sur des analyses purement statistiques.
Autre point à noter : pour des raisons de coûts d’acquisition des données, l’étude qui suit se base uniquement sur les tweets et réponses, mais pas sur les utilisateurs ayant liké ou retweeté ces contenus. L’influence par les réseaux sociaux passant aussi largement par le nombre de partages, il est courant de voir des réseaux de bots utilisés uniquement pour partager et amplifier certains contenus. Il est probable que les acteurs concernés opèrent également sur cette dimension, mais cela ne sera pas étudié ici.
Parmi les premiers indicateurs suspects, on peut remarquer à plusieurs dates récentes des pics de créations de comptes parmi les utilisateurs ayant parlé de la rencontre Trump-Zelensky. Plus particulièrement, on observe que de nombreux comptes actifs sur le sujet ont été créés il y a seulement quelques semaines.
Parmi l’ensemble des 34 588 comptes analysés, 4 100 ont été créés en 2024 soit environ 11.2 inscrits par jour. Ce taux d’inscriptions a quasiment doublé sur le mois de février 2025 avec 21.5 nouveaux comptes par jour. Le nombre de comptes créés atteint des pics importants sur plusieurs dates clés :
Même si ces analyses ne permettent pas de trancher de manière certaine sur l’existence d’un “réseau de bots” administré par une entité cherchant à manipuler l’opinion publique, ces pics d’inscriptions ne peuvent pas raisonnablement être expliqués par un simple hasard statistique.
La cartographie sémantique (voir point méthodo ci-dessous) des mots utilisés dans les 77 951 tweets révèle que les opinions exprimées sur X/Twitter sont très majoritairement critiques de Zelensky et de plusieurs leaders européens. On y retrouve des insultes contre le président Ukrainien, et également des mises en garde du risque d’une troisième guerre mondiale.
Tous les thèmes abordés sur X en français lors de la rencontre
En analysant plus en détail les tweets publiés autour de certaines thématiques (voir notre méthodologie), nous avons constaté un nombre anormalement élevé de publications dupliquées à l’identique. Deux stratégies principales d’amplification de masse sont mises en oeuvre pour apporter de la visibilité à certaines opinions ou informations :
En tout, nous avons identifié 378 opérations probables de manipulation sur les 24 heures ayant suivi l’événement, pour un total de 4 459 publications.
Tous les clusters de spams détectés par D3lta
Il est néanmoins important de noter que notre enquête sur ce matraquage anti-Zelensky n’a pas permis de mettre en évidence une automatisation à grande échelle ou une opération mise en œuvre par des agents étrangers. La mise en évidence d’une telle opération relève du renseignement ou de l’investigation journalistique, et nous sommes disposés à aider les enquêtes avec nos outils statistiques.
Journalistes et institutions, contactez nous pour plus de détails : contact@agoratlas.com
Pour révéler des vagues de publications coordonnées parmi un très grand nombre de posts, nous utilisons principalement l’outil D3lta créé par VIGINUM, service ministériel chargé de la protection contre les ingérences numériques étrangères. Cet outil permet de mettre en lumière des groupes de posts présentant un contenu textuel très similaire voire identique.
D3lta permet de détecter 3 types de contenus dupliqués :
Afin d’établir un coefficient de similarité entre les posts, D3lta utilise le modèle Universal Sentence Encoder. Ce réseau de neurones permet de représenter chaque post sous forme d’embedding, une manière d’encoder le texte de manière condensée qui conserve uniquement la sémantique (l’information contenue) en faisant abstraction de la syntaxe (la manière de présenter l’information). Cet embedding prend la forme de 512 nombres : deux textes ayant un sens similaire, même dans des langues différentes, auront des valeurs d’embeddings proches.
Afin d’extraire une vision globale des grands axes de discussion autour d’un sujet, nous établissons un graphe de co-occurrences dans lequel chaque mot est un nœud du graphe, et chaque arête entre deux mots indique que ceux-ci sont apparus en même temps dans au moins un post.
Prenons par exemple un cas simplifié avec les 3 posts suivants :
Le graphe de co-occurrences correspondant à ces 3 posts pourrait être le suivant :
Exemple de graphe sémantique simplifié
Pour faciliter la lecture du graphe, nous appliquons les transformations suivantes à la visualisation :