Passer au contenu

Rencontre Trump-Zelensky : campagne de manipulation de l'opinion sur X/Twitter

Au soir de la rencontre entre les présidents Trump et Zelensky, nous nous sommes intéressés aux messages partagés sur X/Twitter en France sur ce sujet. Si cette analyse a été déclenchée sans aucun but ou objectif fixé, nous avons vite découvert des activités anormales.

 

Nous avons publié nos conclusions au plus vite sur nos réseaux sociaux, cet article a pour but de détailler notre approche et donner une analyse plus complète. Ce qui nous pousse à détailler notre travail est un engagement de transparence : la confiance envers nos études commence par la compréhension et la reproductibilité de nos méthodes.

Cadre de l'étude

L’étude porte sur tous les tweets francophones contenant le mot “Zelensky” dans les 24 heures ayant suivi la rencontre. Les données analysées représentent 77 951 tweets au total, provenant de 34 588 comptes différents.

Il est important de noter que tous les tweets mentionnant "Zelensky" ont été analysés pour cette étude. 

Nous n’avons pas cherché à orienter notre analyse sur le comportement d’un camp en particulier : une campagne de manipulation pro-UE aurait pu être détectée de la même manière qu’une campagne anti-Zelensky sur ce sujet. L’un des grands principes d’Agoratlas est de réduire au maximum les biais d’étude en se concentrant sur des analyses purement statistiques.

Autre point à noter : pour des raisons de coûts d’acquisition des données, l’étude qui suit se base uniquement sur les tweets et réponses, mais pas sur les utilisateurs ayant liké ou retweeté ces contenus. L’influence par les réseaux sociaux passant aussi largement par le nombre de partages, il est courant de voir des réseaux de bots utilisés uniquement pour partager et amplifier certains contenus. Il est probable que les acteurs concernés opèrent également sur cette dimension, mais cela ne sera pas étudié ici.

Création de comptes coordonnée

Parmi les premiers indicateurs suspects, on peut remarquer à plusieurs dates récentes des pics de créations de comptes parmi les utilisateurs ayant parlé de la rencontre Trump-Zelensky. Plus particulièrement, on observe que de nombreux comptes actifs sur le sujet ont été créés il y a seulement quelques semaines.

2Répartition des dates de création de tous les comptes du cadre de l'étude

Parmi l’ensemble des 34 588 comptes analysés, 4 100 ont été créés en 2024 soit environ 11.2 inscrits par jour. Ce taux d’inscriptions a quasiment doublé sur le mois de février 2025 avec 21.5 nouveaux comptes par jour. Le nombre de comptes créés atteint des pics importants sur plusieurs dates clés :

  • 6 novembre 2024 (lendemain des élections américaines) : 34 inscrits
  • 20 au 22 janvier 2025 (investiture de Trump): 56 inscrits quotidiens en moyenne, soit un taux 5 fois supérieur à la normale durant 3 jours
  • 18 février 2025 (Trump accuse Zelensky d’avoir déclenché la guerre) : 41 inscrits
  • 23 février 2025 (Rencontre entre dirigeants de l’UE) : 36 inscrits
  • 28 février 2025 (Zelensky reçu à Washington) : 36 inscrits

3Zoom sur la répartitions des dates de création des comptes récents

Même si ces analyses ne permettent pas de trancher de manière certaine sur l’existence d’un “réseau de bots” administré par une entité cherchant à manipuler l’opinion publique, ces pics d’inscriptions ne peuvent pas raisonnablement être expliqués par un simple hasard statistique.

Une amplification artificielle des narratifs pro-Russie

La cartographie sémantique (voir point méthodo ci-dessous) des mots utilisés dans les 77 951 tweets révèle que les opinions exprimées sur X/Twitter sont très majoritairement critiques de Zelensky et de plusieurs leaders européens. On y retrouve des insultes contre le président Ukrainien, et également des mises en garde du risque d’une troisième guerre mondiale.

Copie de Carto lexic Zelensky (1925 x 1080 px) (1)

Tous les thèmes abordés sur X en français lors de la rencontre

En analysant plus en détail les tweets publiés autour de certaines thématiques (voir notre méthodologie), nous avons constaté un nombre anormalement élevé de publications dupliquées à l’identique. Deux stratégies principales d’amplification de masse sont mises en oeuvre pour apporter de la visibilité à certaines opinions ou informations :

  • Plusieurs utilisateurs, un même message modifié
    • Plusieurs comptes différents reprennent un même message en le modifiant légèrement, souvent sous la forme d'un titre de presse
    • La modification légère permet de se faire passer pour du contenu "unique" et ainsi contourner la modération X
  • Un utilisateur, un contenu spammé
    • Un même utilisateur copie colle le même message en réponse à des comptes très suivis (personnalités politiques, médias...)
    •  Souvent des comptes Premium : les réponses venant de comptes X Premium étant plus mises en avant, c'est une stratégie efficace pour mettre en avant son contenu

En tout, nous avons identifié 378 opérations probables de manipulation sur les 24 heures ayant suivi l’événement, pour un total de 4 459 publications

4

Tous les clusters de spams détectés par D3lta

Il est néanmoins important de noter que notre enquête sur ce matraquage anti-Zelensky n’a pas permis de mettre en évidence une automatisation à grande échelle ou une opération mise en œuvre par des agents étrangers. La mise en évidence d’une telle opération relève du renseignement ou de l’investigation journalistique, et nous sommes disposés à aider les enquêtes avec nos outils statistiques.

Notre étude dans la presse

20 Minuteshttps://www.20minutes.fr/high-tech/by-the-web/4141500-20250303-guerre-ukraine-tentative-manipulation-x-apres-rencontre-zelensky-trump-mise-lumiere

TF1 https://www.tf1info.fr/international/verif-clash-trump-zelensky-comment-des-comptes-francophones-ont-participe-a-une-operation-d-influence-massive-2357201.html

Franceinfo https://www.francetvinfo.fr/replay-radio/le-vrai-du-faux/une-campagne-de-desinformation-pro-russe-sur-x-apres-la-rencontre-entre-donald-trump-et-volodymyr-zelensky_7086663.html

Journalistes et institutions, contactez nous pour plus de détails : contact@agoratlas.com

Outils et méthodologie

Point méthodologie - Détection de posts dupliqués en masse

Pour révéler des vagues de publications coordonnées parmi un très grand nombre de posts, nous utilisons principalement l’outil D3lta créé par VIGINUM, service ministériel chargé de la protection contre les ingérences numériques étrangères. Cet outil permet de mettre en lumière des groupes de posts présentant un contenu textuel très similaire voire identique.

D3lta permet de détecter 3 types de contenus dupliqués :

  • Copié-collé : les posts sont quasiment identiques au mot près
  • Reformulation : les posts contiennent la même information
  • Traduction : le contenu apparaît à l’identique, traduit dans plusieurs langues

Afin d’établir un coefficient de similarité entre les posts, D3lta utilise le modèle Universal Sentence Encoder. Ce réseau de neurones permet de représenter chaque post sous forme d’embedding, une manière d’encoder le texte de manière condensée qui conserve uniquement la sémantique (l’information contenue) en faisant abstraction de la syntaxe (la manière de présenter l’information). Cet embedding prend la forme de 512 nombres : deux textes ayant un sens similaire, même dans des langues différentes, auront des valeurs d’embeddings proches.

Point méthodologie - Graphe sémantique

Afin d’extraire une vision globale des grands axes de discussion autour d’un sujet, nous établissons un graphe de co-occurrences dans lequel chaque mot est un nœud du graphe, et chaque arête entre deux mots indique que ceux-ci sont apparus en même temps dans au moins un post.

Prenons par exemple un cas simplifié avec les 3 posts suivants :

  • Trump et Vance lui ont tendu un piège.”
  • “Pourtant, après l’entretien entre Trump et Macron, je pensais que ça se passerait bien avec Zelensky
  • “Mais Zelensky et Macron ont des besoins très différents.”

Le graphe de co-occurrences correspondant à ces 3 posts pourrait être le suivant :

image_2025-03-20_141605399

Exemple de graphe sémantique simplifié

Pour faciliter la lecture du graphe, nous appliquons les transformations suivantes à la visualisation :

  • Les mots les plus courants (aussi appelés stop words) sont ignorés. En français, il s’agit de “le”, “la”, “est”, “de”, “comme”, etc.
  • La taille de chaque nœud dépend du nombre d’occurrences total du mot correspondant. Cela permet de mettre immédiatement en évidence les mots les plus présents dans les conversations.
  • De même, la largeur de chaque arête est proportionnelle au nombre de co-occurrences.
  • L’emplacement et les couleurs des nœuds sur l’image sont calculés respectivement avec l’algorithme ForceAtlas2 et la méthode de Louvain pour cartographier les mots en les regroupant par communautés.