Le renseignement français doit investir davantage dans l’OSINT
[TRIBUNE] Le pays dispose d’un écosystème favorable au développement du renseignement d’origine sources ouvertes. Il serait temps de créer une agence qui lui soit dédiée.
Les principes et la pratique de l’OSINT (l’Open source intelligence, ou ROSO en français, pour «renseignement d’origine sources ouvertes») ne sont pas nouveaux. Mais avec la démocratisation d’internet à partir de 1995, tout change. En 2010, Eric Schmidt, alors PDG de Google, déclarait que la somme totale des données créées entre le «commencement des temps» et 2003, estimée à 5 exabytes, était produite tous les deux jours. Aujourd’hui, on parle de 120 zettabytes pour l’année 2023.
Face à ce tsunami de données, les performances des semi-conducteurs (qui donnent aux supercalculateurs leur puissance) et des outils d’intelligence artificielle ont fait des progrès stupéfiants. L’envol de l’OSINT s’explique donc par la croissance exponentielle du volume des données créées sur internet et les réseaux numériques, la puissance de calcul des superordinateurs et, enfin, le développement des outils de traitement et d’analyse censés exploiter cette masse ahurissante d’informations.
D’abord axé autour des compétences en renseignement humain (réseaux, identification des sources, collecte, vérification, analyse, etc.), puis de la surveillance électronique et satellitaire, le renseignement est à un nouveau point d’inflexion. Les techniques, la technologie, les méthodes, le recrutement et la formation des agents et, surtout, la capacité de fondre les informations d’origine sources ouvertes avec les autres sources plus «classiques» est devenu un enjeu essentiel dans la concurrence que se livrent les services spéciaux des grandes puissances. Afin de ne pas décrocher, le renseignement français doit investir davantage dans l’OSINT, et pour cela, il doit se doter d’une agence dédiée.
L’OSINT n’est pas un «INT» comme un autre
L’OSINT désigne la collecte de données publiques ou semi-publiques, surtout tirées du monde numérique, internet, données GPS, satellitaires etc., puis de leur vérification, traitement, analyse, dissémination, évaluation. En Ukraine, l’OSINT a permis de prévoir la guerre, de déjouer les opérations sous fausse bannière, d’identifier des cibles ennemies, etc.; avant ça, l’analyse de vidéos de l’autoproclamé État islamique grâce à des données satellitaires comme Google Earth avait facilité la localisation des terroristes, même chose pour les coordonnées GPS des téléphones satellites d’al-Qaïda en Afghanistan.
Mais l’OSINT se distingue des autres disciplines (SIGINT, pour Signals intelligence, HUMINT, pour Human intelligence) par de nombreux aspects. D’abord, le renseignement d’origine sources ouvertes est très hétéroclite: les sources peuvent provenir de la littérature grise, du dark web, de millions de sites, des réseaux sociaux, de données de géolocalisation, et cela sous des formes différentes (texte, images, vidéos, audio), posant évidemment des problèmes de standardisation des données non structurées.
Ensuite, les métiers propres à l’OSINT sont très fragmentés: analystes, développeurs, scientifiques de données, ingénieurs de données, programmeurs, linguistes, professionnels multidisciplinaires chargés de coordonner des métiers et des processus complexes. Du fait de sa nature hybride, l’OSINT doit à la fois entretenir une culture du secret et s’ouvrir suffisamment pour fonder des partenariats originaux avec des start-up et des entreprises de défense, des universités, et convaincre des talents attirés vers le privé.
Il y a aussi les défis liés à la technologie. Dans un milieu historiquement technophobe comme celui du renseignement –où la guerre entre partisans du renseignement d’origine humaine et ceux du renseignement d’origine électromagnétique évoque parfois celle entre les Anciens et les Modernes–, l’idée d’investir des sommes faramineuses dans des supercalculateurs et autres, rien que pour rester dans la course, fera certainement grincer des dents.
Enfin, avec une technologie souvent américaine, trouver le bon compromis entre souci d’indépendance nationale et maîtrise des coûts sera un vrai défi, surtout si les décisionnaires n’ont pas les compétences requises pour faire les choix opportuns.
Tout ceci devrait pousser vers une logique de centralisation des ressources afin d’optimiser les budgets, les matériels et les talents disponibles, ce qui va à l’encontre de la tradition de concurrence entre services secrets français, comme l’a encore démontré en 2022 l’échec du projet de création d’une agence indépendante de surveillance électronique, probablement en raison de l’opposition de la direction générale de la sécurité extérieure (DGSE), soucieuse de garder la main à travers sa direction technique. Mais c’était en 2022. Depuis, les choses ont encore changé…
Le décollage de l’IA générative bouleverse la donne
Depuis quelques mois, on ne parle plus que de ChatGPT, le produit d’OpenAI, une start-up lancée par Elon Musk et Peter Thiel, comptant Microsoft parmi ses actionnaires principaux. En deux mois, ChatGPT avait déjà 100 millions d’abonnés, pulvérisant le record de vitesse d’acquisition précédemment détenu par Instagram. Les médias spécialisés parlent déjà de nouvel âge industriel. Mais pour les services de renseignement, c’est une nouvelle révolution.
D’abord, qu’est-ce que l’intelligence artificielle (IA) générative et pourquoi en parle-t-on autant? Depuis 2019, l’IA a été transformée grâce à la révolution des modèles de fondation. Basés sur des réseaux neuronaux (systèmes complexes d’algorithmes statistiques s’inspirant du fonctionnement du cerveau humain), les modèles de fondation sont des modèles de très grande taille qui sont entraînés sur de très gros volumes de données non étiquetées, au début par apprentissage pré-entraîné. Avec l’explosion du nombre de paramètres (de 100 millions à des milliers de milliards), les modèles tournent maintenant par apprentissage autosupervisé.
Pour simplifier, les modèles apprennent en ingurgitant des quantités faramineuses de données, langages, images, code etc., «s’améliorent» sans intervention humaine et savent répondre à des questions complexes, synthétiser des bibliothèques entières de textes ou d’images à toute allure, développer du code, imiter un style et même créer.
Les applications spécifiques au renseignement donnent le tournis: analyse, synthèse, structuration, simulation de scénarios, validation de très larges quantités de données… En automatisant toutes ces tâches grâce à l’IA générative, les agents peuvent se consacrer à des activités essentielles et prendre de meilleures décisions.
Mais l’IA, entre les mauvaises mains, présente aussi des dangers sans précédent: virus informatiques beaucoup plus performants, «empoisonnement» des données OSINT collectées pour fausser l’analyse, ou encore contamination des pays ciblés avec des fausses rumeurs, fausses affaires, faux complots –quand on voit ce que l’Internet Research Agency d’Evgueni Prigojine a fait avec une technologie somme toute limitée, on est en droit d’avoir froid dans le dos.
Troisième axe: les nouveaux produits. On parle beaucoup de speech-to-face (Nvidia…), un type d’outil qui permet de déterminer un visage à partir de l’enregistrement d’une voix et ensuite retrouver l’individu sur les réseaux sociaux grâce à la reconnaissance faciale. Ou alors des outils programmés pour identifier les deepfakes textuels (Writer, Sensity…). Comme le dit Lakshmi Raman, directrice IA de la CIA: «Il ne fait pas de doute qu’évaluer les outils [d’IA] les mieux adaptés aux objectifs du gouvernement américain ne sera pas une tâche facile.»
Il faut une agence dédiée
Les Britanniques y réfléchissent. Dans leur rapport, le Royal United Services Institute (RUSI) s’interrogeait sur l’opportunité de créer une agence centralisée comme solution à la fragmentation des tâches, des compétences et des expertises liées à l’OSINT, mais concluait qu’il était encore trop tôt, et ce, en raison d’un risque de compartimentation des compétences.
Aux États-Unis, le pays le plus en pointe sur le sujet, le débat fait rage dans la communauté du renseignement. Pour le moment, c’est la Defense Intelligence Agency (DIA) qui a la charge de l’OSINT. Mais, comme l’explique le Center for Strategic and International Studies (CSIS), un cercle de réflexion, «l’émergence de l’IA, du Big Data et d’autres technologies transformatives doivent conduire la communauté du renseignement à réinventer comment elle conçoit, priorise et réalise ses missions». Le think tank recommande ensuite de «mieux intégrer l’OSINT dans la collecte de renseignements et l’expertise analytique».
Les défis liés à l’adoption généralisée de l’OSINT dans le renseignement français réclament une phase initiale de mise en place des structures, des procédures de standardisation, d’inventaire des outils, de développement de partenariats public-privé, etc. Et plutôt que de regrouper les divisions concernées de la DGSE, de la direction du renseignement militaire (DRM) ou possiblement du commandement de la cyberdéfense sous une direction «matrice», solution peu pratique, nous imaginons plutôt la création d’une entité spécialisée, positionnée à la fois comme centre de compétences et incubateur de ces mêmes compétences.
Avec ses communautés open source, ses écoles militaires et scientifiques, ses universités, ses jeunes pousses spécialisées dans la collecte et le traitement de données et l’intelligence artificielle, le pays dispose d’un écosystème favorable au développement d’une expertise OSINT. Une agence spécialisée permettra d’apporter une compétence unique au renseignement français, afin de l’aider à affronter les innombrables défis des prochaines années.