Plus d’un milliard de personnes utilisent désormais des outils d’intelligence artificielle chaque semaine. Ce chiffre spectaculaire pourrait donner l’impression que l’IA se diffuse comme le Web ou le smartphone : imparfaitement, mais dans une direction globalement commune. Le premier rapport du Panel scientifique international indépendant sur l’intelligence artificielle des Nations unies, rendu public le 1er juillet 2026, décrit une réalité plus inconfortable.
L’accès à un chatbot ne signifie ni que ses réponses sont fiables dans toutes les langues, ni que le pays où il est utilisé maîtrise les données, l’infrastructure ou les règles qui le gouvernent. L’IA peut donc devenir plus accessible tout en concentrant davantage le pouvoir technique et économique.
Le rapport préliminaire, préparé par 40 experts indépendants, ne se limite pas à dresser une liste de risques. Il propose une lecture plus structurante : les capacités progressent plus vite que la science ne parvient à les expliquer et que les gouvernements ne peuvent les encadrer. Dans cet intervalle grandissant se jouent à la fois la sécurité des systèmes, la répartition de leurs bénéfices et l’autonomie des pays qui les adoptent.
Un constat plus large que l’alerte sur les risques catastrophiques
La formule la plus commentée est venue du coprésident du panel, Yoshua Bengio. Selon lui, la science ne peut actuellement garantir que des systèmes plus puissants ne provoqueront pas de dommages catastrophiques, de manière autonome ou entre les mains d’acteurs malveillants.
Cette mise en garde ne signifie pas que le rapport prédit une catastrophe. Elle décrit une absence de garantie, ce qui est différent. Les chercheurs observent des comportements trompeurs, une autonomie croissante et des capacités difficiles à anticiper, mais ne disposent pas encore de méthodes suffisamment robustes pour déduire le comportement futur d’un système à partir de tests limités.
Le problème est particulièrement visible avec les agents d’IA. Ces logiciels ne se contentent plus de produire un texte : ils peuvent naviguer entre plusieurs outils, lancer du code, consulter des bases de données et exécuter une suite d’actions. Le panel estime que la complexité des tâches prises en charge par les meilleurs systèmes double tous les quatre à sept mois. Si cette tendance se maintient, des opérations qui occupent aujourd’hui un humain pendant plusieurs jours pourraient être confiées à une machine.
Cette évolution ouvre des perspectives réelles dans la recherche scientifique, la santé ou l’éducation. Elle agrandit aussi la surface d’erreur. Une réponse fausse dans une conversation reste visible et peut être corrigée. Une erreur commise au milieu d’un processus de cent actions peut modifier des fichiers, propager une information inexacte ou prendre une décision avant qu’un humain ne la remarque.
La nouvelle fracture de l’IA ne se résume pas à une connexion Internet
La fracture numérique classique reste immense. D’après l’Union internationale des télécommunications, 2,2 milliards de personnes étaient toujours hors ligne en 2025. Dans les pays à revenu élevé, 94 % de la population utilisait Internet, contre seulement 23 % dans les pays à faible revenu.
Le rapport de l’ONU ajoute une seconde couche à cette inégalité. Un pays peut être connecté, acheter l’accès à un modèle étranger et déployer des assistants dans ses entreprises sans contrôler les éléments qui rendent le service possible : centres de données, puces, modèles, jeux de données, procédures de sécurité et conditions commerciales.
Cette dépendance n’est pas abstraite. Si un fournisseur modifie ses tarifs, retire un modèle, change ses règles de modération ou limite un usage, les organisations clientes doivent s’adapter. Si le système fonctionne mal dans une langue locale ou ignore un contexte juridique national, elles ne disposent pas toujours des moyens techniques pour le corriger.
Le panel insiste donc sur une distinction essentielle : l’accès à l’IA ne produit pas automatiquement un bénéfice équitable. Les pays dépendants de modèles, de clouds et de chaînes de données étrangères peuvent gagner des outils tout en perdant une partie de leur capacité à définir les normes, les garanties et l’adaptation locale.
La langue devient une infrastructure critique
Les performances des modèles génératifs sont très inégales selon les langues. L’anglais et quelques langues très présentes sur Internet disposent d’énormes corpus, d’évaluations abondantes et d’un marché solvable. Des milliers d’autres langues sont peu représentées dans les données d’entraînement et rarement testées de manière sérieuse.
Ce déséquilibre produit autre chose qu’une traduction maladroite. Le rapport cite des erreurs en tigrigna, langue parlée notamment en Éthiopie et en Érythrée, où des termes médicaux ont été confondus : la variole avec la syphilis, la gonorrhée avec le diabète, ou encore des antibiotiques intraveineux avec des « insecticides » intraveineux.
Dans un message informel, ce type d’erreur prête à sourire. Dans un hôpital, il peut mettre une vie en danger. La qualité linguistique doit donc être traitée comme un composant de sûreté, au même titre que la cybersécurité ou la protection des données.
Cela suppose des évaluations conçues avec des locuteurs locaux, des professionnels du secteur et des exemples réalistes. Traduire un benchmark anglais ne suffit pas toujours : certaines ambiguïtés, pratiques administratives ou manières d’exprimer un symptôme n’existent pas sous la même forme d’une culture à l’autre.
Mesurer un modèle après sa sortie devient indispensable
Les évaluations actuelles sont souvent réalisées avant le lancement d’un modèle, sur des questionnaires standardisés ou des scénarios construits en laboratoire. Elles permettent de comparer les versions, mais elles capturent mal ce qui arrive lorsque des millions d’utilisateurs emploient le système dans des contextes imprévus.
Le panel recommande une surveillance continue dans des conditions réelles : avec de vrais utilisateurs, de vraies tâches et de vrais environnements. Cette proposition change la logique habituelle de l’évaluation. Un modèle ne serait plus considéré comme définitivement validé le jour de sa mise sur le marché.
Cette approche ressemble davantage à la pharmacovigilance. Un médicament est étudié avant son autorisation, puis ses effets indésirables continuent d’être recensés après sa diffusion. Pour l’IA, il faudrait suivre les erreurs par langue, secteur, catégorie d’utilisateur et niveau d’autonomie, tout en protégeant la vie privée.
La difficulté est considérable. Les entreprises possèdent une grande partie des données utiles, tandis que les chercheurs et les autorités n’ont souvent accès qu’à des tests ponctuels. Le rapport souligne que même de nombreux pays avancés manquent d’expertise pour évaluer les modèles de frontière. Les informations disponibles dépendent alors largement de ce que les fournisseurs choisissent de mesurer et de publier.
Des indicateurs techniques qui doivent rejoindre les incidents de terrain
Un score moyen ne révèle pas toujours le risque. Un système peut être très performant dans 99 % des cas et échouer précisément face à une minorité linguistique, à une procédure médicale rare ou à une tentative de manipulation.
Une évaluation utile devrait combiner plusieurs niveaux :
- des tests reproductibles avant déploiement ;
- des audits indépendants sur les capacités sensibles ;
- un suivi des erreurs et incidents après lancement ;
- des mesures séparées selon les langues et les contextes ;
- des procédures permettant aux utilisateurs de signaler un dommage ;
- un accès encadré aux données pour les chercheurs et les régulateurs.
Cette chaîne ne garantit pas l’absence d’accident. Elle rend toutefois les défauts plus visibles et permet de vérifier si une correction produit réellement un effet.
L’ONU veut fournir une base scientifique, pas un régulateur mondial
Le statut du panel mérite d’être clarifié. Il ne crée pas de règles, n’inflige pas de sanctions et ne remplace pas les autorités nationales. Sa mission est de synthétiser les travaux scientifiques sur les opportunités, les risques et les effets de l’IA, puis de mettre cette connaissance à la disposition de tous les États.
Cette fonction peut sembler modeste face à la vitesse du secteur. Elle répond pourtant à une faiblesse concrète : tous les gouvernements ne disposent pas d’un institut de sécurité de l’IA, d’équipes capables d’auditer un modèle ou d’un accès direct aux grands laboratoires. Sans référence commune, les débats internationaux opposent rapidement les communiqués des entreprises, les intérêts nationaux et les scénarios les plus alarmistes.
Le panel a été créé par l’Assemblée générale en août 2025. Ses 40 membres ont été choisis parmi plus de 2 600 candidatures issues de 140 pays et siègent à titre personnel. Yoshua Bengio, chercheur en apprentissage profond, et Maria Ressa, journaliste et prix Nobel de la paix, en sont les coprésidents. Cette double direction illustre l’ambition : réunir la compréhension technique des systèmes et l’étude de leurs effets sur l’information, les institutions et les droits.
Le rapport sera présenté au premier Dialogue mondial sur la gouvernance de l’IA, organisé à Genève les 6 et 7 juillet. Il n’aboutira pas immédiatement à un traité. Son influence dépendra de la qualité des données accessibles, de la capacité du panel à actualiser ses constats et de l’usage que les États feront de ses recommandations.
Le véritable enjeu est la capacité d’agir
Le rapport de l’ONU déplace utilement le débat. La question n’est plus seulement de savoir qui peut ouvrir un service d’IA, mais qui peut comprendre son fonctionnement, vérifier ses erreurs, l’adapter à une langue, négocier ses conditions et continuer à opérer si le fournisseur change de stratégie.
Pour les gouvernements, cela implique d’investir dans la connectivité, mais aussi dans les compétences, la recherche locale, les jeux de données linguistiques et les institutions capables d’évaluer les systèmes. Pour les entreprises, la dépendance à un modèle externe doit devenir un risque opérationnel mesuré, au même titre que la dépendance à un cloud ou à un logiciel critique.
Pour les utilisateurs, enfin, la fluidité d’une réponse ne doit pas être confondue avec sa fiabilité. Une IA peut parler une langue sans en maîtriser les nuances, réussir un benchmark sans résister à un contexte réel et être disponible dans un pays sans que ce pays ait le moindre contrôle sur elle.
Le fossé qui se dessine est donc moins visible qu’une zone blanche sur une carte. Il sépare ceux qui consomment l’intelligence artificielle de ceux qui peuvent l’auditer, la modifier et en fixer les conditions. Réduire cet écart sera l’un des tests les plus concrets de la gouvernance mondiale de l’IA.
Références
- Nations unies, Panel scientifique international indépendant sur l’intelligence artificielle
- Nations unies, questions fréquentes sur le mandat et l’indépendance du panel
- Reuters, « Unchecked AI progress may pose catastrophic risks, UN panel warns », 1er juillet 2026
- The Guardian, « Rapid spread of AI may worsen global inequality, UN warns », 1er juillet 2026
- Union internationale des télécommunications, Facts and Figures 2025

