Les modèles d’intelligence artificielle capables d’anticiper le débit des rivières ne seront plus réservés aux infrastructures de Google. Le 3 juin 2026, Google Research a publié en open source OpenHydroNet, le cadre logiciel qui reproduit les principaux modèles utilisés pour alimenter les prévisions fluviales de Flood Hub.
La décision est plus importante qu’une simple mise en ligne de code. Elle permet aux services météorologiques et hydrologiques, aux chercheurs et aux organismes de gestion des risques d’entraîner les modèles sur leurs propres bassins versants, d’y intégrer des observations locales et de conserver la maîtrise de leurs données. Dans les régions où les stations de mesure sont rares et les moyens techniques limités, cette ouverture pourrait accélérer l’accès à des prévisions plus avancées.
Elle ne transforme toutefois pas un dépôt GitHub en système d’alerte prêt à l’emploi. OpenHydroNet prévoit principalement le débit quotidien des cours d’eau. Pour avertir réellement une population, il faut encore traduire ces débits en seuils de danger, estimer les zones susceptibles d’être submergées, gérer les faux positifs et diffuser une information compréhensible au bon moment.
OpenHydroNet ouvre le moteur hydrologique de Flood Hub
Le dépôt publié par Google Research contient deux générations de modèles. La première correspond à l’architecture décrite dans une étude parue dans Nature en 2024. La seconde, fondée sur une architecture appelée Mean-Embedding Forecast LSTM, est présentée comme le modèle de production utilisé par Flood Hub depuis décembre 2025.
OpenHydroNet est distribué sous licence Apache 2.0. Le projet fournit le code Python, les configurations d’entraînement, une documentation et un tutoriel interactif. Les équipes peuvent évaluer des modèles préentraînés, les affiner pour des bassins atypiques ou entraîner leurs propres versions à partir de données hydrologiques.
L’objectif affiché est double. Google veut rendre son approche plus transparente et reproductible, mais aussi faciliter son intégration dans les systèmes opérationnels existants. Une agence nationale ne dépend ainsi pas obligatoirement d’une prévision affichée sur une plateforme externe. Elle peut tester le modèle en interne, le confronter à ses outils et décider comment l’utiliser.
Cette nuance compte particulièrement pour des données sensibles. Les mesures de débit, les historiques locaux et les règles de déclenchement d’une alerte peuvent relever d’une infrastructure publique critique. Un modèle exécutable localement permet aux autorités de garder le contrôle sur ce patrimoine informationnel.
Comment une IA apprend à prévoir le débit d’une rivière
Une rivière réagit à un ensemble de facteurs qui interagissent dans le temps. La pluie récente joue un rôle évident, mais elle ne suffit pas. La nature du sol, le relief, la végétation, l’humidité déjà présente, la température, la superficie du bassin et les précipitations accumulées modifient la quantité d’eau qui rejoint le cours d’eau et la vitesse de son écoulement.
OpenHydroNet combine donc plusieurs catégories de données :
- les caractéristiques géographiques du bassin, comme la topographie, les sols et l’occupation des terres ;
- les observations passées de débit lorsqu’elles existent ;
- les données météorologiques historiques ;
- les prévisions de pluie, de température et d’autres variables atmosphériques.
Le modèle utilise des réseaux LSTM, une famille de réseaux neuronaux adaptée aux séries temporelles. Leur intérêt est de conserver une forme de mémoire des événements précédents. Une pluie intense n’a pas le même effet après plusieurs semaines sèches que sur un sol déjà saturé par des épisodes successifs.
La version récente utilise plusieurs modules d’encodage pour traiter des produits météorologiques différents avant de regrouper leurs informations. Elle peut notamment exploiter des prévisions provenant du modèle physique IFS du Centre européen pour les prévisions météorologiques à moyen terme, des estimations satellitaires de la NASA, des observations pluviométriques de la NOAA et des données issues de GraphCast, le modèle météorologique d’IA de Google DeepMind.
L’enjeu décisif des bassins sans station de mesure
Les modèles hydrologiques traditionnels sont souvent calibrés avec de longues séries de mesures propres à chaque bassin. Cette méthode fonctionne bien lorsqu’un réseau dense de stations observe le débit depuis des années. Elle devient beaucoup plus difficile dans un bassin non jaugé ou lorsque les archives sont incomplètes.
L’apprentissage automatique cherche à transférer les relations apprises entre de nombreux bassins. Le modèle peut reconnaître des combinaisons de climat, de relief et de sol déjà rencontrées ailleurs, puis produire une estimation dans une région où les observations locales sont rares.
C’est l’un des principaux apports de l’étude publiée dans Nature en 2024. Sur des bassins non jaugés, le système d’IA obtenait, jusqu’à cinq jours d’échéance pour les événements extrêmes, une fiabilité comparable ou supérieure aux prévisions immédiates du système mondial GloFAS de Copernicus. Cette recherche a contribué à un service opérationnel couvrant alors plus de 80 pays.
Le code ouvert utilise notamment Caravan, un ensemble public qui harmonise des données de bassins versants provenant de plusieurs régions du monde. Les utilisateurs peuvent ajouter leurs propres observations ou affiner le modèle pour des rivières présentant une géologie, une taille ou un régime hydrologique particulier.
Une nouvelle version qui annonce des prévisions plus lointaines
La publication d’OpenHydroNet accompagne un travail de comparaison entre l’ancienne et la nouvelle génération du modèle. Dans une prépublication déposée en avril 2026, les chercheurs évaluent la version 2 sur 1 223 bassins répartis dans le monde.
Selon leurs résultats, la nouvelle architecture étendrait l’horizon de prévision jugé fiable de six jours dans les bassins jaugés et d’un jour dans les bassins non jaugés, par rapport à la prévision au jour même de la première version. L’intégration de plusieurs sources météorologiques et de GraphCast participe à cette progression.
Ces chiffres sont impressionnants, mais ils demandent une lecture prudente. L’article est encore en discussion publique et n’a pas terminé son évaluation par les pairs. Les performances sont principalement mesurées avec le coefficient d’efficacité de Nash-Sutcliffe et des composantes du critère KGE, qui évaluent la qualité globale d’un hydrogramme, c’est-à-dire l’évolution du débit dans le temps.
Des évaluateurs ont souligné que ces mesures ne suffisent pas à caractériser entièrement une prévision de crue. Elles ne disent pas directement si le modèle anticipe correctement le maximum d’une crue, son heure d’arrivée, le franchissement d’un seuil dangereux, les fausses alertes ou les événements manqués. Ils demandent aussi de mieux séparer l’effet de la nouvelle architecture de celui d’un jeu de données d’entraînement plus étendu.
Il faut donc présenter les six jours supplémentaires comme un résultat de recherche prometteur, mesuré selon un protocole précis, et non comme la garantie qu’une ville disposera automatiquement de six jours de plus pour évacuer.
Du débit prévu à l’alerte réellement utile
Prévoir le débit à la sortie d’un bassin est une brique fondamentale, mais ce n’est pas toute la chaîne d’alerte. Un système opérationnel doit d’abord vérifier la qualité des données entrantes. Il doit ensuite relier un débit à un niveau d’eau local, modéliser les zones inondables et connaître les infrastructures ou populations exposées.
Vient ensuite la décision d’alerter. Un seuil trop prudent peut multiplier les fausses alarmes et réduire la confiance du public. Un seuil trop élevé risque de laisser passer un événement dangereux. La forme du message, la langue utilisée, les canaux de diffusion et la capacité des habitants à agir comptent autant que la précision du modèle.
Google Research insiste justement sur la place des connaissances locales. Un service hydrologique connaît les barrages, les travaux récents, les changements d’usage des sols, les petits affluents et les comportements saisonniers que les jeux de données mondiaux décrivent parfois mal. OpenHydroNet permet d’introduire ces observations dans l’entraînement ou l’ajustement du modèle.
Cette capacité évite une vision trop centralisée de l’IA climatique. L’outil mondial apporte une base statistique et une architecture éprouvée. Les experts locaux apportent le contexte, la vérification et la responsabilité opérationnelle. L’un ne remplace pas l’autre.
Le test tchèque montre comment l’outil peut entrer en production
Avant l’ouverture du code, Google a travaillé avec l’Institut hydrométéorologique tchèque. Selon Google Research, les prévisions du modèle d’IA ont atteint une qualité comparable à celle de modèles conceptuels traditionnels calibrés localement.
L’institut a surtout développé un adaptateur pour Delft-FEWS, une plateforme largement utilisée par les agences de prévision des crues, les collectivités, les ONG et des entreprises. Cette intégration est importante parce qu’elle évite de reconstruire toute la chaîne logicielle autour du nouveau modèle.
Dans un service opérationnel, une technologie est rarement adoptée parce qu’elle gagne seulement quelques points sur un benchmark. Elle doit fonctionner avec les bases existantes, les procédures de validation, les tableaux de permanence et les responsabilités institutionnelles. Le connecteur tchèque fournit un exemple de passage entre la recherche et ces contraintes quotidiennes.
Pour les agences disposant de moins de moyens, le caractère ouvert peut aussi réduire le coût d’entrée. Google affirme que les modèles restent relativement simples et peu coûteux à entraîner comparés à certains systèmes hydrologiques traditionnels. Il faudra néanmoins disposer de compétences Python, d’une infrastructure de calcul, de données correctement préparées et d’un dispositif de maintenance.
L’open source ne résout pas le manque de données
L’ouverture du modèle améliore l’accès au logiciel, mais elle ne crée pas les observations absentes. La qualité d’une prévision dépend toujours de stations hydrométriques entretenues, de données météorologiques fiables et d’archives suffisamment longues.
L’étude de 2024 rappelait que seules quelques fractions des bassins versants mondiaux sont équipées de jauges accessibles, avec une forte corrélation entre la richesse d’un pays et la quantité de données publiques disponibles. L’IA peut mieux généraliser vers les zones non observées, mais un modèle reste plus incertain lorsqu’il ne dispose d’aucune mesure locale.
Cette limite apparaît aussi dans les résultats de la version 2. La progression annoncée est plus forte pour les bassins jaugés que pour les bassins non jaugés. Un évaluateur note même que l’utilisation de GraphCast améliore la performance absolue tout en laissant un écart important entre les deux catégories.
L’investissement dans l’IA ne doit donc pas concurrencer l’entretien des capteurs, la formation des services locaux ou le partage des données. Les deux approches sont complémentaires. De meilleures observations rendent les modèles plus fiables, tandis que de meilleurs modèles augmentent la valeur de chaque mesure.
Un outil public pour combler un retard mondial
Le rapport 2025 de l’Organisation météorologique mondiale indique que 119 pays, soit 60 % des États, déclarent disposer d’un système d’alerte multirisque. La progression est réelle, mais les écarts restent marqués, notamment dans les petits États insulaires et les régions aux ressources limitées.
Dans ce contexte, OpenHydroNet peut devenir un accélérateur. Une agence peut partir d’un modèle documenté, reproduire les expériences, le confronter à ses propres références puis contribuer à son amélioration. La licence ouverte rend également possibles des audits indépendants et des recherches sur les erreurs régionales.
Le principal enjeu ne sera pas de savoir combien de dépôts GitHub réutilisent le code, mais combien de services hydrologiques parviennent à transformer ce modèle en décisions plus précoces et plus fiables. Cela exige des partenariats durables, des financements, des standards d’interopérabilité et une évaluation publique des performances.
Une IA climatique plus utile quand elle reste contrôlable localement
L’ouverture d’OpenHydroNet illustre une évolution intéressante de l’intelligence artificielle appliquée au climat. La valeur ne réside plus seulement dans un modèle mondial opéré par une grande entreprise, mais dans la possibilité pour des institutions publiques de l’exécuter, de le modifier et de le confronter à leur terrain.
Cette autonomie rend l’outil plus crédible. Les prévisionnistes peuvent comprendre les données utilisées, mesurer les erreurs sur leurs bassins et conserver leurs méthodes de validation. Ils peuvent aussi refuser une prévision lorsqu’elle contredit des observations ou des connaissances locales solides.
OpenHydroNet n’est donc ni un système universel d’alerte ni une solution automatique aux inondations. C’est une brique hydrologique ouverte, issue d’un système déjà utilisé à grande échelle, qui peut raccourcir le chemin entre la recherche en IA et les services publics de prévention. Son impact dépendra désormais moins de Google que de la capacité de la communauté hydrologique à l’évaluer, l’adapter et l’intégrer avec prudence.
Références
- Google Research – The next chapter in flood resilience: Open sourcing Google’s hydrology framework
- GitHub – OpenHydroNet: Riverine Flood Forecasting
- Nature – Global prediction of extreme floods in ungauged watersheds
- EGUsphere – Extending Medium-Range Global Flood Forecasts: The Google Global Flood Forecasting Model Version 2
- Organisation météorologique mondiale – Global Status of Multi-Hazard Early Warning Systems 2025

