Un typhon annoncé quatre jours à l'avance alors que les agences officielles visaient plusieurs centaines de kilomètres à côté. Une tempête de sable irakienne détectée avec peu de données disponibles. Aurora, le modèle d'intelligence artificielle développé par Microsoft, affiche des performances qui commencent sérieusement à bousculer le monde de la prévision météorologique.
Un modèle entraîné sur plus d'un million d'heures de données atmosphériques
Ce qui distingue
Aurora dès le départ, c'est l'ampleur des données sur lesquelles il a été formé : plus d'un million d'heures de relevés atmosphériques mondiaux, issus de stations météo, d'images satellites et de mesures radar. Les chercheurs de Microsoft estiment qu'il s'agit du plus grand jeu de données jamais utilisé pour entraîner un
modèle d'IA météorologique. Ce volume massif n'est pas une coquetterie technique — c'est ce qui permet au système de détecter des patterns que des modèles plus étroits ratent complètement.
Aurora appartient à la famille des
modèles de fondation, le même type d'architecture qui propulse des outils comme ChatGPT. L'idée centrale : apprendre des régularités générales à partir de données très variées, plutôt que d'être programmé pour une tâche unique. Résultat, le modèle peut être adapté à des scénarios très différents avec relativement peu de données supplémentaires — un avantage considérable par rapport aux modèles physiques traditionnels, qui nécessitent souvent d'être entièrement reconstruits pour changer d'application.
Les résultats ont été publiés le 21 mai dans la revue
Nature.
Des performances qui surpassent les agences officielles
Les chiffres avancés par les chercheurs sont difficiles à ignorer. Sur une
période de prévision de 14 jours, Aurora a fait mieux que les systèmes existants dans 91 % des cas. Il a également surpassé les modèles de simulation océanique dans 86 % des tests de prévision de la hauteur et de la direction des vagues.
Mais c'est peut-être l'épisode du
typhon Doksuri qui illustre le mieux ce que le modèle a dans le ventre. En juillet 2023, quatre jours avant que la tempête ne touche les Philippines, les prévisions officielles — y compris celles du Centre national des ouragans américain et du Joint Typhoon Warning Center — plaçaient le point de landfall sur Taïwan, à plusieurs centaines de kilomètres de là. Aurora, lui, avait la bonne trajectoire.
Est-ce que ça veut dire que l'IA va remplacer les prévisionnistes ? Probablement pas de sitôt. Mais ce type d'écart dans la prévision de trajectoire, sur un cyclone tropical, a des conséquences directes sur les décisions d'évacuation. Quelques centaines de kilomètres d'erreur, et des zones entières peuvent se retrouver sous-préparées.
Ce qu'Aurora peut faire que les modèles classiques peinent à réaliser
La prévision des
événements extrêmes est précisément là où les modèles physiques traditionnels montrent leurs limites. Ces événements sont rares, statistiquement, et les données historiques pour les calibrer sont souvent insuffisantes. Aurora contourne en partie ce problème en extrayant des signaux utiles même à partir de données lacunaires.
Exemple concret : lors d'une
tempête de sable majeure en Irak en 2022, le modèle a réussi à prévoir l'événement malgré un accès limité aux données de qualité de l'air. Ce n'est pas anodin dans une région où ce type de phénomène peut paralyser des villes entières et provoquer des crises sanitaires.
Voici ce que Aurora peut couvrir dans un seul et même modèle :
- Trajectoires et intensités des ouragans et typhons
- Prévisions de hauteur et direction des vagues océaniques
- Qualité de l'air et phénomènes de transport de poussières
- Conditions atmosphériques globales sur 14 jours glissants
L'objectif à terme, selon les chercheurs, est de développer ce qu'ils appellent l'
Earth system forecasting : un modèle unique capable de simuler simultanément la météo, la qualité de l'air et les conditions océaniques. Une sorte de jumeau numérique de l'atmosphère terrestre.
Une IA déjà déployée, et accessible aux chercheurs
Microsoft ne garde pas Aurora dans un laboratoire. Le code et les données d'entraînement ont été rendus publics pour la communauté scientifique. Le modèle est déjà intégré dans
MSN Weather, lui-même présent dans l'application Météo de Windows et les résultats Bing.
C'est un choix stratégique intéressant. En rendant le modèle accessible, Microsoft ouvre la porte à des adaptations locales — y compris dans des pays qui n'ont pas accès à des infrastructures de calcul intensif.
Megan Stanley, chercheuse senior chez Microsoft et co-auteure de l'étude, l'a formulé clairement : le potentiel est particulièrement fort pour les régions "mal desservies par les capacités météorologiques existantes".
- Vitesse de génération des prévisions : jusqu'à 5 000 fois plus rapide que les modèles sur superordinateurs
- Taux de surperformance sur 14 jours : 91 % des cas face aux systèmes de référence
- Données d'entraînement : plus d'un million d'heures de relevés atmosphériques mondiaux
Le
changement climatique intensifie les événements extrêmes et les rend plus difficiles à modéliser avec des outils conçus pour un climat stable. Des modèles comme Aurora n'arrivent pas trop tôt.