Aurora, l'IA de Microsoft qui prédit ouragans et tempêtes de sable 5 000 fois plus vite que les superordinateurs

Un typhon annoncé quatre jours à l'avance alors que les agences officielles visaient plusieurs centaines de kilomètres à côté. Une tempête de sable irakienne détectée avec peu de données disponibles. Aurora, le modèle d'intelligence artificielle développé par Microsoft, affiche des performances qui commencent sérieusement à bousculer le monde de la prévision météorologique.

Un modèle entraîné sur plus d'un million d'heures de données atmosphériques

Ce qui distingue Aurora dès le départ, c'est l'ampleur des données sur lesquelles il a été formé : plus d'un million d'heures de relevés atmosphériques mondiaux, issus de stations météo, d'images satellites et de mesures radar. Les chercheurs de Microsoft estiment qu'il s'agit du plus grand jeu de données jamais utilisé pour entraîner un modèle d'IA météorologique. Ce volume massif n'est pas une coquetterie technique — c'est ce qui permet au système de détecter des patterns que des modèles plus étroits ratent complètement. Aurora appartient à la famille des modèles de fondation, le même type d'architecture qui propulse des outils comme ChatGPT. L'idée centrale : apprendre des régularités générales à partir de données très variées, plutôt que d'être programmé pour une tâche unique. Résultat, le modèle peut être adapté à des scénarios très différents avec relativement peu de données supplémentaires — un avantage considérable par rapport aux modèles physiques traditionnels, qui nécessitent souvent d'être entièrement reconstruits pour changer d'application. Les résultats ont été publiés le 21 mai dans la revue Nature.

Des performances qui surpassent les agences officielles

Les chiffres avancés par les chercheurs sont difficiles à ignorer. Sur une période de prévision de 14 jours, Aurora a fait mieux que les systèmes existants dans 91 % des cas. Il a également surpassé les modèles de simulation océanique dans 86 % des tests de prévision de la hauteur et de la direction des vagues. Mais c'est peut-être l'épisode du typhon Doksuri qui illustre le mieux ce que le modèle a dans le ventre. En juillet 2023, quatre jours avant que la tempête ne touche les Philippines, les prévisions officielles — y compris celles du Centre national des ouragans américain et du Joint Typhoon Warning Center — plaçaient le point de landfall sur Taïwan, à plusieurs centaines de kilomètres de là. Aurora, lui, avait la bonne trajectoire. Est-ce que ça veut dire que l'IA va remplacer les prévisionnistes ? Probablement pas de sitôt. Mais ce type d'écart dans la prévision de trajectoire, sur un cyclone tropical, a des conséquences directes sur les décisions d'évacuation. Quelques centaines de kilomètres d'erreur, et des zones entières peuvent se retrouver sous-préparées.

Ce qu'Aurora peut faire que les modèles classiques peinent à réaliser

La prévision des événements extrêmes est précisément là où les modèles physiques traditionnels montrent leurs limites. Ces événements sont rares, statistiquement, et les données historiques pour les calibrer sont souvent insuffisantes. Aurora contourne en partie ce problème en extrayant des signaux utiles même à partir de données lacunaires. Exemple concret : lors d'une tempête de sable majeure en Irak en 2022, le modèle a réussi à prévoir l'événement malgré un accès limité aux données de qualité de l'air. Ce n'est pas anodin dans une région où ce type de phénomène peut paralyser des villes entières et provoquer des crises sanitaires. Voici ce que Aurora peut couvrir dans un seul et même modèle :

Trajectoires et intensités des ouragans et typhons
Prévisions de hauteur et direction des vagues océaniques
Qualité de l'air et phénomènes de transport de poussières
Conditions atmosphériques globales sur 14 jours glissants

L'objectif à terme, selon les chercheurs, est de développer ce qu'ils appellent l'Earth system forecasting : un modèle unique capable de simuler simultanément la météo, la qualité de l'air et les conditions océaniques. Une sorte de jumeau numérique de l'atmosphère terrestre.

Une IA déjà déployée, et accessible aux chercheurs

Microsoft ne garde pas Aurora dans un laboratoire. Le code et les données d'entraînement ont été rendus publics pour la communauté scientifique. Le modèle est déjà intégré dans MSN Weather, lui-même présent dans l'application Météo de Windows et les résultats Bing. C'est un choix stratégique intéressant. En rendant le modèle accessible, Microsoft ouvre la porte à des adaptations locales — y compris dans des pays qui n'ont pas accès à des infrastructures de calcul intensif. Megan Stanley, chercheuse senior chez Microsoft et co-auteure de l'étude, l'a formulé clairement : le potentiel est particulièrement fort pour les régions "mal desservies par les capacités météorologiques existantes".

Vitesse de génération des prévisions : jusqu'à 5 000 fois plus rapide que les modèles sur superordinateurs
Taux de surperformance sur 14 jours : 91 % des cas face aux systèmes de référence
Données d'entraînement : plus d'un million d'heures de relevés atmosphériques mondiaux

Le changement climatique intensifie les événements extrêmes et les rend plus difficiles à modéliser avec des outils conçus pour un climat stable. Des modèles comme Aurora n'arrivent pas trop tôt.