Quel est la précision des cartes de la pollution de l'air rue-par-rue? S’abonner
La robustesse et la précision de chaque carte produite par notre système est garantie par un processus de validation rigoureux qui vise deux objectifs:
-
S’assurer que nous ne “sur-apprenons” pas: le sur-apprentissage est un écueil classique en science des données qui voit le modèle réaliser de très bonne prévisions à proximité des stations de mesure où de nombreuses données d’apprentissage sont disponibles (typiquement dans des villes avec un réseau dense de stations de mesure), mais au risque de réaliser des prévisions potentiellement très fausses aux géographies plus éloignées des stations des mesure.
-
Mesurer à quel point nos prévisions sont proches de la réalité.
Nous utilisons une technique appelée “validation croisée” pour tester notre système de cartographie: cela signifie qu’en phase de test, notre modélisation n’utilise que 80% des données de stations de mesure disponible et que la précision des prévisions est évaluée sur les 20% de données restantes. De cette façon, nos prévisions peuvent être évaluées en utilisant de vraies mesures.
Illustration: Evaluation de la précision de notre carte à l’échelle de la rue à un temps donné.
Regardons par exemple l’évaluation de nos prévisions à l’échelle de la rue dans la centaine de villes que nous couvrons pour une date prise au hasard: le 5 décembre 2019 à 11h UTC.
Il apparaît sur la figure ci dessous qu’il existe une très forte corrélation entre la qualité de l’air mesurée par les stations de mesure et celle prédite par nos modèles.
Cela signifie que nos modèles sont très performants pour capturer la variabilité spatiale de la qualité de l’air, et c’est ce qui nous permet de construire les cartes à l’échelle de la rue.
Figure: Concentrations prédites aux stations de mesure en fonction de la concentration mesurée
Par ailleurs, comme le montre la table suivante, l’erreur moyenne de nos prévisions reste basse (en dessous de 5 pour tous les polluants, en Plume AQI).
Tableau: Différence absolue moyenne entre la concentration prédite aux stations de mesure et la concentration mesurée.
Erreur absolue moyenne (Plume AQI) |
|
NO2 |
4.5 |
O3 |
2.5 |
PM2.5 |
4.7 |
PM10 |
4.6 |
Les résultats de cette évaluation réalisée à d’autres dates donnent des corrélations et erreurs absolues moyennes similaires à celles présentées ici.
En conclusion, nos cartes à l’échelle de la rue sont capables de reproduire la variabilité spatiale de la qualité de l’air dans les plus grandes villes du monde, avec une grande précision et un faible niveau d’erreur.
Commentaires
0 commentaire
Vous devez vous connecter pour laisser un commentaire.