Document de travail

« Satellites turn concrete » ou comment suivre la production de ciment grâce aux données satellites et aux réseaux de neurones

Mise en ligne le 27 Juin 2023
Auteurs : Jean-Charles Bricongne, Baptiste Meunier, Alexandre d’Aspremont , Simon Ben Arous, Benjamin Lietti

Document de travail n°916. La crise de la Covid-19 a démontré la nécessité d’utiliser des données alternatives, disponibles en temps réel, avec une couverture globale. Cet article exploite des images satellites infra-rouge pour suivre l’activité économique dans les pays avancés et émergents. Un cadre pour lire, nettoyer et exploiter les images satellites est d’abord développé. Un algorithme basé sur les lois de la physique et les techniques d’apprentissage automatique est construit pour détecter la chaleur produite par les usines de ciment en activité. Cela permet de détecter en temps réel si une usine de ciment est en train de produire. Utilisant cette information sur plus de 500 usines, nous construisons un indice basé sur les données satellites qui suit l’activité. L’utilisation de cet indice basé sur données satellites affiche de meilleures performances que des modèles de référence et des indicateurs alternatifs pour le nowcasting de la production de l’industrie du ciment ainsi que pour l’activité du secteur de la construction. En exploitant la granularité de nos données journalières et disponibles au niveau des usines, nous trouvons qu’une utilisation des réseaux de neurones permet d’obtenir des prévisions de meilleure qualité. Dans l’ensemble, la combinaison d’images satellites et d’apprentissage automatique permet un suivi adéquat de l’activité industrielle.

Image Images satellite d'une cimenterie en Chine Description « Satellites turn concrete » ou comment suivre la production de ciment grâce aux données satellites et aux réseaux de neurones

L'évaluation de l'activité économique à partir de l'espace serait d'un grand intérêt car les données satellitaires sont diffusées en temps quasi réel, ont une couverture mondiale et une qualité uniforme, et sont libres d'utilisation. La combinaison de ces avantages contraste avec les sources de données habituelles qui sont le plus souvent diffusées avec un décalage important, dont la qualité et la fiabilité varient beaucoup d'un pays à l'autre et qui sont coûteuses. En outre, le nombre croissant de satellites, leur sophistication et la diffusion de leurs données dans le domaine public ont fait des données satellitaires une source de plus en plus prometteuse d'informations en temps réel.

Cependant, pour suivre l'économie par satellite, il faut un signal visible depuis l'espace : à cette fin, nous exploitons la chaleur produite par les cimenteries. La fabrication du ciment comprend en effet une étape où les matières premières sont chauffées à environ 1450°C dans de grands fours. Cette chaleur peut être détectée à l'aide d'images satellites dans le spectre infrarouge. Il y a d'autres intérêts à se concentrer sur l'industrie du ciment : le ciment est un produit de base largement utilisé, nécessaire à la fois dans les économies avancées et en développement, et le ciment est généralement consommé localement, car son faible coût fait qu'il n'est pas rentable de l'expédier sur de longues distances. L'utilisation de ces images satellite est une première contribution de cet article, alors que la littérature essayant d'exploiter les données satellite s'est jusqu'à présent concentrée sur les lumières nocturnes (Donaldson et Storeygard, 2016) et plus récemment sur la pollution de l'air (Bricongne et al., 2021).

Nous proposons une méthode pour exploiter les images satellitaires infrarouges et détecter automatiquement la chaleur, en utilisant les lois de la physique et l'apprentissage automatique. L'idée de la détection de la chaleur vient de la loi de Planck qui décrit la réflectance (rayonnement électromagnétique) émise par un objet. En examinant les images satellites infrarouges des fours des cimenteries, nous appliquons une série d'algorithmes basés sur la loi de Planck pour déterminer si le four fonctionne ou non. La partie gauche de la figure N1 montre un exemple de cimenterie en fonctionnement avec différents fours "chauds" (en rouge). La même cimenterie est représentée dans la partie droite de la figure N1 pendant le confinement lié à la Covid-19, où aucune chaleur n'est détectée car l'usine a été complètement arrêtée. Nous appliquons cette procédure à environ 500 cimenteries dans le monde pour évaluer leur activité. Les données satellitaires sont également corrigées pour tenir compte de la nébulosité - à l'aide d'un algorithme d'IA pour la reconnaissance d'images - et interpolées - à l'aide d'un algorithme d'apprentissage automatique, l'Extreme Gradient Boosting. Au final, on obtient un indice satellitaire en temps réel de l'activité des cimenteries, quotidiennement et pour chaque usine suivie. Une deuxième contribution consiste à mettre en place une procédure de lecture, d'exploitation et de nettoyage des images satellite, en combinant des algorithmes basés sur la physique et l'apprentissage automatique.

Nous testons ensuite le pouvoir prédictif de notre indice d'activité par satellite pour prévoir la production de ciment et l'activité générale dans le secteur de la construction. Nous constatons qu'il surpasse les indices de référence, y compris les modèles basés sur des indicateurs alternatifs. Nous commençons par un modèle linéaire utilisant l'indice satellite et un terme autorégressif pour prévoir la production de ciment. Nous constatons qu'il est plus performant que les modèles de référence habituels (marche aléatoire et modèle autorégressif) ainsi que les modèles linéaires similaires basés sur des indicateurs de la construction (permis de construire, indices PMI et Google Trends). Mais alors que ce premier modèle utilise l'indice satellite agrégé à une fréquence mensuelle et au niveau du pays, dans une deuxième étape, nous explorons la granularité de nos indices satellites quotidiens et au niveau de l'usine. Nous utilisons un MIDAS pour exploiter la fréquence quotidienne, un LASSO pour exploiter la dimension au niveau de l’usine, et un LASSO-MIDAS pour explorer ces deux dimensions spatiales et temporelles. Nous constatons cependant que la précision est en moyenne similaire lorsque nous utilisons ces modèles sur des données désagrégées - par rapport au modèle des MCO utilisant des données agrégées à une fréquence mensuelle et au niveau du pays.

Enfin, nous utilisons des réseaux neuronaux pour prédire la production de ciment et nous constatons qu'ils sont nettement plus performants que le modèle des MCO. Les réseaux neuronaux sont des méthodes non linéaires très flexibles qui présentent le double avantage : d'être très flexibles et d'être plus performantes que d'autres approches dans la récente littérature sur l'apprentissage automatique. Conformément à la littérature, nous utilisons un perceptron multicouche avec peu de couches cachées en raison de la petite taille de l'échantillon. Dans l'ensemble, les réseaux neuronaux sont nettement plus performants que le modèle linéaire, et donc que les modèles de référence. Il s'agit là d'une autre contribution : les réseaux neuronaux peuvent être utiles pour le nowcasting en macroéconomie - en complément des applications récentes de nowcasting du PIB (Woloszko, 2020) et du commerce (Hopp, 2021).

Télécharger l'intégralité de la publication

Mise à jour le 25 Juillet 2024