Bloc-notes Éco

Pourquoi et comment suivre la production de ciment par satellite

8 Novembre 2023
Auteurs : Jean-Charles Bricongne, Baptiste Meunier, Benjamin Lietti

Billet n°326. Pour suivre l’économie mondiale en temps réel, la détection satellite de la chaleur émise par les cimenteries en activité permet de construire un indicateur de production. Cet indicateur, utilisé dans un modèle de réseau de neurones pour prédire l'activité dans la construction, affiche d’excellentes performances comparé à des modèles de référence et à d’autres indicateurs. 

Image Graphique 1. Image satellite d’une cimenterie en Chine (Avant/Pendant la Covid-19)
Graphique 1. Image satellite d’une cimenterie en Chine (Avant/Pendant la Covid-19)
Source : Sentinel-2, auteurs à partir des données de Kayrros
Note : Les pixels colorés en rouge sont ceux pour lesquels l’algorithme détecte la chaleur des fours à ciment
Le ciment, un candidat idéal pour le suivi de l’activité économique 

Le ciment est la base d’une grande partie des infrastructures construites par l’Homme, faisant de lui le deuxième matériau le plus utilisé dans le monde après l’eau. La localisation exacte de l’ensemble des usines, disponible sur le site de référence cemnet.com, permet de repérer leurs fours et de les localiser en vue d’un suivi par satellite. De plus, le ciment présente de très nombreuses caractéristiques qui font de lui un indicateur économique adapté.

Tout d’abord, lors de sa production, la matière première est soumise à une chaleur intense dans un four, avoisinant les 1500°C, qui peut être détectée par les capteurs infrarouges des satellites.

Deuxièmement, les importantes dépenses énergétiques requises pour faire fonctionner un four impliquent qu’un four en activité produit à pleine capacité pour rentabiliser au maximum ses frais de fonctionnement. Autrement dit, il est raisonnable de supposer que si un four est identifié comme actif, il produit sa capacité maximale (qui est une donnée publique) : cela permet d’estimer le volume de production à partir du nombre de fours allumés. De plus, en général, l’essentiel de la production est consommé localement (en France, les importations représentent 15% de la production et proviennent majoritairement de Belgique et d’Espagne (INSEE)), reliant ainsi production et consommation au niveau local.

Finalement, le ciment étant un matériau instable et très sensible à l’humidité, il est généralement consommé peu de temps après sa production. Toutes ces caractéristiques permettent donc le développement d’un indicateur a priori fortement corrélé avec l’activité dans le secteur de la construction.

Le satellite : des données mondiales, uniformes et en temps réel au service des économistes 

Notre récent article (d’Aspremont et al., 2023) exploite des données satellite disponibles en temps réel et gratuitement, avec une couverture mondiale et uniforme. La combinaison de ces avantages contraste avec les données officielles de production industrielle qui sont le plus souvent publiées par les instituts nationaux de statistiques avec un délai variable, et dont la qualité, la comparabilité et la fiabilité peuvent aussi varier selon les pays.

Alors que la littérature essayant d’exploiter les données satellite s’est jusqu’à présent concentrée sur les lumières nocturnes (Donaldson et Storeygard, 2016) et plus récemment sur la pollution de l’air (Bricongne et al., 2021), nous utilisons une source de données encore inexploitée en économie : les données infrarouges.

Cela est possible grâce aux satellites Sentinel-2 lancés par l’Agence Spatiale Européenne en 2017. En analysant l’intensité des émissions des différentes bandes du spectre infrarouge captées par ces satellites, notre algorithme parvient à définir si un objet au sol est chaud et situé dans une cimenterie. 

Sur les images satellite, les nuages peuvent perturber les mesures d’émissions infrarouges. À l’aide d’un réseau de neurones entraîné à reconnaître les nuages sur des images, il est possible de repérer automatiquement la couverture nuageuse. Si elle est trop importante, les observations sont exclues afin de préserver la qualité de notre indicateur. 

Finalement, nous interpolons les données manquantes (car la période de revisite des satellites est d’environ 4 jours) avec un algorithme d’apprentissage automatique de gradient boosting. In fine, cela donne un indice quotidien d’activité disponible en temps quasi-réel des cimenteries pour les 38 pays de notre échantillon disposant de statistiques officielles mensuelles (25 avancés et 13 émergents) et couverts par nos données satellites, similaire à l’exemple du graphique 2.
 

Image Graphique 2. Indice d’activité des cimenteries pour la Chine (moyenne mobile sur 7 jours)
Graphique 2. Indice d’activité des cimenteries pour la Chine (moyenne mobile sur 7 jours)
Source : Sentinel-2, auteurs, Kayrros
Note : L’indice représente le taux d’utilisation de la capacité de production d’un pays, égal à la moyenne du taux d’utilisation de chaque cimenterie (ex : 0.2 si 1 four sur 5 produit), pondéré par sa capacité.
Un indicateur innovant et plus performant que les modèles de référence 


Nous testons ensuite la capacité de notre indice à prévoir la production de ciment et l'activité dans la construction. Le ciment étant un constituant clé du béton, matériau le plus utilisé au monde dans la construction d'après Infociments, ces deux variables sont donc fortement corrélées. Les performances de cet indicateur surpassent les modèles de référence. 

Tout d’abord, nous agrégeons notre indice journalier au niveau mensuel afin de le faire correspondre à la fréquence des données officielles et utilisons un modèle linéaire entre cet indice et les statistiques officielles de production de ciment ou d'activité dans la construction (obtenues auprès d’instituts nationaux de statistique). Ce modèle basé sur notre indice satellite donne des prévisions plus précises que des modèles basiques habituels (marche aléatoire et modèle autorégressif) mais aussi que des modèles linéaires de référence basés sur des indicateurs usuels de la construction (permis de construire, enquêtes PMI auprès des directeurs d’achats et Google Trends). En moyenne, le modèle linéaire utilisant les données satellite permet des gains de précision (mesurée par l’erreur quadratique moyenne des prévisions hors échantillon) de l’ordre de 30% par rapport à une marche aléatoire, de 10% par rapport à un modèle autorégressif, et de 7-10% par rapport aux modèles utilisant les autres indicateurs usuels.

Nous explorons finalement un type de régression non-linéaire en utilisant des réseaux de neurones. Leurs performances sont supérieures à celles du modèle linéaire, avec des gains de précision de l’ordre de 10% en moyenne – et proches de 40% pour certains pays (par ex. la Russie). Le graphique 3 montre ainsi que les prévisions avec réseaux de neurones sont très proches des statistiques de production pour la Chine et les États-Unis, améliorant respectivement de 10% et 12% la précision par rapport au modèle OLS. Il s'agit là d'une autre contribution de notre étude : les réseaux neuronaux peuvent être utiles pour le nowcasting (prévisions sur le présent ou le passé récent, donnant des signaux avancés par rapport aux chiffres officiels) en macroéconomie. Cela confirme des applications récentes de nowcasting avec réseaux de neurones pour le PIB (Woloszko, 2020) et le commerce (Hopp, 2021).

De plus, puisque notre indicateur est basé sur des données de haute précision mesurées en temps quasi-réel, il nous permet de détecter rapidement toute perturbation affectant l’économie. La troisième partie du graphique 3 exprime, en pourcentage, la différence d’activité entre les cimenteries de la province du Hubei et celles du reste de la Chine : il est possible de détecter immédiatement l’effet de la Covid-19.
 

Image Graphique 3. Prévision de production de ciment avec réseaux de neurones
Graphique 3. Prévision de production de ciment avec réseaux de neurones
Source : Sentinel-2, auteurs, Kayrros, USGS et National Bureau of Statistics of China
Note : Production estimée des États-Unis et de la Chine (plus de 50% de la production mondiale : Cf. Cembureau). Données brutes en niveau (CVS-CJO dans l’article).

Ces résultats ouvrent de nombreuses perspectives. Tout d’abord, ils montrent que l’on peut reproduire des statistiques officielles plus rapidement - et éventuellement à haute fréquence, ce qui peut être intéressant dans une période comme celle de la Covid-19. Ensuite, ce qui est réalisé avec le ciment peut s’étendre à d’autres activités émettant de la chaleur comme l’acier ou le verre. Les pays émergents et en développement sont couverts de la même façon que les pays développés, permettant un suivi où les statistiques officielles font défaut. Enfin, l’activité peut être étudiée au niveau infranational comme pour les États-Unis dans notre article, si le nombre d’usines est suffisant.

Télécharger l'intégralité de la publication