Document de travail

Utiliser la presse pour construire un nouvel indicateur de perception d’inflation en France

Mise en ligne le 25 Août 2023
Auteurs : Olivier de Bandt, Jean-Charles Bricongne, Julien Denes, Alexandre Dhenin, Annabelle De Gaye, Pierre-Antoine Robert

Document de travail n°921. L’article applique des techniques de traitement du langage naturel (NLP) à quasiment l’ensemble des articles de journaux pour la France, en se concentrant sur la période 2004-2022, afin de mesurer l’attention à l’inflation ainsi que les perceptions des ménages et des entreprises pour ce pays. L’indicateur construit sous la forme d’un solde d’opinions est bien corrélé avec l’inflation effective, mesurée à partir de l’IPCH. Il présente également de bonnes propriétés en termes de prévision des anticipations d’inflation des ménages tirées de l’enquête de la Commission Européenne ; ainsi que de l’inflation mesurée par l’IPCH total. La méthode utilisée est une approche supervisée que nous décrivons étape par étape. Sa performance sur données françaises est meilleure que l’approche de type « Latent-Dirichlet-Allocation » (LDA) d’Angelico et al. (2022). L’indicateur peut être utilisé comme indicateur avancé en temps réel de l’évolution et des anticipations d’inflation. Il élargit également la palette d’indicateurs suivies par les banques centrales, à l’heure où elles lancent de nouveaux types d’enquêtes auprès des ménages et des entreprises.

Image Using the Press to Construct a New Indicator of Inflation Perceptions in France
Inflation Perception Press Indicator (LHS) and :
- survey-based Household inflation expectations
- HICP

La presse écrite diffuse une multitude d’informations sous forme de textes qui décrivent les évolutions économiques et peuvent contribuer à mesurer les anticipations des agents économiques. Disponibles tous les jours, les articles de journaux peuvent fournir une évaluation quasi-instantanée des pressions inflationnistes, ce qui peut être utile aux agents économiques et aux banques centrales. Ils complètent l'utilisation croissante par les banques centrales d'indicateurs des anticipations d'inflation provenant d'enquêtes auprès des entreprises ou des ménages, au-delà des indicateurs traditionnels dérivés des marchés financiers.

Il existe une littérature croissante qui utilise les techniques de traitement du langage naturel (NLP) et l'intelligence artificielle (IA) pour construire des indicateurs macro-économiques. Les premières applications ont porté sur l'analyse de l'évolution du PIB, mais les chercheurs étudient maintenant de nouvelles dimensions, avec une extension à l'évolution de l'inflation.

Le Document de Travail analyse plus d'un million d'articles de la presse écrite ou des agences de presse depuis 2004 en France, en utilisant une application disponible auprès de Dow Jones-Factiva. Sur la base d'un ensemble de 30 sources correspondant aux principaux quotidiens ou hebdomadaires de la presse nationale et régionale, papier et/ou en ligne, nous construisons des indicateurs de l'inflation perçue en France dans l'esprit des travaux d'Angelico et al. (2022) pour l'Italie.

La méthode est basée sur une sélection d'articles à l'aide de mots-clés (liés au champ sémantique "inflation" ou "prix") ainsi que d'algorithmes de filtrage et de classification. Ceux-ci permettent de sélectionner uniquement les articles qui traitent effectivement de l'inflation des biens et services et non d'autres sujets (par exemple les "prix" ou récompenses littéraires qui sont rédigés de la même manière en français), ou d'autres types d'inflation. Une distinction du sens des changements de prix est alors également faite (hausse, baisse ou stabilité), toujours sur la base d'algorithmes de classification.

Plusieurs techniques sont disponibles pour construire des indicateurs textuels et l'un des objectifs de l'article est de comparer leurs performances, en particulier entre les méthodes "supervisées" et "non supervisées". Les premières nécessitent ex ante une classification manuelle par des experts d’un échantillon d’articles pour entraîner le modèle, comme dans notre cas. Tandis que le second type de méthodes ne dépendent pas de l'intervention humaine pour l'entraînement, même si elles en ont besoin a posteriori, par exemple pour la sélection de thèmes (« topics ») pertinents, comme dans Angelico et al. (2022).

Nous fournissons tout d'abord une mesure de l'intensité de l'inflation (c'est-à-dire la fréquence des articles associés à l'inflation), car elle peut constituer une mesure utile de l' "attention" accordée à l'inflation par les médias et les acteurs économiques au sens de Korenok et al. (2022).

Cependant, le sens de l'inflation est également important et nous créons un indicateur qui signale la direction des prix et qui est construit comme un "solde d'opinions" inspiré par les enquêtes auprès des ménages et des entreprises. Nous constatons qu'un tel indicateur présente des propriétés statistiques intéressantes. L'indicateur est bien corrélé avec l'enquête de la Commission européenne auprès des ménages sur les anticipations d'inflation à un an (figure A). Par rapport à d'autres indicateurs d'anticipations d'inflation issus du Consensus Forecasts ou des marchés financiers, l'indicateur présente de meilleures propriétés prévisionnelles : il est toujours retenu par un algorithme de sélection automatique, incluant également diverses variables de contrôle (prix du pétrole en euro, cycle économique à court terme). Il est également bien corrélé avec l'inflation globale (figure B) et a un bon pouvoir de prévision pour l'inflation à un trimestre dans le cadre d'une courbe de Phillips.

Le signal fourni par l'indicateur n'est que légèrement différent lorsque nous excluons les articles exprimant le point de vue d'experts. À cette fin, nous établissons une distinction entre les experts et les non-experts et, dans la catégorie des experts, nous essayons également de faire la distinction entre les décideurs politiques et les autres experts du secteur privé, étant donné que les premiers peuvent disposer d'informations spécifiques sur l'évolution de l'inflation que nous ne voulons peut-être pas saisir.         

Nous montrons également que l'approche basée sur l'apprentissage automatique que nous mettons en œuvre est nettement plus performante pour la France que l'approche non supervisée proposée par Angelico et al. (2022), basée sur les LDA (Latent Dirichlet Allocations) ou seulement sur des bi-grammes.

Télécharger l'intégralité de la publication

Mise à jour le 25 Juillet 2024