Au cours des dernières années, le text mining s'est développé en économie, en particulier en relation avec les banques centrales, comme le montre la figure 1 qui indique le nombre d'occurrences dans les articles enregistrés dans Google Scholar avec les mots clés « text analysis » et « central bank ». Parmi d'autres acteurs, les banques centrales et les institutions de supervision l'ont mobilisé pour des usages multiples, en lien avec leurs missions.
Le text mining est un outil polyvalent pour évaluer les perspectives économiques dans lesquelles les banques centrales opèrent, notamment en tant que moyen innovant de mesurer les attentes en matière d'inflation. Au-delà de l'inflation, le text mining contient également des informations significatives pour la prévision de variables clés telles que le PIB, la consommation privée ou l'emploi. Des recherches ont montré que les indicateurs textuels conservent leur importance pour les prévisions même après avoir contrôlé des indicateurs traditionnels, ce qui suggère que le texte capture des informations qui ne seraient pas reflétées par les indicateurs habituels.
Il s'agit également d'un outil essentiel pour évaluer les risques pour la stabilité financière, tant au niveau macro (à l'échelle de l'économie) qu'au niveau micro (pour les institutions financières individuelles). La littérature économique montre un lien clair entre l'analyse de sentiment basée sur le texte et les marchés financiers, démontrant comment la saisie du sentiment des investisseurs par le texte peut aider à prédire les rendements du marché.
Au-delà des marchés financiers, le text mining peut également aider à superviser les institutions financières individuelles. Alors que les banques centrales prennent de plus en plus en compte des questions telles que le défi climatique, le text mining permet également d'évaluer la perception des risques liés au climat et l'état de préparation des banques.
L'analyse de la communication des banques centrales fournit un outil de retour d'information sur la manière de transmettre au mieux les décisions. La communication des banques centrales transmet des informations à l'extérieur des banques centrales et peut être étudiée, à l'aide de l'analyse de texte, pour évaluer son impact sur les marchés financiers. La communication peut en effet être un outil efficace pour les banques centrales car elle peut avoir un impact sur les marchés financiers, augmenter la prévisibilité des actions de politique monétaire et aider à atteindre les objectifs macroéconomiques. Outre les marchés financiers, les banques centrales ciblent de plus en plus les non-experts. Par exemple, les tweets des banques centrales annonçant le lancement de nouvelles pièces et de nouveaux billets de banque, et ceux liés aux décisions de politique monétaire, semblent être associés à un plus grand engagement de la part du public.
Il est important de noter que, bien que puissant, le text mining complète - et non remplace - les indicateurs et procédures habituels des banques centrales. La littérature conclut généralement qu'une combinaison d'indicateurs textuels et traditionnels est plus adéquate. Au-delà des problèmes techniques au stade du prétraitement (par exemple, texte multilingue), les techniques de text mining peuvent poser des problèmes d'interprétation. En effet, un mot peut avoir plusieurs significations et être interprété de multiples façons : une telle ambiguïté entraîne du bruit dans les données. En outre, l'analyse de sentiment repose souvent sur une classification binaire des mots positifs et négatifs, mais plusieurs nuances typiques telles que la négation, l'ironie, l'ambiguïté, les idiomes et les néologismes, rendent une telle classification binaire probablement trop simpliste.
À l'avenir, l'IA générative ouvre également de nouvelles frontières pour l'utilisation des données textuelles, par exemple pour l'idéation et le retour d'information, la rédaction, la recherche documentaire, l'analyse de données, le codage ou les dérivations mathématiques. Cependant, la littérature reconnaît également les défis associés au biais, à l'interprétabilité et à la reproductibilité, qui semblent importants lorsque l'on considère les LLM dans la politique monétaire.
Mots-clés : analyse textuelle, analyse de sentiment, banques centrales, IA générative, modèles de langage
JEL classification: C38, C55, C82, E58, L82