« L’Open data Room de la Banque de France »

Christian Pfister est depuis janvier 2013 adjoint au directeur général des Statistiques de la Banque de France, après avoir été adjoint au directeur général des Études et des Relations Internationales. Il est président du Comité de Normalisation Obligataire (CNO) depuis octobre 2014. Enseignant à Sciences Po (cours « Financial Stability », avec Françoise Drumetz), il a publié dans les domaines de la politique monétaire, l’unification monétaire, la stabilité financière, l’épargne et le financement, l’économie monétaire internationale, les statistiques, le marché du travail et les réformes structurelles. Il est diplômé d’HEC et de Sciences Po.

1. Peux-tu présenter en quelques mots la DGS et les bases de données dont elle dispose ?

La DGS collecte, analyse et diffuse des statistiques dans un grand nombre de domaines.

Dans le cadre de réglementations internationales ou européennes, elle élabore les statistiques monétaires et financières,la balance des paiements et la position monétaire extérieure. Elle collecte à cette fin des données de dépôts, de crédit, de taux d’intérêt, d’émission et de détention de titre, auprès des institutions financières et notamment des banques. Elle collecte également des informations auprès des entreprises non financières. Ces données sont mises à disposition du public sous forme d’analyses périodiques brèves (« Stat Info ») ou de rapports. Elles sont également disponibles sous forme de séries agrégées téléchargeable dans le portail Webstat accessible via le site internet de la Banque de France.

La DGS diffuse par ces mêmes canaux les données collectées dans un cadre plus strictement national par d’autres métiers de la banque de France, telles que les données de crédit aux entreprises du Service central des risques et les résultats des enquêtes de conjonctures réalisées par le réseau, qui servent notamment à la prévision du PIB.

 

2. En quoi consiste l’Open Data Room et quels sont les acteurs mobilisés dans le cadre de ce projet ?

La Banque de France offre gratuitement l’accès effectif aux données confidentielles qu’elle détient dans le cadre d’une salle sécurisée (Open Data Room), après dé-identification et, le cas échéant, effacement d'autres informations. Un accord préalable du « Comité d’examen des demandes d’accès aux données de la Banque de France » est requis, ce comité composé de représentantsde la Banque et de personnalités du monde académique s’assurant seulement que le motif de la demande est bien un projet de recherche scientifique à des fins de publication. Fin 2017, ce sont près de 600 millions de séries qui sont accessibles aux chercheurs.

L’Open data room est gérée par la DGS, en partenariat avec les différents métiers de la Banque fournisseurs des données mises à disposition.

 

3. Comment se situe l’Open Data Room dans les dispositifs de diffusion de données de la DGS/Banque ?

La Banque de France diffuse via Webstat 30 000 séries agrégées sur son site internet. Par ailleurs, la Banque de France diffuse des séries statistiques aux organisations européennes et internationales (BCE, FMI, Eurostat, OCDE).

L’Open Data Room vise à mettre à disposition des chercheurs externes des données confidentielles sous forme anonymisée comme requis par les textes réglementaires qui régissent leur collecte.

 

4. Quel public cherche-t-on à cibler dans la mise à disposition des données via l’ODR ?

L’ODR s’adresse aux chercheurs publics ou privés, dans le cadre de projets menés à des fins scientifiques et non commerciales, par des équipes de recherche externes à la Banque de France ou bien mixtes, c’est-à-dire associant des chercheurs internes et des chercheurs externes.

 

5. Quelles sont les données accessibles aux chercheurs ? Quelles sont les fréquences et la profondeur historique de ces données ?

Les données individuelles mises à disposition couvrent un champ très large en termes de secteurs économiques et fournissent un détail élevé en termes d’opérations. Les chercheurs peuvent ainsi accéder aux bilans, compte de résultats des établissements de crédits, aux taux sur leurs dépôts et crédits. Les opérations interbancaires quotidiennes des banques françaises sont disponibles après un délai d’un an. Les données de titres portent sur les émissions de titres de créances et sur la détention titre par titre de chaque secteur institutionnel résidents. Pour les entreprises non financières, sont disponibles les liasses fiscales, les crédits accordées individuellement par les banques, les statistiques de défaillance. Pour les ménages, sont fournies des données de surendettement. Les opérations transfrontières couvrent des flux d’investissement direct et de portefeuille, de prêts et emprunts des banques, de transactions économiques des entreprises non financières.

La périodicité et la profondeur historique des données varient selon les bases de données. En général, toutes les échéances disponibles avec une qualité suffisante sont fournies. Certaines bases peuvent atteindre des volumétries telles que la manipulation en est rendue difficile. Il importe alors que le chercheur sélectionne les variables au plus près de ses besoins pour une efficacité optimale.

 

Quelles procédures doit-on suivre pour avoir accès aux données ?

Le chercheur doit compléter le formulaire téléchargeable sur la page https://www.banque-france.fr/statistiques/acces-aux-donnees-granulaires  et le transmettre à l’adresse électronique suivante DGS-DIMOS-acces-donnees-ut@banque-france.fr.  Chaque demande d’accès aux données fait l’objet d’une instruction par le secrétariat d’accès aux données et les experts méthodologiques. Des échanges avec le chercheur permettent de mieux préciser le type de données souhaitées en fonction des objectifs de la recherche.

L’accès aux données et les conditions d’utilisation font l’objet d’un accord préalable du Comité d’examen accès aux données (cf. 2).

 

6. La DGS ou la Banque de France exerce-t-elle un contrôle sur la thématique ou les thématiques des travaux nécessitant l’utilisation des données de la DOR ?

Le comité d’accès aux données ne porte aucun jugement de fond sur le projet et n’exerce pas de contrôle sur les thématiques étudiées. Il peut en revanche juger de l’adéquation des données dont dispose la Banque avec les objectifs du projet. En effet, la mise à disposition implique l’engagement de ressources non négligeables de la part de la Banque de France. Elle mobilise les équipes et les experts pour l’instruction et le formatage des données. Elle nécessite des ressources informatiques avancées. Il est donc important que ces ressources soient utilisées de manière efficiente.

Le comité d’accès aux données prête également une attention particulière à ce qu’aucune donnée sensible ne puisse être attribuée à un agent économique identifiable, même de manière indirecte. Ce risque juridique est doublement couvert par l’anonymisation des données et la signature de l’engagement de confidentialité par les membres des groupes de recherche.

 

7. La DGS ou la Banque est-elle censée avoir un droit de regard sur les résultats des travaux ? En d’autres termes, y-a-t-il des contreparties (priorités d’accès aux résultats des travaux, etc.) à l’accessibilité gratuite aux données ?

Là encore, la Banque n’a pas droit de regard sur le contenu et la pertinence des travaux. Elle veille seulement à ce que la confidentialité des données fournies soit respectée et que les ressources qu’elle a engagées soient utilisées de manière efficiente.

Les résultats font donc l’objet d’un contrôle formel par le secrétariat et les experts statistiques qui s’assurent avant restitution au chercheur que les produits ne permettent d’identifier aucune entité individuelle.

Afin de vérifier que les coûts engagés par la Banque donnent lieu à un bénéfice effectif pour la collectivité, il est également demandé depuis peu aux chercheurs de communiquer à la Banque de France les papiers écrits à partir des données transmises lorsqu’ils sont présentés en séminaire ou transmis à des revues.

 

8. Peut-on apparier d’autres sources de données avec celles de la DGS dans l’ODR ?

Si le chercheur le demande, les données portant sur une même entité et disponibles dans plusieurs bases de la Banque de France peuvent être anonymisées avec la même clé d’anonymisation. Le même procédé peut être appliqué entre les bases de données de la Banque et les bases externes, apportées par le chercheur, à condition qu’il ait le droit de les importer dans l’ODR et que le croisement ne permette pas l’identification indirecte.

 

9. Quels outils sont mis à la disposition des chercheurs pouvant avoir accès à l’ODR ?

Trois postes sont disponibles sur site et sont équipés par défaut des logiciels Anaconda3, MATLAB, Demetra, Notepad++, R, RStudio, SAS, Stata 14.

 

10. Quelles sont les modalités pratiques d’accès aux données ?

L’Open Data Room est localisée dans les locaux de la Banque de France – Direction générale des statistiques, 37 rue du Louvre 75002 Paris. L’Open Data Room est accessible du lundi au vendredi, de 10h à 18h. Lors de la première venue du groupe de recherche, le secrétariat de l’accès aux données accompagne ce dernier dans la prise en main des outils techniques et des bases de données, mettant en particulier à disposition les méthodologies associées. Tout au long des travaux, le secrétariat de l’accès aux données reste disponible pour accompagner les chercheurs, qui peuvent également contacter directement les experts statistiques responsables des bases de données.

 

11. Des modalités d’actualisation des données ont elles déjà été envisagées ?

L’actualisation des bases de données doit faire l’objet d’une demande d’extension du projet, validée par le Comité d’accès aux données. Il en est de même pour les demandes de données supplémentaires et les modifications de l’équipe de recherche.

 

12. Sans les citer nommément, peux-tu dire un mot sur les entités qui bénéficient déjà de l’offre de la Banque  relative à l’accès d’une partie de ses données ?

Pour l’essentiel, ce sont des universités, des grandes écoles ou des institutions publiques.

 

13. L’ « ouverture » aux bases de données est-elle également envisageable pour les chercheurs étrangers ?

Oui, nous avons ouvert l’accès aux données à des groupes de recherche étrangers. Nous envisageons même en 2018, la mise en place d’un site d’accès aux données de la Banque dans les locaux de celle-ci à New York. Enfin, la Banque de France participe à INEXDA, un projet international de partage d’expériences sur le traitement statistique des données granulaires à des fins de recherche. La participation à INEXDA est ouverte à l’ensemble des banques centrales, instituts nationaux de statistiques et organisations internationales.

Mis à jour le : 08/01/2018 16:44