Vidéo

Widukind : Une base unique de données macroéconomiques internationales

De quoi Widukind est-il le nom ? D’abord d’un chef de guerre du VIIIe siècle entré dans la légende pour avoir (notamment) unifié les Saxons. Ensuite et par analogie, d’une plateforme offrant un accès libre et unique à des millions de données, sinon dispersées sur les sites des institutions qui produisent de la statistique nationale et internationale. Décryptage du projet avec Thomas Brand, chercheur au Cepremap, venu présenter la V1 du site à l’occasion d’une présentation organisée à France Stratégie le 13 juin 2016.

Publié le : 13/06/2016

Mis à jour le : 24/01/2025

Widukind : Une base unique de données macroéconomiques internationales

Créer une base unique de données économiques à partir d'institutions nationales et internationales, c'est l'ambition portée par le Cepremap en partenariat avec France Stratégie au travers du projet We Do Kind. Un serveur informatique en accès libre permettra de centraliser les données du FMI, de la Banque mondiale, d’Eurostat, de la BCE, de l’Insee, ainsi que celles d'Allemagne, du Royaume-Uni, etc. L'objectif est de simplifier au maximum la recherche de données économiques, non seulement pour les chercheurs et spécialistes, mais aussi pour l'ensemble de la société civile : journalistes, professeurs, associations. Près de 65 millions de séries de données brutes seront disponibles via le site internet ou depuis divers logiciels statistiques.

Le projet ne fournit pas d'informations supplémentaires par rapport à celles des fournisseurs, mais se concentre sur la simplification de la recherche. Il n'y aura pas d'harmonisation ni d'analyse des données. Toutes les données seront régulièrement mises à jour, vérifiées et vérifiables, avec une traçabilité permettant de remonter à leur source. Cela vise à éviter les controverses fréquentes dans le milieu de la recherche, où il était parfois difficile de sourcer certaines données avec exactitude.

L'ambition est de garantir la transparence des résultats avancés par les économistes, en offrant une vérification simple et rapide, presque en un clic. Cette plateforme pourra aussi répondre aux besoins d'autres domaines, comme les administrations publiques, pour construire et mettre à jour automatiquement des tableaux de bord économiques avec des indicateurs tels que le taux de chômage ou le taux d'inflation. Les journalistes soucieux de vérifier les faits trouveront également dans cet outil un moyen de valider les données avancées par des figures publiques ou politiques.

Cet outil est conçu pour garantir une transparence totale, utile également à la société civile, par exemple pour suivre les budgets publics des collectivités locales ou de l'État. We Do Kind permettra d'automatiser leur présentation et de les rendre accessibles aux citoyens, grâce à une plateforme totalement gratuite et open source.

Aux origines du projet

Le projet Widukind naît d’un constat en deux temps. Le premier est expérientiel : le travail de collecte de données est chronophage. « Un tel outil m’aurait fait gagner beaucoup de temps lorsque j’étais à France Stratégie », nous dit typiquement Thomas Brand. Le deuxième monte en généralité avec la prise de conscience que ce besoin est partagé au-delà du cercle académique. Par les entreprises et les administrations publiques qui produisent des tableaux de bord et des indicateurs de conjonctures, mais aussi par les data-journalistes et plus largement la société civile, à l’heure du fact-checking. Le travail d’élaboration de la plateforme est dès lors guidé par une triple exigence : simplifier la recherche de données, automatiser leur mise à jour et enfin rendre les résultats reproductibles. Avec un partenariat France Stratégie et un cofinancement du Programme d’investissement d’avenir (PIA), le projet Widukind est lancé et la version 1 du site voit le jour en juin 2016.

70 millions de séries dans une base unique

Concrètement comment ça marche ? Les données sont déchargées directement à partir du site de l’institut statistique qui les produit, sans harmonisation et en conservant leur arborescence ; elles sont mises à jour en temps réel et chaque révision est archivée. Gain pour l’utilisateur : la possibilité de télécharger gratuitement, à partir d’un site internet unique, les données économiques publiques publiées par les principaux organismes producteurs de statistiques (instituts nationaux de statistiques, Banques centrales) et internationaux (Banque mondiale, FMI, OCDE, Eurostat, BCE…). Le site permet déjà d’accéder à plus de soixante-dix millions de séries provenant de dix institutions et il continue d’étendre sa couverture au rythme de deux sources par mois (l’ONU et le BIT sont par exemple dans les tuyaux). Une quête d’exhaustivité qui demande une amélioration continue de la performance informatique de la plateforme.

En termes de navigation, l’utilisateur peut réaliser des requêtes par mots clés, en langage naturel ou en naviguant dans la structure des données de l’institut. Il peut télécharger des groupes complets de données simultanément (en clair faire des tableaux statistiques), depuis sa session de recherche sur serveur Web en formats standards ou depuis un logiciel de traitement statistique et économétrique à l’aide d’une API. Enfin, le projet est entièrement open source : tous les codes nécessaires pour le fonctionnement du serveur et le rapatriement des données sont disponibles sur GitHub.

Un hackathon en perspective

Prochaines étapes pour Widukind : trouver de nouveaux financements (où l’on retombe sur la question du modèle économique du logiciel libre), créer un forum pour engager la conversation avec les utilisateurs, prévoir une notice d’utilisation pour néophytes recensant les sigles et les adresses des institutions statistiques, étendre son réseau en direction notamment des acteurs de la société civile souhaitant exercer leur droit de regard sur les comptes publics… et la possible organisation d’un hackathon, projet collaboratif par excellence, en phase avec son objet : fournir un accès libre et simplifié à toute la donnée économique publique.

Pour aller plus loin

Suivez-nous sur les réseaux sociaux et Abonnez-vous à notre lettre d’information