Pour être data centric faut-il centraliser ? – Compte-rendu du talk de Julien Assemat et Renaud Andrieux à la Duck Conf 2021

Et toi, tu es data-centric?

« Devenir data-centric » : depuis plusieurs années, placer la data au cœur de la stratégie est devenu le leitmotiv des entreprises.

Seulement voilà, dans “data-centric”, il y a un (h)ic que Julien (architecte) et Renaud (spécialisé dans le développement des data offices) s’attèlent à décortiquer. Ils déconstruisent pour nous les promesses de la centralisation, généralement à l’origine de forces (data)centrifuges pénalisantes pour une organisation. Ce talk nous ouvre également des perspectives vers un fonctionnement data-centré, catalyseur efficace d’une transformation data-centric.

Promesse #1 : Une plateforme centrale pour tous

La centralisation des données se matérialise par l’émergence de plateformes data, dont les capacités ont progressé d’approches BI / Analytics jusqu’aux traitements massifs de données, le tout bouleversé par la démocratisation du cloud. Leurs usages sont de typologies différentes, exploratoires ou opérationnels, ce qui implique des niveaux de service variables difficiles à concilier, entre stabilité d’une production robuste et innovation. Cette dichotomie impacte l’organisation à plusieurs niveaux :

  • Une centralisation des expertises et compétences à l’origine d’un goulot d’étranglement et réduisant l’autonomie des entités.
  • Une implication limitée des entités dans la construction d’une offre de service pas toujours alignée avec leurs enjeux propres.

L’efficacité opérationnelle devient alors contrainte et l’adoption est limitée, ce qui se peut traduire par l’apparition de plateformes locales pirates.                                                                                Comment créer une vision unifiée de la donnée, en fédérant les entités sans altérer leur autonomie ni leur capacité de délivrer à l’échelle ?

Promesse #2 : Centraliser pour dé-siloter

À priori vecteur de partage et de collaboration, le dé-silotage est un cheval de bataille de la centralisation, et les silos ont bien mauvaise presse. À juste titre ?

Prenons l’exemple d’une bibliothèque. La simple cohabitation d’un ensemble d’ouvrages est-elle une condition suffisante pour faire lire et circuler les idées ?

Non. Le lecteur a besoin d’un accès guidé vers des rayons organisés logiquement et dont il peut s’approprier la structure. Et si les livres ne sont pas rédigés dans une langue que lui et d’autres lecteurs comprennent, pas d’apprentissage ni d’échange possible.

In fine, la centralisation en tant que telle ne suffit donc pas à activer le partage de la donnée au sein d’une organisation silotée. Il faut donc sans doute considérer le silotage organisationnel comme hypothèse de départ pour orienter les efforts vers la recherche de nouveaux moyens activant le partage des données.

Comment satisfaire cet objectif de partage de la donnée à l’échelle de l’entreprise, tout en intégrant la réalité de l’organisation existante souvent silotée ?

Promesse #3 : Élargir la gouvernance des données

Enfin, une plateforme de données centralisée est perçue comme vecteur d’unification de la gouvernance. Est-ce pour autant synonyme d’un meilleur encadrement ?

Cette ambition se heurte souvent à un cadre existant défaillant et à des acteurs déresponsabilisés. Les règles du jeu ne sont pas clairement établies et appliquées de tous, et producteurs et consommateurs de données s’affranchissent des responsabilités globales (usages futurs, gestion des ressources).

La gestion des données devient alors une cour de récréation une veille de vacances, désordonnée, sans règle commune (et bruyante).

Pour siffler la fin de la récré, un maître du jeu est désigné sur un modèle command & control, souvent incarné par une équipe centrale. L’équipe ad hoc manque de légitimité et de poids hiérarchique sur les entités, et n’est pas secondée par l’outillage nécessaire. Cela n’est donc pas suffisant pour insuffler une dynamique nécessaire à une gouvernance durable.

Alors, comment faire de la gouvernance de la donnée l’affaire de tous ?

C_entralisé_ et data-centré sont deux réalités différentes et décorrélées.

Viser moins de centralisation, grâce à une organisation plus distribuée, apparaît même comme un levier pour être plus data-centré.

Quels sont les autres ingrédients d’une stratégie data-centrée ?

1/ Travailler la donnée comme un produit

Les jeux de données doivent être conçus et délivrés comme des produits finis, répondant à des principes communs autour de l’accessibilité, de l’interopérabilité, de la sécurité, du niveau de service... Ce cadre d’homogénéité permet de garantir la capacité des produits de données à s’utiliser et à se consommer les uns les autres, en vue d’en bâtir de nouveaux.

2/ Définir et fournir un cadre commun à tous les produits data

Un ensemble de fonctionnalités normées et communes délimite un cadre dans lequel les produits data doivent se développer. Ce cadre garantit la cohérence, l’interopérabilité et le time-to-market des nouveaux produits.

3 niveaux de standardisation sont possibles :

  • normes : garantissent la cohérence et l’interchangeabilité entre les outils (peser en kg) ;
  • capacités : fournissent à l’utilisateur une solution qui lui permette de réaliser un usage en se conformant aux attendus (un chronomètre de précision milliseconde) ;
  • services : fournissent directement le résultat attendu et affranchissent l’utilisateur du choix de la solution (un service d’authentification).

3/Gouverner en fédérant l’ensemble des acteurs des entités

Tous les acteurs des entités s’engagent autour de principes de gouvernance communs : un pacte de confiance en somme, et un liant nécessaire pour combiner autonomie des entités et cohérence globale.

Concrètement, la gouvernance des données régule les fonctionnalités permettant de produire ou consommer des produits data. Pour cela, les acteurs de la gouvernance s’accordent lors de comités produits sur le niveau de standardisation des fonctionnalités, leur coût et l’ensemble des paramètres qui régissent la production et la consommation des produits.

La gouvernance délimite ainsi un cadre commun dans lequel peut se développer une organisation data-centrée. Pour être efficiente, suivie et mesurée, la gouvernance doit être outillée. Elle doit également s’accompagner d’une démarche d’acculturation et de communication qui en assure l’adoption.

Comment mettre en œuvre ces 3 dimensions ?

Il y a trois chantiers structurants à lancer de front pour opérer la transformation data-centrée d’une plateforme de données :

  • Lancer une gouvernance fédérée : aligner les représentants des entités autour d’une vision et d’une ambition de la plateforme de données à l’échelle de l’entreprise.
  • Obtenir un consensus sur la définition d’un premier cadre commun aboutissant à l’autonomie des entités, en définissant leurs droits et responsabilités vis-à-vis de l’ensemble.
  • Bâtir les premiers jeux de données sous forme de visions produits. Le respect des principes et standards du cadre commun garantit leur interopérabilité et, à terme, leur bonne utilisation par d’autres entités.

En conclusion, les expériences de Renaud et Julien nous démontrent que l’axe premier pour devenir data-centric n’est pas nécessairement la centralisation de la donnée. Une alternative pourrait être cette approche décentralisée, bâtie sur la co-construction au sein de l’entreprise et avec toutes les parties prenantes d’un cadre de travail définissant l’autonomie et la responsabilité de ces acteurs. Complétée par un socle de services technologiques accélérateurs, cette approche peut se matérialiser par un écosystème distribué de produits de données supportés par plusieurs plateformes, preuve que centralisé et data-centré sont deux démarches différentes.

Voir la vidéo du talk