Data

Data

La Data au cœur des enjeux de compétitivité – Compte rendu du Comptoir X OCTO Academy

Si les métiers comme Data Analyst et Data Scientist peuvent paraître très confus pour les non-initiés au Big Data, ses enjeux et ses technologies ne sont pas aussi simples à envisager. Pourtant, elles font partie de notre vie de tous les jours. Pour tous les candidats qui débutent leur carrière mais aussi pour ceux qui souhaitent se reconvertir, avoir des compétences en Data est devenu essentiel. Depuis 2019, les organisations recherchent de plus en plus de collaborateurs qui possèdent des compétences spécialisées et des compétences relationnelles. Plus important encore, le raisonnement analytique occupe désormais la troisième place des connaissances spécialisées. Guillaume Rozier nous propose une immersion dans le domaine de la Data Science pour mieux en comprendre les métiers, les compétences mais également la culture qui gravite autour.

Lire la suite
Data

Un schema registry pour passer à l’échelle

Faire évoluer les contrats d’interfaces peut être un casse-tête, surtout quand leur nombre se multiplie. Comment faire face à une augmentation des clients ? Dans ce billet seront abordées des solutions comme : un schéma registry minimaliste et la mise en place du zéro downtime deployment. Leurs implémentations et leurs utilisations seront détaillées. Cet article constitue un retour d'expérience sur la construction d’un Datawarehouse (DWH) et son alimentation en données. Il traite de l’augmentation du nombre d’utilisateurs du DWH et des solutions techniques mises en œuvre…

Lire la suite
Data

Data-as-a-product: pierre angulaire du Data-Mesh

L'exploitation de la donnée à l'échelle : un enjeu stratégique ?  Dans son ouvrage Empowered, Marty Cagan cite quatre éléments essentiels d’une démarche orientée produit : La première est d'être prêt à faire des choix difficiles sur ce qui est vraiment important.La seconde consiste à générer, identifier et exploiter des informations pour orienter ces choix.Le troisième consiste à convertir les idées en action.Et le quatrième implique un management actif des personnes/équipes sans recourir au micromanagement. Faire des choix c'est accepter que toutes les choses ne…

Lire la suite
Data

Qu’est-ce qu’un produit Data ?

Introduction  Le nombre de données récoltées et exploitées par nos systèmes informatiques ne cesse d’augmenter, ce qui favorise l’essor de produits data, terme de plus en plus présent dans la littérature produit. Dans cet article, nous allons définir ce qu’est un produit Data et aborder les différences qui existent par rapport à un produit dit “classique”, afin que vous puissiez aborder vos futurs produits data avec les idées plus claires !  Pour commencer, il faut avoir en tête les différentes caractéristiques qui définissent une approche…

Lire la suite
Data

Matrice Cynefin x Machine Learning – Aller vite en production pour minimiser le risque des systèmes complexes

Certains affirment qu’il faut attendre d’avoir finalisé son modèle de Machine Learning (ML) avant d’aller en production, d'autres qu’il faut aller au plus tôt en production pour avoir du feedback. Formé à l'école Agile, DevOps, Lean, Accelerate, je fais clairement plus partie de la deuxième catégorie ; cependant je dois reconnaître que certains problèmes méritent d’être résolus complètement avant d’aller en production. Ayant découvert récemment la matrice Cynefin, dans ce court billet je propose une grille de lecture des problèmes de ML que nous pouvons…

Lire la suite
Data

Et si les métriques de monitoring de ML devenaient fonctionnalités ?

Les équipes développant des applications de Data Science investissent beaucoup d’énergie pour identifier et implémenter des métriques de monitoring pertinentes. Nous pensons qu’il est possible de capitaliser sur ce travail en proposant des fonctionnalités supplémentaires à nos utilisateurs afin de renforcer l’impact de nos applications. Le monitoring s’appuie notamment sur le calcul de métriques à des fins de supervisions; c'est-à-dire mesurer l’état de service et détecter des problèmes. Les métriques calculées peuvent être plus ou moins haut niveau, plus ou moins éloignées du matériel: Bas…

Lire la suite
Data

Comment gérer des grosses données en toute simplicité ? – Compte-rendu du talk de Faustine Massin à la Duck Conf 2022

Canards Duck Conf

Faustine Massin est consultante chez OCTO Technology, dans une équipe spécialisée dans la conception et le développement d’applications data-intensives. Elle nous présente un retour d'expérience sur le développement d'une plateforme de traces pour l'Éducation Routière et le Permis de Conduire. Le cas d'usage étudié porte sur les besoins spécifiques de réquisition judiciaire et de lutte contre la fraude. Elle présente la démarche qui a été suivie pour dessiner et mettre en place un système capable d'adresser les principaux enjeux métier. Parmi les différents enjeux, on…

Lire la suite
Data

L’Edge computing, challenger ou partenaire du Cloud en milieu industriel ? – Compte rendu du Comptoir x Duck Conf 2022 de Baptiste O’Jeanson et Louison Roger

De nos jours, les usines sont de plus en plus équipées, intelligentes, technologiques… mais elles fonctionnent bien trop souvent de manière isolée. Aujourd’hui, la priorité est de mettre en commun la connaissance industrielle par la donnée dans le but d’optimiser la performance industrielle globale. Cependant, collecter les données en milieu industriel n’est pas une mince affaire et apporte de nombreux challenges. Dans ce comptoir, Baptiste et Louison nous montrent comment le mariage Edge - Cloud permet de répondre à ces challenges en déployant et en monitorant des solutions intelligentes, et évoquent un certain nombre de bonnes pratiques DevOps.

Lire la suite
Data

1001 façons de faire parler la donnée – Compte rendu du talk de Nicolas Cavallo à la Duck Conf 2022

Les données textuelles en grande quantité sont difficiles à traiter et à interpréter. Il est possible de leur faire dire une chose et son contraire, de telle sorte que des statistiques calculées sur du contenu de réseaux sociaux n’ont de fait aucune valeur si on ne comprend pas  la méthode par laquelle elles ont été obtenues. Dans son talk, Nicolas Cavallo  nous propose de construire ensemble un cas d’usage d’analyse de tweets portant sur l’élection présidentielle de 2022.

Lire la suite
Data

Compte-rendu du Café du PO #8 : Les spécificités d’un PO Data

L’épisode #8 :  Pour ce huitième épisode qui a eu lieu le 1 mars et qui était animé par Lina Yahi, nous avons échangé sur les spécificités d’un PO Data avec deux invités qui nous ont partagé leurs retours d’expérience respectifs :   Capucine Claude, PO data pour Mon espace santé.Yoan Eynaud, Data Scientist / Statisticien. Actuellement PO/PM data au ministère de l’intérieur. Découvrez l’épisode #8 en sketchnote : Sketchnote du café du PO #8, réalisée par Clément Schrimpf : Les take away  Un produit data…

Lire la suite