Data Science

Data

Matrice Cynefin x Machine Learning – Aller vite en production pour minimiser le risque des systèmes complexes

Certains affirment qu’il faut attendre d’avoir finalisé son modèle de Machine Learning (ML) avant d’aller en production, d'autres qu’il faut aller au plus tôt en production pour avoir du feedback. Formé à l'école Agile, DevOps, Lean, Accelerate, je fais clairement plus partie de la deuxième catégorie ; cependant je dois reconnaître que certains problèmes méritent d’être résolus complètement avant d’aller en production. Ayant découvert récemment la matrice Cynefin, dans ce court billet je propose une grille de lecture des problèmes de ML que nous pouvons…

Lire la suite
Bonne pratique

Apprendre la normalité ou détecter l’anormalité ?  – Compte-rendu du talk de Reynald Rivière à La Duck Conf 2022

Reynald est Senior Manager en Data Science chez OCTO et intervient sur des missions de création de services et produits basés sur l’IA et la data. Ayant travaillé sur la Data Science dans plusieurs secteurs d'activité, il nous présente aujourd’hui l’IA appliquée au domaine de la cybersécurité, en tentant de répondre à la question : Apprendre la normalité ou détecter l’anormalité avec l’IA ? 1. Un peu d'humilité pour démarrer cette session “Tous nos modèles sont faux… mais certains utiles” Georges Box, statisticien du siècle…

Lire la suite
Data

Et si les métriques de monitoring de ML devenaient fonctionnalités ?

Les équipes développant des applications de Data Science investissent beaucoup d’énergie pour identifier et implémenter des métriques de monitoring pertinentes. Nous pensons qu’il est possible de capitaliser sur ce travail en proposant des fonctionnalités supplémentaires à nos utilisateurs afin de renforcer l’impact de nos applications. Le monitoring s’appuie notamment sur le calcul de métriques à des fins de supervisions; c'est-à-dire mesurer l’état de service et détecter des problèmes. Les métriques calculées peuvent être plus ou moins haut niveau, plus ou moins éloignées du matériel: Bas…

Lire la suite
Data Science

Nettoyage du texte en NLP : moins de vocabulaire, moins de bruit

Cet article est le deuxième de la série Analyse de tendances des réseaux sociaux. Dans l'article précédent, nous avons présenté les bases méthodologiques pour analyser des tendances à partir de données de réseaux sociaux. Nous avons notamment expliqué l’importance de bien identifier la population de référence sur laquelle porte notre étude, et de bien choisir la fonction d’extrapolation pour que nos observations soient réellement représentatives. À présent, il est temps de commencer à collecter des tweets et de se lancer dans la détection de tendances…

Lire la suite
Bonne pratique

Dessine-moi une archi data Science – Compte-rendu du talk de Sofia Calcagno et Emmanuel-Lin Toulemonde à La Duck Conf 2022

Speakers : Sofia Calcagno et Emmanuel-Lin Toulemond « Un architecte est souvent vu comme quelqu’un qui arrive avec un plan prédéfini à implémenter dans une durée de 6 à 10 mois »  Néanmoins, cette vision freine l’amélioration continue. Dans leur Talk Sofia Calcagno et Emmanuel-Lin Toulemonde, tous deux Consultants et Architecte Data au sein d’Octo Technology, nous présentent comment mettre en place une architecture émergente. À l'opposé de cette première vision, une architecture émergente encourage la mise en place des briques d'infrastructure du logiciel en…

Lire la suite
Archi & techno

Quelle stratégie de découpage adopter pour un produit de ML maintenable dans le temps ? – Compte-rendu du talk de Pierre Baonla Bassom à La Duck Conf 2022

Avez vous déjà entendu l’histoire de Netflix, qui a dépensé énormément d’argent dans un super système de recommandation, mais qui n’a jamais été déployé car trop complexe ? Cette histoire n’est pas un cas isolé et se retrouve beaucoup plus souvent que vous ne le pensez. Entre les produits de ML qui ne sont jamais envoyés en production et ceux qui mettent 6 mois à être déployés, il y a une vraie perte de temps et d’argent lorsque les produits de ML ne sont pas…

Lire la suite
Data Science

Comment structurer vos équipes et démocratiser l’Intelligence Artificielle au sein de votre organisation

Introduction des auteurs et de l’initiative Dans le cadre des réflexions d’OCTO Technology sur les grands enjeux du monde de la data, Jean-Baptiste Larraufie consultant OCTO et Ming-Li Gridel Directrice Data science chez DataRobot ont amorcé une discussion sur l’évolution des structures data dans les entreprises.  En tant que conseiller stratégique sur les initiatives data de grands groupes français, OCTO Technology a contribué à diverses et nombreuses missions d'Intelligence Artificielle (IA) et assisté à la structuration d’équipes Data chez nombre d’entreprises de l’hexagone. DataRobot, partenaire d’OCTO,…

Lire la suite
Agile

Compte-rendu du Café du PO #8 : Les spécificités d’un PO Data

L’épisode #8 :  Pour ce huitième épisode qui a eu lieu le 1 mars et qui était animé par Lina Yahi, nous avons échangé sur les spécificités d’un PO Data avec deux invités qui nous ont partagé leurs retours d’expérience respectifs :   Capucine Claude, PO data pour Mon espace santé.Yoan Eynaud, Data Scientist / Statisticien. Actuellement PO/PM data au ministère de l’intérieur. Découvrez l’épisode #8 en sketchnote : Sketchnote du café du PO #8, réalisée par Clément Schrimpf : Les take away  Un produit data…

Lire la suite
Data Science

Rendre représentatif ce qu’on observe : l’exemple des données Twitter pour l’élection présidentielle 2022

Un article pour définir les bases méthodologiques à la construction d'un outil d'analyse de tendances cohérent à partir des données observées. Nous prendrons ensuite l'exemple du projet laVoixDesElections.fr pour apprécier l'importance de cette méthodologie dans l'analyse des données des réseaux sociaux

Lire la suite