Data Science

Data Science

La causalité : comprendre les données autrement

Article co-écrit par Ilann Mahou et Amric Trudel On nous demande régulièrement chez Octo de développer des outils pour guider la prise de décisions. Par exemple, un client peut chercher à maximiser ses profits, alors qu’un autre souhaite minimiser ses pertes. On cherche souvent à développer des modèles de Machine Learning pour ce type de cas d’usage, mais il faut se rappeler que, bien que ces derniers puissent être excellents pour faire des prédictions, ils ne sont pas conçus pour nous dire comment intervenir dans…

Lire la suite
Data Science

[MLOps] Monitoring & proactive notification d’une application de Machine Learning

En tant que développeur d’application embarquant une brique de Machine Learning notre  principal objectif est d’avoir une application utilisée qui fonctionne sans bogue.  Une fois en production et utilisée, il faut anticiper ou identifier les bogues dans notre application et les résoudre au plus vite, afin de maintenir le service rendu et en tirer réellement profit. Nous détaillerons plus précisément la notion de bogue en ML, mais pour commencer nous pouvons dire qu'un bogue en ML est soit une absence de prédiction, soit une erreur…

Lire la suite
Évènement

[WEBINARS] Data et Produit – Découvrez les Comptoirs du mois

le comptoir octo

Le concept : 45 min dans la matinée, 20 min de présentation et 25 min d’échanges sur une thématique avec des experts OCTO en visioconférence. Venez nous voir, avec votre contexte, votre histoire, là où vous en êtes, les opportunités que vous avez identifiées et surtout avec vos contraintes et vos réflexions, nous laissons une grande part à l’échange et aux questions ! S’INSCRIRE AUX COMPTOIRS Jeudi 10 novembre, 9h15 - Le Comptoir OCTO x OCTO ACADEMY LA DATA AU COEUR DES ENJEUX DE COMPÉTITIVITÉ Par Guillaume Rozier, Data Scientist  Si la data est omniprésente dans le quotidien de nos organisations,…

Lire la suite
Data Science

Machine Learning delivery : intégrer au plus tôt la sécurité

Cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning”, traitant de l’application d’Accelerate dans un contexte incluant du Machine Learning. Si vous n’êtes pas familier avec Accelerate, ou si vous souhaitez avoir plus de détails sur le contexte de cet article, nous vous invitons à commencer par lire l’article introduisant cette série. Vous y trouverez également le lien vers le reste des articles pour aller plus loin. Considérer la sécurité en Machine Learning Élément clef en logiciel, la sécurité…

Lire la suite
Data

Matrice Cynefin x Machine Learning : Quand mettre en production ?

Mettre rapide un modèle de Machine Learning en production pour minimiser le risque des systèmes complexes Certains affirment qu’il faut attendre d’avoir finalisé son modèle de Machine Learning (ML) avant d’aller en production, d'autres qu’il faut aller au plus tôt en production pour avoir du feedback. Formé à l'école Agile, DevOps, Lean, Accelerate, je fais clairement plus partie de la deuxième catégorie ; cependant je dois reconnaître que certains problèmes méritent d’être résolus complètement avant d’aller en production. Ayant découvert récemment la matrice Cynefin, dans…

Lire la suite
Bonne pratique

Apprendre la normalité ou détecter l’anormalité ?  – Compte-rendu du talk de Reynald Rivière à La Duck Conf 2022

Reynald est Senior Manager en Data Science chez OCTO et intervient sur des missions de création de services et produits basés sur l’IA et la data. Ayant travaillé sur la Data Science dans plusieurs secteurs d'activité, il nous présente aujourd’hui l’IA appliquée au domaine de la cybersécurité, en tentant de répondre à la question : Apprendre la normalité ou détecter l’anormalité avec l’IA ? 1. Un peu d'humilité pour démarrer cette session “Tous nos modèles sont faux… mais certains utiles” Georges Box, statisticien du siècle…

Lire la suite
Data

Et si les métriques de monitoring de ML devenaient fonctionnalités ?

Les équipes développant des applications de Data Science investissent beaucoup d’énergie pour identifier et implémenter des métriques de monitoring pertinentes. Nous pensons qu’il est possible de capitaliser sur ce travail en proposant des fonctionnalités supplémentaires à nos utilisateurs afin de renforcer l’impact de nos applications. Le monitoring s’appuie notamment sur le calcul de métriques à des fins de supervisions; c'est-à-dire mesurer l’état de service et détecter des problèmes. Les métriques calculées peuvent être plus ou moins haut niveau, plus ou moins éloignées du matériel: Bas…

Lire la suite
Data Science

Nettoyage du texte en NLP : moins de vocabulaire, moins de bruit

Cet article est le deuxième de la série Analyse de tendances des réseaux sociaux. Dans l'article précédent, nous avons présenté les bases méthodologiques pour analyser des tendances à partir de données de réseaux sociaux. Nous avons notamment expliqué l’importance de bien identifier la population de référence sur laquelle porte notre étude, et de bien choisir la fonction d’extrapolation pour que nos observations soient réellement représentatives. À présent, il est temps de commencer à collecter des tweets et de se lancer dans la détection de tendances…

Lire la suite
Bonne pratique

Dessine-moi une archi data Science – Compte-rendu du talk de Sofia Calcagno et Emmanuel-Lin Toulemonde à La Duck Conf 2022

Speakers : Sofia Calcagno et Emmanuel-Lin Toulemond « Un architecte est souvent vu comme quelqu’un qui arrive avec un plan prédéfini à implémenter dans une durée de 6 à 10 mois »  Néanmoins, cette vision freine l’amélioration continue. Dans leur Talk Sofia Calcagno et Emmanuel-Lin Toulemonde, tous deux Consultants et Architecte Data au sein d’Octo Technology, nous présentent comment mettre en place une architecture émergente. À l'opposé de cette première vision, une architecture émergente encourage la mise en place des briques d'infrastructure du logiciel en…

Lire la suite