Data

Data

L’Edge computing, challenger ou partenaire du Cloud en milieu industriel ? – Compte rendu du Comptoir x Duck Conf 2022 de Baptiste O’Jeanson et Louison Roger

De nos jours, les usines sont de plus en plus équipées, intelligentes, technologiques… mais elles fonctionnent bien trop souvent de manière isolée. Aujourd’hui, la priorité est de mettre en commun la connaissance industrielle par la donnée dans le but d’optimiser la performance industrielle globale. Cependant, collecter les données en milieu industriel n’est pas une mince affaire et apporte de nombreux challenges. Dans ce comptoir, Baptiste et Louison nous montrent comment le mariage Edge - Cloud permet de répondre à ces challenges en déployant et en monitorant des solutions intelligentes, et évoquent un certain nombre de bonnes pratiques DevOps.

Lire la suite
Data

1001 façons de faire parler la donnée – Compte rendu du talk de Nicolas Cavallo à la Duck Conf 2022

Les données textuelles en grande quantité sont difficiles à traiter et à interpréter. Il est possible de leur faire dire une chose et son contraire, de telle sorte que des statistiques calculées sur du contenu de réseaux sociaux n’ont de fait aucune valeur si on ne comprend pas  la méthode par laquelle elles ont été obtenues. Dans son talk, Nicolas Cavallo  nous propose de construire ensemble un cas d’usage d’analyse de tweets portant sur l’élection présidentielle de 2022.

Lire la suite
Data

Compte-rendu du Café du PO #8 : Les spécificités d’un PO Data

L’épisode #8 :  Pour ce huitième épisode qui a eu lieu le 1 mars et qui était animé par Lina Yahi, nous avons échangé sur les spécificités d’un PO Data avec deux invités qui nous ont partagé leurs retours d’expérience respectifs :   Capucine Claude, PO data pour Mon espace santé.Yoan Eynaud, Data Scientist / Statisticien. Actuellement PO/PM data au ministère de l’intérieur. Découvrez l’épisode #8 en sketchnote : Sketchnote du café du PO #8, réalisée par Clément Schrimpf : Les take away  Un produit data…

Lire la suite
Data

Modèle embarqué VS model as a service : quelle stratégie choisir ?

    Introduction Vous avez développé un super modèle de Machine Learning, les performances sont au top et il résout un vrai problème. Malheureusement, personne n’en aura jamais connaissance si vous ne le déployez pas en production. Votre modèle n’aura été qu’un POC parmi tant d’autres et ne créera jamais de valeur pour l’entreprise et pour vos utilisateurs. Il y a quelques années, alors que les modèles n’étaient que très rarement déployés en production, la question de l’exposition était souvent anecdotique. Avec la croissance grandissante…

Lire la suite
Data

Implémente moi un CNN

L’éco-système en Machine Learning et en particulier en Deep Learning s’est enrichi ces dernières années et les outils proposés sont de plus en plus haut niveau. Tant et si bien qu’il n’est plus toujours nécessaire d’avoir une connaissance approfondie des modèles pour mener à bien un projet de Data Science. Cette multitude de solutions a l’avantage de rendre le machine learning accessible à un plus grand nombre mais au détriment de la compréhension théorique. En effet, le Deep Learning n’est plus le domaine réservé des…

Lire la suite
Data

La donnée synthétique 3D : Construire plus rapidement un dataset d’un modèle de ML performant

Obtenir un jeu de données pour l'entraînement de son modèle de machine learning dans un cas d'usage donné reste encore aujourd'hui très difficile. Beaucoup sont issus de travaux réalisés et mis à jour par des communautés (universitaires, centre de recherches, instituts spécialisés…) impliquant un coût non négligeable de collecte des données.

Lire la suite
Data

Confluent ksqlDB – gestion des traitements de flux – bénéfices et risques

L’écosystème Kafka peut s’avérer difficile à appréhender dans beaucoup de projets de delivery. KsqlDB offre une abstraction intéressante en permettant de consommer des flux de données en SQL, comme sur une base de données classique.  Cette simplification permet d’initier rapidement une nouvelle application sans connaissance préalable de la plateforme. Cet article parcourt les fonctionnalités des différents outils de l’écosystème Kafka, détaille KsqlDB et tente de répondre aux questions suivantes : Quelle valeur cet outil peut-il apporter ? Dans quel cas l’utiliser et ne pas l’utiliser ? Comment…

Lire la suite
Data

L’atelier matrice d’erreur : démystifier les performances du ML avec ses utilisateurs

Où placer le curseur : plus de faux négatifs ou plus de faux positifs ?

Nous pensons que la gestion des erreurs est un aspect important dans les systèmes de prise de décision et qu’il est indispensable d’étudier cela avec les utilisateurs d’un tel produit, a fortiori lorsqu’il embarque du Machine Learning. Dans cet article, nous vous proposons une méthode itérative, pour évaluer le coût d’une erreur et adapter le système de prise de décision, pour que ses utilisateurs aient plus confiance en lui. La data science proposant de nombreuses définitions que nous utiliserons dans cet article, voici un petit…

Lire la suite
Data

6 recommandations pour optimiser un job Spark

Exemple de gain de temps sur un cas d’usage exemple Spark est aujourd’hui un outil incontournable pour le traitement de données volumineuses. Cette technologie s’est imposée comme la plus sollicitée et recommandée pour de nombreuses applications business en data engineering. La dynamique est d’ailleurs soutenue par les offres de services managés comme Databricks qui permettent de s’affranchir d’une partie des coûts liés à l’achat et à la maintenance d’un cluster de machines distribués pour le calcul.  Les fournisseurs de Cloud les plus importants proposent également…

Lire la suite
Data

[WEBINARS] Data, Edge, Agilité & Delivery – Découvrez le programme !

OCTO vous présente Le Comptoir ! Le concept : 45 min dans la matinée, 20 min de présentation et 25 min d'échanges sur une thématique avec des experts OCTO en visioconférence. Venez nous voir, avec votre contexte, votre histoire, là où vous en êtes, les opportunités que vous avez identifiées et surtout avec vos contraintes et vos réflexions, nous laissons une grande part à l’échange et aux questions !   Mardi 08 juin, 9h15 - Le Comptoir Accelerate x Engie ACCELERATE COMME OUTIL DE GOUVERNANCE NUMÉRIQUE Par Vincent Derenty (Engie Digital) & Christian Fauré (OCTO Technology) Constituée d'une dizaine de plate-formes digitales, Engie Digital…

Lire la suite