Data Science

Data Science

L’atelier matrice d’erreur : démystifier les performances du ML avec ses utilisateurs

Où placer le curseur : plus de faux négatifs ou plus de faux positifs ?

Nous pensons que la gestion des erreurs est un aspect important dans les systèmes de prise de décision et qu’il est indispensable d’étudier cela avec les utilisateurs d’un tel produit, a fortiori lorsqu’il embarque du Machine Learning. Dans cet article, nous vous proposons une méthode itérative, pour évaluer le coût d’une erreur et adapter le système de prise de décision, pour que ses utilisateurs aient plus confiance en lui. La data science proposant de nombreuses définitions que nous utiliserons dans cet article, voici un petit…

Lire la suite
Data Science

Devoxx FR 2021 – Dans les 👟 de sega – Jour 1

Introduction - Dans mes 👟Pour ce CR de la Devoxx, je parle en disant “je”, je donne mon ressenti à moi, j’essaie de retranscrire l’ambiance… De mon point de vue, l’intérêt d’un article exhaustif et objectif est réduit : il aurait fallu que j’assiste à 6 créneaux * 5 tracks * 3 jours = 90 talks ! Alors asseyez-vous confortablement, et écoutez mon histoire. Imagine. Nous sommes un jeudi matin de Septembre, je suis parti à 8h de chez moi, pour me frayer un chemin…

Lire la suite
Data Science

Automatiser les déploiements de projets de Machine Learning. Partie 1 : la construction de modèles

Cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning”, traitant de l’application d’Accelerate dans un contexte incluant du Machine Learning. Il peut être lu indépendamment, mais si vous n’êtes pas familier avec Accelerate, ou si vous souhaitez avoir plus de détails sur le contexte de cet article, vous pouvez lire l’article introduisant cette série. Vous y trouverez également le lien vers le reste des articles pour aller plus loin. Dans Accelerate, l’automatisation des déploiements fait référence à l’aptitude à…

Lire la suite
Data Science

Kubeflow: le ML industrialisé et à l’échelle dans Kubernetes

Pour les entreprises exploitant l’Intelligence Artificielle, bien maîtriser son intégration dans les écosystèmes de données reste un enjeu majeur. Parmi les défis à relever pour mettre en place l’IA de manière pérenne, l’industrialisation a su tirer son épingle du jeu pour devenir un élément indispensable d’une bonne intégration de l’IA en production. Dans cet article, nous vous proposons de vous tourner vers l’après industrialisation : le passage à l’échelle ! Cet article fait suite à plusieurs mois d’expérimentation de la solution Kubeflow permettant de déployer…

Lire la suite
Data Science

You Only Look Once – un réseau de neurones pour la détection d’objets

Nous, les humains, avons un système visuel rapide et précis, ce qui nous permet d'effectuer des tâches complexes comme la conduite avec peu de réflexion consciente. En effet, nous savons inconsciemment quels sont les objets que nous voyons, où ils se trouvent et comment ils interagissent. Au cours des dernières années, des algorithmes rapides et précis se sont mis en place pour la reconnaissance d'objets dans une image. Plus de détails sur ces différents algorithmes dans la page wikipédia : https://fr.wikipedia.org/wiki/Reconnaissance_de_formes. La reconnaissance d'objets est…

Lire la suite
Data Science

Comment optimiser un job Spark

Exemple de gain de temps sur un cas d’usage exemple Spark est aujourd’hui un outil incontournable pour le traitement de données volumineuses. Cette technologie s’est imposée comme la plus sollicitée et recommandée pour de nombreuses applications business en data engineering. La dynamique est d’ailleurs soutenue par les offres de services managés comme Databricks qui permettent de s’affranchir d’une partie des coûts liés à l’achat et à la maintenance d’un cluster de machines distribués pour le calcul.  Les fournisseurs de Cloud les plus importants proposent également…

Lire la suite
Data Science

Découpler son architecture de ML pour en accélérer le delivery

Couverture livre accelerate

Cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning”, traitant de l’application d’Accelerate [1] dans un contexte incluant du Machine Learning. Si vous n’êtes pas familier avec Accelerate, ou si vous souhaitez avoir plus de détails sur le contexte de cet article, nous vous invitons à commencer par lire l’article introduisant cette série. Vous y trouverez également le lien vers le reste des articles pour aller plus loin. Accelerate présente la capability "Loosely Coupled Architecture" comme un mode d'organisation…

Lire la suite
Data Science

La gestion des données de tests en Delivery de Machine Learning

« […] successful teams had adequate test data to run their fully automated test suites and could acquire test data for running automated tests on demand. In addition, test data was not a limit on the automated tests they could run. » Extrait de: Forsgren PhD. « Accelerate. » Cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning” traitant de l’application du modèle Accelerate dans un contexte incluant du Machine Learning. Introduction Est-ce que vous avez déjà : Eu…

Lire la suite
Data Science

Algorithmes Évolutionnistes : Applications à des problèmes de données – 3

Le premier article était consacré à la structure et au fonctionnement des algorithmes évolutionnistes et le second portait sur leur performance. Nous allons ici nous intéresser à un cas d'application concret d'algorithmes évolutionnistes sur un problème de données complexes. Le cas d'application présenté est l'utilisation d'un algorithme évolutionniste comme une alternative à de l'apprentissage par renforcement pour entraîner un véhicule à se déplacer dans un environnement simulant un circuit. Le problème s'apparente ici à celui de la conduite autonome. Un peu de contexte sur l'apprentissage…

Lire la suite
Data Science

Comment l’IA peut-elle changer le recrutement ? (partie 2)

Dans la première partie de l’article, nous avons vu quelles étaient les solutions logicielles permettant aux entreprises de trier les candidatures. Cette démarche, qui a de l’intérêt principalement lorsque l’entreprise reçoit énormément de candidatures, repose sur une méthode simple mais très limitée. Nous avons vu que l’IA a le potentiel pour apporter des solutions aux limites évoquées mais présente aussi des écueils à éviter, notamment les biais. Dans cette deuxième partie, nous allons présenter une technique de NLP qui pourrait permettre de pallier les défauts…

Lire la suite