Data Science

Data Science

La gestion visuelle dans un projet de Machine Learning Delivery

Introduction En développement logiciel et en Machine Learning, le travail en cours n’est pas aussi visible que dans une usine où l'on voit les pièces s'assembler et progresser d'une étape à l'autre. Ne pas voir le travail en cours peut nous empêcher de voir certains des points bloquants, de se projeter sur la quantité de travail bientôt terminé, d’améliorer le process, … Pour remédier à cela, il est donc important d’outiller l’équipe pour rendre le travail visible tant au niveau des membres de l'équipe elle-même…

Lire la suite
Data Science

Westrum Organizational Culture et Machine Learning – Partie 2 : Changer la culture

Cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning”, traitant de l’application du framework Accelerate dans un contexte incluant du Machine Learning. Si vous n’êtes pas familier avec le framework Accelerate, ou si vous souhaitez avoir plus de détails sur le contexte de cet article, nous vous invitons à commencer par lire l’article introduisant cette série. Vous y trouverez également le lien vers le reste des articles pour aller plus loin.  Cet article aborde la capacité "Westrum Organizational Culture"…

Lire la suite
Data Science

Westrum Organizational Culture et Machine Learning – Partie 1 : Impacts de la culture sur le delivery

Cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning”, traitant de l’application du framework Accelerate dans un contexte incluant du Machine Learning. Si vous n’êtes pas familier avec le framework Accelerate, ou si vous souhaitez avoir plus de détails sur le contexte de cet article, nous vous invitons à commencer par lire l’article introduisant cette série. Vous y trouverez également le lien vers le reste des articles pour aller plus loin.  Cet article aborde la capacité "Westrum Organizational Culture"…

Lire la suite
Data Science

Plongez dans le grand jeu de données (ou comment constituer et gérer son dataset)

Un premier briefing Avant de commencer le grand plongeon, des définitions s’imposent : Jeu de données (ou dataset) : collection de données de même type, de préférence de même format et souvent accompagnées d'annotation Annotation : description du contenu de chacune des données d’un dataset. L’annotation des données est le processus d’étiquetage du contenu reconnaissable par un ordinateur. En fonction de la nature du problème, on indiquera le type de l’objet dans l’image, on peut également indiquer ses coordonnées ou d’autres attributs. Modèle de Machine…

Lire la suite
Data Science

Accélérer le Delivery de projets de Machine Learning

Cet article sert d'introduction à une série plus large, traitant de l'application du framework Accelerate dans un contexte incluant du Machine Learning Avant de commencer, voici quelques définitions et conventions de nommage que nous adopterons tout au long de la série d'articles : Machine Learning : “Le Machine Learning est une fonctionnalité qui permet à des logiciels d'effectuer une tâche sans programmation ni règles explicites”. (Source google). Machine Learning est souvent abrégé ML. Delivery : le processus permettant de mettre un produit entre les mains…

Lire la suite
Data Science

Les Comptoirs de Février – Découvrez le programme !

Découvrez les Comptoirs du mois ! Le concept : 45 min dans la matinée, 20 min de présentation et 25 min d’échanges sur une thématique avec des experts OCTO en visioconférence. L’occasion de vous donner des clés, répondre à vos questions et élever le débat dans la communauté.   Le Comptoir Data - Mardi 2 février, 9h15-10h SNCF VOYAGES : LA DATA AU SERVICE DE L'EXPÉRIENCE CLIENT DANS UN ÉCOSYSTÈME COMPLEXE avec Julien Iris (SNCF Voyages), Christophe Durand & Pierre-Yves Lesage (OCTO Technology) SNCF gère un patrimoine riche de données produites et exploitées par les différentes activités du groupe…

Lire la suite
Data Science

SAP Analytics Cloud – épisode 2 : booster SAC avec Python

Cet article est le deuxième article de la série Booster SAP Analytics Cloud. Il fait suite au premier article sur la partie Visualisation innovantes D3JS. 1. Contexte et périmètre : Dans le cadre du Hackathon SAP Analytics Cloud (SAC) du 30 avril au 7 mai 2020, la tribu LIQSA (Liquid SAP Analytics) a réalisé un tableau de bord incorporant : un algorithme de Machine Learning en Python, des visualisations innovantes grâce à des librairies D3JS. Sachant que cet article fait référence à un PoC réalisé…

Lire la suite
Data Science

Réseau de neurones convolutif semi-supervisé pour de la prédiction

“Je dispose de données annotées en nombre limité, néanmoins obtenir des données non annotées est pour moi une chose aisée. Existe-t-il des méthodes de Machine Learning permettant d’utiliser des données annotées et non annotées en même temps ?”A travers cet article, en nous basant sur un cas d’usage assez simple, nous allons aborder cette thématique et y apporter quelques éléments de réponse. L'apprentissage supervisé et l’apprentissage non supervisé Les algorithmes d’apprentissage automatique ont généralement besoin de beaucoup de données pour être efficaces, ce n’est pas…

Lire la suite
Data Science

The TangrIAm Project : comment expliquer l’IA aux enfants ?

Dans la vie d'un consultant OCTO, il est encore trop rare de pouvoir contribuer à un projet grand public et sur lequel nous pouvons communiquer. Alors quand en plus le projet est fun à réaliser et fait appel à une expertise de pointe, nous ne pouvons nous empêcher de vous partager son histoire. En trois mots : Pédagogie / Ludique / Intelligence Artificielle (oui oui, cela fait 4 mots... ne m'obligez pas à mettre un tiret).

Lire la suite
Data Science

Nos 10 convictions pour mieux réussir nos projets de Data Science en 2021

Pour cette nouvelle année 2021, nous souhaitons vous proposer 10 convictions qui vous permettront de mieux réussir vos projets de Data Science. Ces convictions sont inspirées de notre quotidien, de nos lectures et des évolutions du marché de la Data Science que nous observons chez OCTO. Livrer continuellement un petit incrément de valeur en production La Data Science, c’est aussi (et surtout) une matière informatique Appliquer les principes d’Accelerate aux projets Data Science Maîtriser la complexité des systèmes de Data Science Constituer des équipes autonomes…

Lire la suite