Data Science

Data Science

Plongez dans le grand jeu de données (ou comment constituer et gérer son dataset)

Un premier briefing Avant de commencer le grand plongeon, des définitions s’imposent : Jeu de données (ou dataset) : collection de données de même type, de préférence de même format et souvent accompagnées d'annotation Annotation : description du contenu de chacune des données d’un dataset. L’annotation des données est le processus d’étiquetage du contenu reconnaissable par un ordinateur. En fonction de la nature du problème, on indiquera le type de l’objet dans l’image, on peut également indiquer ses coordonnées ou d’autres attributs. Modèle de Machine…

Lire la suite
Data Science

Accélérer le Delivery de projets de Machine Learning

Cet article sert d'introduction à une série plus large, traitant de l'application du framework Accelerate dans un contexte incluant du Machine Learning Avant de commencer, voici quelques définitions et conventions de nommage que nous adopterons tout au long de la série d'articles : Machine Learning : “Le Machine Learning est une fonctionnalité qui permet à des logiciels d'effectuer une tâche sans programmation ni règles explicites”. (Source google). Machine Learning est souvent abrégé ML. Delivery : le processus permettant de mettre un produit entre les mains…

Lire la suite
Data Science

Les Comptoirs de Février – Découvrez le programme !

Découvrez les Comptoirs du mois ! Le concept : 45 min dans la matinée, 20 min de présentation et 25 min d’échanges sur une thématique avec des experts OCTO en visioconférence. L’occasion de vous donner des clés, répondre à vos questions et élever le débat dans la communauté.   Le Comptoir Data - Mardi 2 février, 9h15-10h SNCF VOYAGES : LA DATA AU SERVICE DE L'EXPÉRIENCE CLIENT DANS UN ÉCOSYSTÈME COMPLEXE avec Julien Iris (SNCF Voyages), Christophe Durand & Pierre-Yves Lesage (OCTO Technology) SNCF gère un patrimoine riche de données produites et exploitées par les différentes activités du groupe…

Lire la suite
Data Science

SAP Analytics Cloud – épisode 2 : booster SAC avec Python

Cet article est le deuxième article de la série Booster SAP Analytics Cloud. Il fait suite au premier article sur la partie Visualisation innovantes D3JS. 1. Contexte et périmètre : Dans le cadre du Hackathon SAP Analytics Cloud (SAC) du 30 avril au 7 mai 2020, la tribu LIQSA (Liquid SAP Analytics) a réalisé un tableau de bord incorporant : un algorithme de Machine Learning en Python, des visualisations innovantes grâce à des librairies D3JS. Sachant que cet article fait référence à un PoC réalisé…

Lire la suite
Data Science

Réseau de neurones convolutif semi-supervisé pour de la prédiction

“Je dispose de données annotées en nombre limité, néanmoins obtenir des données non annotées est pour moi une chose aisée. Existe-t-il des méthodes de Machine Learning permettant d’utiliser des données annotées et non annotées en même temps ?”A travers cet article, en nous basant sur un cas d’usage assez simple, nous allons aborder cette thématique et y apporter quelques éléments de réponse. L'apprentissage supervisé et l’apprentissage non supervisé Les algorithmes d’apprentissage automatique ont généralement besoin de beaucoup de données pour être efficaces, ce n’est pas…

Lire la suite
Data Science

The TangrIAm Project : comment expliquer l’IA aux enfants ?

Dans la vie d'un consultant OCTO, il est encore trop rare de pouvoir contribuer à un projet grand public et sur lequel nous pouvons communiquer. Alors quand en plus le projet est fun à réaliser et fait appel à une expertise de pointe, nous ne pouvons nous empêcher de vous partager son histoire. En trois mots : Pédagogie / Ludique / Intelligence Artificielle (oui oui, cela fait 4 mots... ne m'obligez pas à mettre un tiret).

Lire la suite
Data Science

Nos 10 convictions pour mieux réussir nos projets de Data Science en 2021

Pour cette nouvelle année 2021, nous souhaitons vous proposer 10 convictions qui vous permettront de mieux réussir vos projets de Data Science. Ces convictions sont inspirées de notre quotidien, de nos lectures et des évolutions du marché de la Data Science que nous observons chez OCTO. Livrer continuellement un petit incrément de valeur en production La Data Science, c’est aussi (et surtout) une matière informatique Appliquer les principes d’Accelerate aux projets Data Science Maîtriser la complexité des systèmes de Data Science Constituer des équipes autonomes…

Lire la suite
Data Science

SAP Analytics Cloud – épisode 1 : booster SAC avec des visualisations innovantes D3.JS

Contexte et périmètre : Dans le cadre du Hackathon SAP Analytics Cloud (SAC) du 30 avril au 7 mai 2020, la tribu LIQSA (Liquid SAP Analytics) a réalisé un tableau de bord incorporant : un algorithme de Machine Learning en Python, des visualisations innovantes grâce à des librairies D3JS. Sachant que cet article fait référence à un PoC réalisé dans le cadre d’un hackathon très court, nous n’aborderons donc pas ici les problématiques de sécurité et d’authentification, qui sont inhérentes à tout projet informatique. Booster…

Lire la suite
Data Science

Le Comptoir du 10/12/2020 : Comment gagner des centaines de milliers d’euros en un jour de développement ? (Retour d’expérience sur la Total Digital Factory)

Comment gagner de la valeur en un jour de développement ? Le Jeudi 10 Décembre 2020, Emmanuel-Lin Toulemonde, consultant chez OCTO, et Marc Frignet, acheteur d’énergie chez Total “turned PO”, ont partagé leur retour d’expérience commune.   Contexte de la mission Les plateformes de raffinage et pétrochimie consomment beaucoup de gaz (celles de Total pèsent 5% de la consommation française de gaz) et d’électricité (0,5% de la consommation française, soit l’équivalent de la production d’une demi-centrale nucléaire). Ceci engendre des coûts de plusieurs centaines de…

Lire la suite