Data & AI

Posté le 09/06/2020 par

Introduisons les éléments de terminologie de l'Apache Kafka : topic, partition, consumer, producer...

Lire la suite >

Posté le 05/06/2020 par Julie Gallavardin, Laurent SOLLIER

Premier semestre 2018 : branle-bas de combat pour se mettre en conformité avec le RGPD. L’équipe projet a mis votre entreprise en conformité et identifié une liste de points à corriger.Deuxième semestre 2018 : le soufflé retombe. La liste à la prévert des préconisations serait-elle tombée aux oubliettes ?C’est un scénario réaliste si vous vous étie...

Lire la suite >

Posté le 27/05/2020 par David HUANG

Les réseaux de neurones convolutionnels permettent d’effectuer diverses tâches de traitement d’images, comme de la reconnaissance d’images ou la détection d’objets. (Cf article sur le fonctionnement des réseaux de neurones ici)Dans la suite de cet article, nous nous pencherons sur le cas réseaux de neurones convolutionnels pour la classification d’...

Lire la suite >

Posté le 13/05/2020 par Emmanuel Lin Toulemonde

IntroductionEn phase de construction d’un modèle de machine learning supervisé, les data scientists évaluent la performance de leur modèle par rapport aux labels en utilisant une métrique (par exemple l’AUC). Cela leur permet d’avoir un a priori sur les performances du système qu’ils sont en train de construire.Cette évaluation n’est qu’un a priori...

Lire la suite >

Posté le 05/05/2020 par Aurélien Massiot, Léa Naccache

Le Machine Learning nous permet aujourd’hui de classifier facilement du texte ; or, le texte appartient parfois à plusieurs catégories, d’où le nom de classification multilabels pour parler de cette tâche. Nous allons voir dans cet article comment traiter ce problème, évaluer la performance de nos algorithmes et les interpréter.Avant toute chose, l...

Lire la suite >

Posté le 24/04/2020 par Paul DALOUS, Yannick Schini

Afin d’explorer de nouvelles possibilités concernant la conduite autonome, de nombreuses compétitions de mini-voitures autonomes existent telles que la compétition de l’Iron Car ou encore la compétition Donkey ® Car  aux États-Unis. Lors de ces compétitions, des mini voitures (type voitures radiocommandées) doivent parcourir quelques tours d’un cir...

Lire la suite >

Posté le 16/03/2020 par Taha Yassine Ben Ali

Dans un problème de classification, il arrive souvent d’avoir des datasets très déséquilibrés. On parle d’un dataset déséquilibré lorsque le ratio des observations d’une classe par rapport à l’ensemble des observations est très faible.Cette notion de déséquilibre de classes est relativement fréquente dans plusieurs secteurs comme le secteur médical...

Lire la suite >

Posté le 04/02/2020 par Hugo Robellaz

On parle beaucoup de mise en production de data science, mais peu du jour d'après. Que se passe-t-il après la mise en production, comment monitorer un modèle de data science ? Les systèmes de data science introduisent une complexité supérieure à une application de SI traditionnelle puisqu’ils sont souvent composés de composants introduisants de l’a...

Lire la suite >

Posté le 14/01/2020 par Anne Sophie Varnier

La Duck Conf est la conférence des amoureux de l'architecture SI dispensée par nos experts.Cette troisième édition s’adresse aux architectes techniques, architectes de données et d’entreprise, aux TechLead et aux experts en tout genre qui souhaitent soulever le capot et aborder concrètement leurs problématiques projet…Unique à Paris, elle offre un ...

Lire la suite >

Posté le 17/12/2019 par Emmanuel Lin Toulemonde, Mehdi Houacine

Lorsque l’on s'apprête à mettre (ou lorsque l’on a mis) un système de data science en production, on souhaite s’assurer qu’il fonctionne comme prévu. Pour cela, il convient de monitorer ce système intelligent.

Lire la suite >