Data & AI

Posté le 11/02/2019 par Emmanuel Lin Toulemonde

Dans la tendance de l’industrialisation de la data science, une douleur importante est de garder la trace des expérimentations menées. C’est-à-dire tracer les résultats obtenus avec une version du jeu de données, un type de modèle et un set de méta-paramètres.Le graal est peut-être de faire comme Facebook : des modèles de modèles. Mais avant d’atte...

Lire la suite >

Posté le 09/01/2019 par Aurélien Massiot

Python est le langage privilégié chez les Data Scientists, notamment grâce à toutes ses librairies open-source et sa facilité de mise en production du code. Pourtant, à mesure que la volumétrie des données augmente, le passage à des paradigmes différents comme ceux de Spark et Hadoop est recommandé car plus scalable. Cependant, cela nécessite souve...

Lire la suite >

Posté le 07/01/2019 par abakhti, Aurélien Gervasi, Fabien Arcellier

Knowledge is a goldmine for companies. It comes in different shapes and forms: mainly documents (presentation slides and documentation) that allow businesses to share information with their customers and staff. The way companies harness this knowledge is central to their ability to develop their business successfully.One of the common ways to ease ...

Lire la suite >

Posté le 12/12/2018 par Joy Boswell, Mathieu Poignant

...mais on a rarement des réponses claires aux questions qu’on se pose !La Duck Conf est faite pour ça ; pour partager et explorer des sujets pratiques, techniques, incontournables, qui nous font aimer l’archi.A commencer par les grands classiques : que faire du legacy ? Ou plus récemment, comment je me mets en conformité avec le RGPD ?... En s’att...

Lire la suite >

Posté le 10/12/2018 par Yacine Benabderrahmane, Benjamin Joyen-Conseil, Pierre Baonla Bassom

Jeudi 29 novembre, l’équipe Big Data Analytics, en charge des sujets d'Intelligence Artificielle à OCTO Technology, a présenté au cours d'une Matinale sa vision de l'industrialisation de l'IA (voir la vidéo de la Matinale, obtenir les slides).L’IA, actuellement portée par la hype, est un buzzword qui veut souvent dire tout et n’importe quoi. Data s...

Lire la suite >

Posté le 09/11/2018 par Samuel Rochette

Dans le cadre de l’apprentissage supervisé, un modèle de régression permet d’inférer la valeur associée à une observation à partir d’exemples. Prosaïquement, on cherche à prédire le comportement moyen d’une variable cible Y à partir des variables explicatives X décrivant les observations. C’est l'espérance de Y sachant X, notée E[Y|X].Est-il possib...

Lire la suite >

Posté le 12/10/2018 par Benoit Meriaux, Adrien Besnard, Philippe Prados

La semaine dernière, nous nous sommes rendus à Londres pour assister à la conférence de référence sur Apache Spark en Europe ; qui s’est pour l’occasion renommée en Spark + AI Summit. Au fur et à mesure des conférences, trois sujets majeurs ont émergé et nous ont permis de mieux appréhender l’évolution d’Apache Spark et la direction prise par le pr...

Lire la suite >

Posté le 02/08/2018 par Louis Boutin, Paul De Nonancourt

“Si j’ai une valeur y qui est fonction de x, comment faire pour déterminer la valeur de x minimisant ou maximisant la valeur de y ?” tel est le problème de base du domaine de l’optimisation, qui se décline à de très nombreux cas d’usage allant de “comment fixer le prix pour maximiser un profit” à “quelle stratégie mon robot doit-il adopter pour res...

Lire la suite >

Posté le 07/05/2018 par Arthur Baudry

This article is part of a series designed to demonstrate the setup and use of the Confluent Platform. In this series, our goal is to build an end to end data processing pipeline with Confluent.Disclaimer: While knowledge of Kafka internals is not required to understand this series, it can sometimes help clear out some parts of the articles.In the p...

Lire la suite >

Posté le 01/05/2018 par Arthur Baudry

This article is part of a series designed to demonstrate the setup and use of the Confluent Platform. In this series, our goal is to build an end to end data processing pipeline with Confluent.Disclaimer: While knowledge of Kafka internals is not required to understand this series, it can sometimes help clear out some parts of the articles.BASICSIf...

Lire la suite >