Data & AI

Posté le 20/04/2018 par Arthur Baudry

This article is part of a series designed to demonstrate the setup and use of the Confluent Platform. In this series, our goal is to build an end to end data processing pipeline with Confluent.Disclaimer: While knowledge of Kafka internals is not required to understand this series, it can sometimes help clear out some parts of the articles.INTRODUC...

Lire la suite >

Posté le 23/03/2018 par Sofiene Alouini, Pierre-Alain Jachiet

Cet article est le premier d’une série sur les réseaux récurrents. Nous les introduisons ici en jouant avec du texte. Dans un prochain article, nous entrerons dans les arcanes des LSTM, avant d’exposer leur utilisation avancée sur des données de capteurs connectés.Êtes-vous nostalgiques de la période électorale ? Les grandes envolées lyriques de no...

Lire la suite >

Posté le 31/01/2018 par Philippe Prados, Benjamin Joyen-Conseil, Loup Theron, Marc Bojoly, Vincent Guigui, Yacine Benabderrahmane

En ce début d’année 2018, nous avons demandé à quelques Octos comment ils prévoient l’évolution de leur métier, des technologies, les ruptures, les nouvelles approches, etc. C’est un exercice de style qui ne prétend pas nécessairement dire le vrai, mais qui a le mérite de présenter certaines convictions et d’inviter au débat. Partagez avec nous vos...

Lire la suite >

Posté le 25/01/2018 par Thibaut Cantet, Vincent Guigui

Si vous souhaitez développer votre propre chatbot textuel ou vocal, vous serez confrontés à la question suivante : quel moteur de langage naturel choisir selon mes contraintes et exigences.Nous proposons de vous partager notre avis sur cinq des moteurs de langage naturel les plus répandus actuellement :Luis.aiDialogflow (anciennement api.ai)Wit.aiR...

Lire la suite >

Posté le 29/11/2017 par Adrien Besnard, Marc Alonso

A la fin de l’épisode précédent, nous étions capables d’exécuter une requête SQL à partir d’un plan d'exécution optimisé. Ce fut notamment l’occasion de plonger au coeur du moteur d’optimisation Catalyst.Nous allons à présent nous intéresser à une optimisation issue du moteur Tungsten, embarquée dans Spark dès la version 2.0, qui remet en cause ce ...

Lire la suite >

Posté le 20/11/2017 par Aurélien Gervasi, Pierre-Alain Jachiet

Victoire ! Votre nouvelle application rencontre un grand succès ! Elle collecte des données précieuses, stockées dans MongoDB. L’heure est venue de les analyser pour en tirer profit ! Malheureusement, vos analystes se trouvent bien démunis avec leurs outils SQL favoris... Mais où est donc déclaré le schéma des données ?Confrontés à de telles diffic...

Lire la suite >

Posté le 08/08/2017 par Adrien Besnard, Marc Alonso

Nous poursuivons aujourd'hui notre série d'articles dédiée à la démystification de Spark et plus particulièrement au moteur d'exécution Tungsten.Pour rappel, dans l'épisode précédent, nous sommes partis d'une requête SQL sous forme de que nous avons d'abord découpée en une instance de grâce à notre classe , puis en une instance d' grâce à notre c...

Lire la suite >

Posté le 31/07/2017 par Adrien Besnard, Marc Alonso

Spark est en évolution constante et maintient un rythme soutenu de sorties de releases, en témoigne la dernière version en date, la 2.2. Dans cette série d'articles, nous allons revenir ensemble sur différentes mécaniques actuellement en place au sein de cet outil et essayer d'en comprendre le fonctionnement.code {<br /> background-color: #efefef;<...

Lire la suite >

Posté le 17/01/2017 par David Luz

On december 2nd was given at Telecom ParisTech the workshop : “Using Scikit-learn and Scientific Python at Scale” with top contributors from the project as speakers. This workshop was divided into four talks :Scikit-learn for industrial applications, basic research and mind reading - Alexandre GramfortDistributed computing for predictive modeling i...

Lire la suite >

Posté le 05/12/2016 par David Alia

If Athena only evokes this (traumatic, isn't it?) scene to you, you'll be disappointed: this blog post is dedicated to Amazon Athena, the latest analytic tool recently announced at Re:invent 2016.What is Athena?Athena is self defined as a "Serverless Interactive Query Service". Let's detail."Interactive Query Service": easy to figure out, there are...

Lire la suite >