Benjamin Joyen-Conseil

Posté le 09/12/2020 par Benjamin Joyen-Conseil

IntroductionCet article n’est pas un article comme les autres, c’est un extrait brut de discussion que nous avons sur notre mailing-list “tech” interne, un bout de la culture OCTO.tech : L’objectif de cette mailing-list est d’échanger entre OCTO sur des sujets techniques, on y retrouve des demandes d’aide sur un sujet ou une architecture technique,...

Lire la suite >

Posté le 10/12/2018 par Yacine Benabderrahmane, Benjamin Joyen-Conseil, Pierre Baonla Bassom

Jeudi 29 novembre, l’équipe Big Data Analytics, en charge des sujets d'Intelligence Artificielle à OCTO Technology, a présenté au cours d'une Matinale sa vision de l'industrialisation de l'IA (voir la vidéo de la Matinale, obtenir les slides).L’IA, actuellement portée par la hype, est un buzzword qui veut souvent dire tout et n’importe quoi. Data s...

Lire la suite >

Posté le 31/01/2018 par Philippe Prados, Benjamin Joyen-Conseil, Loup Theron, Marc Bojoly, Vincent Guigui, Yacine Benabderrahmane

En ce début d’année 2018, nous avons demandé à quelques Octos comment ils prévoient l’évolution de leur métier, des technologies, les ruptures, les nouvelles approches, etc. C’est un exercice de style qui ne prétend pas nécessairement dire le vrai, mais qui a le mérite de présenter certaines convictions et d’inviter au débat. Partagez avec nous vos...

Lire la suite >

Posté le 12/10/2015 par Benjamin Joyen-Conseil, Oliver Baillot

I propose in this paper a chronological review of the events and ideas that have contributed to the emergence of Big Data technologies of today and tomorrow. What we can see regarding bottlenecks is that they move according to the technical progress we make. Today is the JVM garbage collector, tomorrow will be a different problem.Here is my side of...

Lire la suite >

Posté le 18/09/2015 par Benjamin Joyen-Conseil

Je vous propose dans cet article une revue chronologique des événements et des idées qui ont contribué à l’émergence des technologies Big Data d’aujourd’hui et de demain. Ce que nous pouvons constater au niveau des bottlenecks (=goulots d’étranglements) est qu’ils se déplacent en fonction des avancées techniques que nous faisons. Aujourd’hui c’est ...

Lire la suite >

Posté le 28/07/2015 par Thiago Ramos Santiago, Benjamin Joyen-Conseil

Há algum tempo ando experimentando alguns “macetes” para lidar com os dados de forma eficiente dentro do HDInsight, e como tenho obtido resultados conclusivos, fiz esse artigo para compartilhar com vocês essa experiência.Importante esclarecer que este artigo não se trata especificamente de uma comparação de desempenho e sim de uma experiência empír...

Lire la suite >

Posté le 23/09/2014 par Benjamin Joyen-Conseil

Aujourd’hui, je vais parler d’Apache Pig, un outil de traitement type batch s’appuyant sur Hadoop, et de test unitaire. Le but de cet article est de présenter PigUnit comme potentielle solution pour nos tests et d’automatisation des développements. Sur la fin, je donne quelques tips et contournements aux bugs existants.Pourquoi tester Pig ?J’ai ch...

Lire la suite >

Posté le 26/06/2014 par Benjamin Joyen-Conseil

Cela fait quelque temps que j’expérimente des Tips & Tricks sur mes algos pour traiter de la data de façon performante et comme ça a été plutôt concluant dans mon cas, j’ai mis tout ça au propre pour les partager ici avec vous.Les quatre optimisations que je présente ici vont faire passer le temps d’exécution de 45 minutes à moins de 3 minutes. La ...

Lire la suite >

1