PerfUG : Fast Data Pipelines with Kafka

le 03/02/2015 par Benjamin Brabant

Apache Kafka est un système de type pub/sub distribué, construit avec des performances difficilement égalées dans le monde open source, aussi bien en termes de latence que de débit.

De plus en plus, il est devenu la principale épine dorsale des architectures Big Data, notamment dans la construction de pipelines pouvant supporter de gros volumes de données dans un contexte quasi temps réel.

Dans cette présentation, nous découvrirons les choix d'architectures et d'implémentations qui procurent à Kafka ses performances tant vantées. Puis dans une seconde partie, nous explorerons quelques optimisations pour une utilisation effective à large échelle de Kafka.

Sam Bessalah est ingénieur freelance passionné de programmation, calcul distribué, data engineering, machine learning ou encore développement web. Très présent autour des sujets Big Data que ce soit sur l'aspect architecture système (Hadoop, Mesos, Kafka, ...) ou analyse de données (Machine learning, Modèles mathématiques, ...), on le retrouve à Devoxx ou encore plus récemment en interview chez LesCastCodeurs.

La session aura lieu le 19 février dans les locaux d'OCTO Technology. Inscriptions et informations sur Meetup. Cette session sera suivie d'un pot dans les locaux d'Octo.