PerfUG : Hadoop et HDFS : Stockage, Requêtage et Performances

le 15/04/2014 par Jean-Philippe Briend

Hadoop est principalement utilisé pour le monde batch. Le paradigme MapReduce sur Hadoop ne propose pas de transformation ou de requêtage performant mais plutôt un traitement d'une forte volumétrie de données.

Cependant, la performance n'est pas à négliger dans certains cas :

• lorsque la fenêtre de traitement des données devient serrée pour fournir des données à jour

• des besoins de requêtages ponctuels par des analystes peuvent arriver au travers d'outils type Hive ou Pig.

Il devient nécessaire de fournir ces données dans un temps de requêtage supportable à l'échelle humaine.

Cette session permet d'introduire les basiques d'Hadoop et de HDFS ainsi que des astuces de performance sur le stockage, le requêtage (Hive, MapReduce) ainsi que sur du paramétrage.

Le speaker de cette session est Sofian Djamaa, Software Engineer chez Criteo.

Pour le descriptif complet de la séance, suivez le lien.

L'événement aura lieu le Jeudi 24 Avril à 19h. Pour s'inscrire, c'est sur Eventbrite.