NoSQL

NoSQL

Confluent ksqlDB – gestion des traitements de flux – bénéfices et risques

L’écosystème Kafka peut s’avérer difficile à appréhender dans beaucoup de projets de delivery. KsqlDB offre une abstraction intéressante en permettant de consommer des flux de données en SQL, comme sur une base de données classique.  Cette simplification permet d’initier rapidement une nouvelle application sans connaissance préalable de la plateforme. Cet article parcourt les fonctionnalités des différents outils de l’écosystème Kafka, détaille KsqlDB et tente de répondre aux questions suivantes : Quelle valeur cet outil peut-il apporter ? Dans quel cas l’utiliser et ne pas l’utiliser ? Comment…

Lire la suite
NoSQL

Construire un moteur de recherche avec DataStax

Introduction Comment construire un moteur de recherche qui rassemble ergonomie, performance et pertinence ? Cette question, nous nous la sommes posée dans le cadre d'un de nos projets. Le Product Owner nous a naïvement exprimé sa volonté d'avoir un moteur de recherche “à la Google” : un outil qui répond aux besoins de l'utilisateur sans aucune connaissance technique ou fonctionnelle préalable, avec une évaluation ludique de son contexte pour lui proposer des résultats pertinents. Une équation complexe qui demande avant toute implémentation une réflexion sur…

Lire la suite
NoSQL

Open-source analytics on MongoDB, with Schema

Victoire ! Votre nouvelle application rencontre un grand succès ! Elle collecte des données précieuses, stockées dans MongoDB. L’heure est venue de les analyser pour en tirer profit ! Malheureusement, vos analystes se trouvent bien démunis avec leurs outils SQL favoris... Mais où est donc déclaré le schéma des données ? Confrontés à de telles difficultés, nous avons assemblé, complété, et mis en production une plateforme qui vous aidera à analyser vos données MongoDB. La solution retenue consiste à synchroniser en temps réel les données stockées…

Lire la suite
NoSQL

Compte rendu du Spark Summit 2017 (Dublin)

Les 25 et 26 Octobre derniers, nous nous sommes rendus à Dublin afin d’assister au Spark Summit, grand-messe incontournable du Big Data organisée chaque année en Europe et aux États-Unis par Databricks (la société fondée par les créateurs d’Apache Spark). De très nombreux intervenants de tous horizons (industriels, académiques, éditeurs, contributeurs, etc.) étaient au rendez-vous. Au total : plus de 1200 participants, deux journées de conférences, plus d’une centaine de talks (créneaux de 30 minutes) et jusqu’à six présentations en parallèle. Au bout du compte,…

Lire la suite
NoSQL

Compte rendu du Spark Summit 2016

Le 26 et 27 Octobre, nous nous sommes rendus à Bruxelles afin d'assister au Spark Summit, la conférence de référence sur Apache Spark. Durant ces journées de talks et keynotes, deux sujets de fond ont été régulièrement abordés : les nouveautés de la release de Spark 2.0 et comment assurer le suivi de Spark en production.

Lire la suite
NoSQL

Rejoignez-nous au Datastax Day le mardi 14 juin à Paris

Cela fait 8 ans déjà que Cassandra est née. Elle est aujourd'hui à sa 3ème version majeure et c'est l'une des bases les plus utilisées dans la famille NoSQL. Que vous n'ayez jamais pratiqué ou bien que vous soyez experts, rejoignez nous pour découvrir la roadmap et l'écosystème en perpétuelle évolution de Cassandra lors du Datastax day.

Lire la suite
NoSQL

ScyllaDB contre Cassandra : vers un nouveau mythe ?

Disclaimer : L'ensemble des tests décrits dans cet article ont été réalisés sur la version 0.10 de ScyllaDB. Nous invitons le lecteur à se reporter au site http://www.scylladb.com/ pour une vision à jour de ScyllaDB Le 22 Septembre 2015, une communauté de développeurs annonce avoir mis au point une nouvelle base de données, et pas n’importe laquelle, la plus rapide au monde ! Répondant au doux nom de ScyllaDB, celle-ci s’inscrit dans la mouvance NoSQL dont les principales ambitions sont : Rendre les systèmes "scalables" en répartissant…

Lire la suite
NoSQL

Savoir utiliser & configurer Elasticsearch

OCTO Academy

Elasticsearch est un moteur de recherche conçu dès le départ pour être distribué et gérer des volumes de données massifs. Il se base sur la librairie Apache Lucene et lui ajoute des fonctionnalités supplémentaires pour la mise en cluster, la haute disponibilité ainsi qu'une API puissante. OCTO Academy vous propose une formation sur ce sujet. Cette formation de 3 jours a pour objet de présenter Elasticsearch et toutes les notions importantes pour développer de façon efficace avec Elasticsearch. Elle est aussi l'occasion de jeter un œil…

Lire la suite