NoSQL

Archi & techno

GemFire et traitement distribué

Les enjeux autour de la donnée sont en train de changer par rapport à ce que l’on connait depuis les SGBDR : volume de plus en plus important, nombre d’utilisateur croissant, accès concurrents et transactionnels intensifs à la fois en lecture et en écriture, haute disponibilité à des niveaux coûts acceptables, coût de licence. Dans un tel contexte, les bases de données traditionnelles peuvent  montrer leurs limites.

Lire la suite
Brèves de consultants

BigData : la fin des architectures basées sur les processus métiers?

Le BigData, une nouvelle (r)évolution pour les entreprises? McKinsey a publié récemment un rapport sur l'avènement du BigData comme nouveau paradigme de compétition entre les entreprises. L'analyse massive et le développement du capital informationnel (le BigData) deviendrait un nouveau levier pour la productivité, l'innovation et la croissance.

Lire la suite
Archi & techno

Vers des API haut niveau pour Java et NoSQL avec Spring Data

A l'heure où les nouvelles technologies de stockage de données regroupées sous les termes NoSQL et Distributed Data Grid deviennent populaires, il est intéressant de suivre l'évolution de cet écosystème et notamment des librairies d'intégration avec ces outils. Des librairies apportant un certain niveau d'abstraction émergent, avec l'espoir de voir apparaître des solutions de haut niveau comparables aux ORM que nous utilisons pour les bases relationnelles. Nous allons nous intéresser aujourd'hui au projet Spring Data, qui propose une certaine unification pour les accès aux bases de…

Lire la suite
Archi & techno

QCon London 2011: un peu de process, beaucoup d’architecture et de la performance pour passer à l’échelle

Il y a une semaine, avait lieu la 5° édition de QCon, un événement incontournable pour l'architecture de SI, pour sentir les tendances de l'industrie, pour détecter quelques nouveautés. 6 tracks parallèles, un total de 90 sessions. Impossible de participer à tout mais voici ce que nous en avons envie de retenir :

Lire la suite
Archi & techno

Exemple d’infrastructure MongoBD : haute disponibilité en lecture

Imaginons le cas suivant : nous avons une base MongoDB, alimentée exclusivement par des batchs ordonnancés et via un client back office. Les utilisateurs, très nombreux,  y accèdent via une application client-serveur. La consistance ne doit être qu'in fine (eventually consistent en anglais). Nous avons donc, en gros, 1 accès en écriture pour 10 accès en lecture. Quelle architecture pourrions-nous mettre en place pour assurer la haute disponibilité de notre base de données et  donc nous prévenir de risques comme la perte d'un disque dur ?…

Lire la suite
Archi & techno

Scribe, Chukwa…des collecteurs permettant d’alimenter le HDFS

HDFS, que nous avons déjà évoqué, reste un système de fichier distribué et il faut donc l'alimenter. Il y existe plusieurs options : à la manière batch. La première option est donc de continuer à collecter les données sur un système de fichier local et de les importer sur le HDFS par vacation. La seconde option serait d'utiliser un ETL. Pentaho a annoncé le support de Hadoop pour sa solution Data Integration Product. Les premiers tests que l'on a réalisé nous montre que cela fonctionne…

Lire la suite
Archi & Techno

Scribe : a way to aggregate data and why not, to directly fill the HDFS?

HDFS is a distributed file system and quickly raise an issue : how to fill this file system with all my data? There are several options that go from batch import to Straight Through Processing. Bulk load style. The first one is to keep collecting data on local file system and importing them by vacation. The second one is to use an ETL. Pentaho has announced support of Hadoop for Data Integration product. The first tests we conducted lead us to think this works much…

Lire la suite
Archi & Techno

Scribe installation

Scribe installation is a little bit tricky (I need to precise I am not what we can call a C++ compilation expert and thanks to David for his help...). Here is so how I installed Scribe on my Ubuntu (Ubuntu 10.04 LTS - the Lucid Lynx - released in April 2010)

Lire la suite
Évènement

Et si vous codiez une application qui supporte 1 milliard d’utilisateurs ?

Le Challenge USI est un concours organisé dans le cadre de l’USI 2011, en partenariat avec VMware et Steria. Il est ouvert à des équipes d’étudiants et de développeurs qui ont envie d’implémenter des architectures à haute performance, comparables à celles des grands du Web (Google, Facebook, Twitter, etc.). Il consiste à créer une application de Quiz Synchrone qui supporte 1 milliard d'utilisateurs, dont 1 million en simultané. L’architecture technique est complètement libre, sous contrainte de système Linux. Les 3 équipes dont l'application aura permis…

Lire la suite