Une base de données purement fonctionnelle

Le modèle relationnel est né à une époque où l’espace était rare, et fut donc conçu pour minimiser le niveau de redondance des données: il était plus économique de stocker une indirection vers une chaine de caractères que de stocker cette chaine deux fois.
Aujourd’hui, cette contrainte d’espace ne tient plus. On achète un Teraoctet pour 100 dollars, la RAM est abondante, et les disques flash aux performances élevées vont bientôt rejoindre le prix des disques durs rotatifs.

Deux limitations fondamentales du stockage ont donc disparu: le coût de la redondance et le coût de la non-localité pour le traitement de structures de données complexes. Il est maintenant possible de concevoir de nouvelles bases de données plus riches et plus sûres.

(Lire la suite…)

Vidéo du petit-déjeuner NoSQL : « l’Extreme Transaction Processing » devient une réalité

Jeudi 15 décembre, OCTO organisait un petit-déjeuner NoSQL : « l’Extreme Transaction Processing, devient une réalité ».

Aujourd’hui, la multiplication des systèmes connectés à Internet (smartphone, tablette, TV connectée, véhicule connecté) et l’émergence des nouveaux flux de données issus notamment du web social (Facebook commerce, mobile-to-mobile, etc) vont pousser un peu plus les Systèmes d’Information vers l’Extreme Transaction Processing (XTP).

(Pour plus d’informations sur le contenu, veuillez cliquer ici)

Grâce à la vidéo de l’évènement disponible sur You Tube, vous pouvez découvrir les divers points abordés lors de ce Petit-Déjeuner, à savoir :

  • les concepts et les opportunités métiers autour de l’ »Extreme Transaction Processing« 
  • les enjeux d’architecture et d’exploitation
  • les fonctionnalités et l’implémentation faite par les solutions VMware Gemfire et SQLFire

Pour tout autre renseignement, contactez nous sur : contact@octo.com

 
Cliquez sur l’image pour lancer la vidéo
 

La crise économique, une opportunité à ne pas rater !

La crise économique, une opportunité à ne pas rater !
L’actualité financière et les perspectives économiques mettent sous pression les budgets des DSI. Les coups de rabot budgétaires ont le mérite de mettre en évidence les sujets perçus comme les plus importants et urgents.
Arbitrer entre maintenir à flot l’activité métier ou la transformer est un choix difficile pour chaque Direction : « run the business or change the business » ? Les investissements SI sont soumis également à ce dilemme.
Néanmoins, les entreprises qui sauront mettre à profit cette période troublée pour se transformer sauront en bénéficier plus tôt. Alors que celles, qui ne le feront pas, n’auront pas eu le temps de le faire avant la prochaine crise, qui les paralysera à nouveau.
Dans une logique de recentrage des investissements SI, la question est donc de bien identifier les sujets qui permettent d’obtenir une réduction significative des coûts opérationnels et de rentabiliser à court terme la transformation des activités. Il faut bien l’admettre, cet exercice nécessite une bonne dose de créativité et d’innovation.
(Lire la suite…)

Petit-déjeuner NoSQL : « l’Extreme Transaction Processing » devient une réalité


OCTO organise le jeudi 15 décembre à partir de 8h45 un petit déjeuner gratuit NoSQL : « l’Extreme Transaction Processing » devient une réalité,  aux salons Wagram.

Pour vous inscrire cliquez ici . Découvrez le descriptif de l’évènement et les intervenants dans ce billet.

Les années 2000, avec l’avènement d’Internet comme nouveau canal pour les entreprises, avaient fortement secoué les Systèmes d’Information et les serveurs d’applications avaient permis de faire face aux enjeux d’ouverture et d’augmentation de traffic sur les systèmes (Transaction Processing).

Aujourd’hui, la multiplication des systèmes connectés à Internet (smartphone, tablette, TV connectée, véhicule connecté) et l’émergence des nouveaux flux de donnéesissus notamment du web social (Facebook commerce, mobile-to-mobile, etc) vont pousser un peu plus les Systèmes d’Information vers l’Extreme Transaction Processing (XTP).

Les technologies XTP (généralement classées sous les acronymes « noSQL », « Data Grid ») existent et même si elles étaient jusqu’alors réservées à des secteurs de niche (Marchés financiers, Défense, Industrie du web), l’évolution des architectures techniques permet aujourd’hui de mettre en place ces solutions transactionnelles hautement performantes et abordables dans des secteurs comme la banque, l’assurance, les médias, les télécommunications et le e-commerce. Les bases de données relationnelles se font challenger par ces nouvelles solutions et technologies tant sur le rapport coût/puissance que sur leur simple pertinence technologique.

En qualité d’architectes de Systèmes d’Information, OCTO présentera les enjeux métiers et principes d’architecture technique nécessaires à l’Extreme Transaction Processing afin de vous donner une vision claire des principaux enjeux, des compromis nécessaires et du positionnement des solutions du marché.

(Lire la suite…)

GemFire et traitement distribué

Les enjeux autour de la donnée sont en train de changer par rapport à ce que l’on connait depuis les SGBDR : volume de plus en plus important, nombre d’utilisateur croissant, accès concurrents et transactionnels intensifs à la fois en lecture et en écriture, haute disponibilité à des niveaux coûts acceptables, coût de licence. Dans un tel contexte, les bases de données traditionnelles peuvent  montrer leurs limites.

(Lire la suite…)

BigData : la fin des architectures basées sur les processus métiers?

Le BigData, une nouvelle (r)évolution pour les entreprises?

McKinsey a publié récemment un rapport sur l’avènement du BigData comme nouveau paradigme de compétition entre les entreprises.

L’analyse massive et le développement du capital informationnel (le BigData) deviendrait un nouveau levier pour la productivité, l’innovation et la croissance.

(Lire la suite…)

Vers des API haut niveau pour Java et NoSQL avec Spring Data

A l’heure où les nouvelles technologies de stockage de données regroupées sous les termes NoSQL et Distributed Data Grid deviennent populaires, il est intéressant de suivre l’évolution de cet écosystème et notamment des librairies d’intégration avec ces outils.
Des librairies apportant un certain niveau d’abstraction émergent, avec l’espoir de voir apparaître des solutions de haut niveau comparables aux ORM que nous utilisons pour les bases relationnelles. Nous allons nous intéresser aujourd’hui au projet Spring Data, qui propose une certaine unification pour les accès aux bases de données dites NoSQL. (Lire la suite…)

QCon London 2011: un peu de process, beaucoup d’architecture et de la performance pour passer à l’échelle

Il y a une semaine, avait lieu la 5° édition de QCon, un événement incontournable pour l’architecture de SI, pour sentir les tendances de l’industrie, pour détecter quelques nouveautés. 6 tracks parallèles, un total de 90 sessions. Impossible de participer à tout mais voici ce que nous en avons envie de retenir :
(Lire la suite…)

Exemple d’infrastructure MongoBD : haute disponibilité en lecture

Imaginons le cas suivant : nous avons une base MongoDB, alimentée exclusivement par des batchs ordonnancés et via un client back office. Les utilisateurs, très nombreux,  y accèdent via une application client-serveur. La consistance ne doit être qu’in fine (eventually consistent en anglais). Nous avons donc, en gros, 1 accès en écriture pour 10 accès en lecture. Quelle architecture pourrions-nous mettre en place pour assurer la haute disponibilité de notre base de données et  donc nous prévenir de risques comme la perte d’un disque dur ? Comment pourrions-nous nous prémunir facilement contre une corruption et donc adresser la problématique de back up ? Je vais essayer de vous proposer une réponse unique à ces deux questions, en utilisant les fonctionnalités natives de MongoDB alliées aux possibilités offerte par l’utilisation des services proposés par Amazon Web Services…

(Lire la suite…)

Scribe, Chukwa…des collecteurs permettant d’alimenter le HDFS

HDFS, que nous avons déjà évoqué, reste un système de fichier distribué et il faut donc l’alimenter. Il y existe plusieurs options :

  • à la manière batch. La première option est donc de continuer à collecter les données sur un système de fichier local et de les importer sur le HDFS par vacation. La seconde option serait d’utiliser un ETL. Pentaho a annoncé le support de Hadoop pour sa solution Data Integration Product. Les premiers tests que l’on a réalisé nous montre que cela fonctionne mieux pour extraire de la donnée du HDFS (via Hive) que pour l’importer (après, ce n’est certainement qu’une question de temps avant que Pentaho fasse le nécessaire). La troisième option serait d’utiliser Sqoop. Sqoop permet d’extraire ou d’importer des données depuis votre RDBMS en utilisant un algorithme de Map/Reduce.
  • à la manière « fil de l’eau ». Dans ce domaine, les solutions se prénomment Flume, Chukwa (qui fait partie du projet Apache Hadoop) ou Scribe. En somme, vous collectez et aggréger des données, de différentes sources, différentes applications, différentes machines « au fur et à mesure ». Toutes ces solutions fonctionnent globalement de la même manière. On peut cependant noter que Flume ou Chukwa proposent une typologie de connecteurs plus riches que Scribe dans la mesure ou par exemple, il est possible de ce connecter en « tail » sur un fichier etc, etc…Chukwa est également plus simplement intégrable avec la stack Hadoop que ce que peut l’être Scribe.

Reste que c’est Scribe, massivement utilisé chez Facebook, que nous allons décortiquer dans cette article (en anglais)