Publications de Marc Bojoly

Archi & techno

NewSQL

NewSQL. Beaucoup penseront à NoSQL. NewSQL est tiré du monde NoSQL mais reste différent. Comme NoSQL il s'agit d'une nouvelle architecture logicielle qui propose de repenser le stockage des données. Comme NoSQL elle tire partie des architectures distribuées, des progrès du matériel et des connaissances théoriques depuis 30 ans. Mais contrairement à NoSQL elle permet de conserver le modèle relationnel au coeur de notre SI. Est-ce seulement un moyen de plus pour surfer sur la vague NoSQL? Nous ne le pensons pas. Dans cette série…

Lire la suite
Archi & techno

Les patterns des Grands du Web – TP versus BI : la nouvelle approche NoSQL

Dans les SI traditionnels, les architectures de traitement de données structurées se sont généralement organisées en deux pôles distincts. Toutes les deux s’appuient certes sur une base de données relationnelle, mais avec des modèles et des contraintes propres D’un côté, le Transactional Processing (TP), à base de transactions ACID De l’autre la Business Intelligence (BI),  à base de tables de faits et de dimensions Les Grands du Web ont mis en place à la fois de nouveaux outils et de nouvelles façons d’organiser les traitements…

Lire la suite
Archi & techno

Les Patterns des Grands du Web – Commodity Hardware

Description Bien qu’invisibles depuis nos navigateurs des millions de serveurs fonctionnent continuellement pour que le web reste disponible 24h/24. Même si les chiffres restent confidentiels, un seul grand acteur du web peut nécessiter des dizaines, des centaines de milliers de machines comme EC2[1] voire aux alentours de 1 million chez Google[2]. La mise en œuvre d’un si grand nombre de machines représente un défi technique mais surtout économique. La grande majorité de ces acteurs ont relevé ce défi en utilisant du matériel de grande série,…

Lire la suite
Archi & techno

Les Patterns des Grands du Web – Sharding

Dans tout système d’information, les données sont un actif important qu’il faut capturer, conserver et traiter de façon fiable et efficace. Là où un serveur central joue très souvent le rôle de gardien des données, la majorité des grands du web ont opté pour une autre stratégie : le « sharding » ou distribution des données [1]. Le sharding décrit ainsi un ensemble de techniques qui permet de répartir les données sur plusieurs machines pour assurer la scalabilité de l’architecture.

Lire la suite
Archi & Techno

Audit with JPA: creation and update date

When writing a business application with persistent data, some auditing capabilities are often required. Today, state of the art for persisting data involves using an ORM tool through the JPA interface. Being able to add two columns containing the creation date and the update date is a common auditing requirement. My colleague Borémi and I have had to answer this question. We have grouped and studied several implementations already used by other Octos. In order to help you choose the best tool for such need,…

Lire la suite
Archi & techno

Audit avec JPA : date de création et de dernière mise à jour

Lorsqu'on écrit une application avec des données persistantes, il est souvent nécessaire de pouvoir réaliser de l'audit sur les modifications. Aujourd'hui, l'état de l'art pour la persistance des données se base sur des outils de type ORM à travers l'interface JPA en Java. Etre capable d'ajouter à chaque table la date de création et de dernière mise à jour est souvent la première demande en terme d'audit. Borémi et moi avons du répondre à cette question en mission. Nous avons regroupé et étudié différentes implémentations,…

Lire la suite
Archi & techno

QCon London 2011: un peu de process, beaucoup d’architecture et de la performance pour passer à l’échelle

Il y a une semaine, avait lieu la 5° édition de QCon, un événement incontournable pour l'architecture de SI, pour sentir les tendances de l'industrie, pour détecter quelques nouveautés. 6 tracks parallèles, un total de 90 sessions. Impossible de participer à tout mais voici ce que nous en avons envie de retenir :

Lire la suite
Évènement

Scala collections au PSUG

Fin janvier j'ai assisté à la 9ème session du Paris Scala User Group dont l'invité était Martin Odersky, le père du langage Scala. Celui-ci nous a présenté le framework de collections de Scala et en particulier les nouveautés de la version 2.8. Le sujet était riche et instructif, et, en approfondissant mes notes, ce qui ne devait être qu'un compte rendu est devenu un article que j'ai souhaité partager.

Lire la suite
Archi & techno

Ma lecture de l’architecture de Percolator : un composant du moteur de recherche Google

En avril 2010, Google a mis à jour son système d'indexation. Caffeine - le nom de ce projet - est sans doute passé inaperçu pour le grand public mais il représente un changement profond pour Google. Il n'améliore pas directement la page de recherche, comme a pu le faire instant search, mais il améliore le mécanisme d'indexation, ce qui permet de fournir des résultats pertinents. Pour l'utilisateur final, cette amélioration permet de réduire le délai entre le moment où une page est découverte sur le…

Lire la suite
Archi & Techno

My reading of Percolator architecture: a Google search engine component

In April 2010, Google updated its indexing system. Caffeine - the name of this project - was pretty transparent for the large public but represents an in depth change for Google. It does not directly improve the search page, like instant search, but the indexing mechanism, the way to provide pertinent search results. For the end user, this change allows reducing the delay between when a page is founded and when it is made available in the Google search. Google has recently published a research…

Lire la suite