Big Data

Big Data

L’évolution des bottlenecks dans l’écosystème BigData

Je vous propose dans cet article une revue chronologique des événements et des idées qui ont contribué à l’émergence des technologies Big Data d’aujourd’hui et de demain. Ce que nous pouvons constater au niveau des bottlenecks (=goulots d’étranglements) est qu’ils se déplacent en fonction des avancées techniques que nous faisons. Aujourd’hui c’est le garbage collector de la JVM, demain ce sera un problème différent. Voici ma version de l’Histoire :

Lire la suite
Big Data

Collecte de tickets de caisse : vue sur l’architecture

Suite à notre premier article sur les enjeux métiers que représentent la collecte et l’analyse de la donnée dans le secteur de la grande distribution, nous allons présenter un use case et les problématiques qui y sont associées. Nous verrons comment leur faire face en se basant sur des technologies récentes qui ont déjà fait leurs preuves chez les géants du Web : Kafka, Spark et Cassandra.

Lire la suite
Big Data

Quelle solution de persistance pour ma stratégie cross-canal ?

"67% des consommateurs utilisent à la fois leur ordinateur, leur tablette et leur smartphone pour faire un achat. Et 98% d’entre eux passent d’un support à un autre dans la même journée" (source  : Skeelbox). Cette tendance souligne l'importance de s'adapter à ces usages en adoptant une stratégie cross-canal. Mais qu’est-ce qui se cache vraiment derrière ce terme? Quels sont les enjeux technologiques liés à cette stratégie? Comment la mettre en oeuvre chez moi, et avec quelles solutions pour stocker mes données. C’est ce que…

Lire la suite
Big Data

Les Géants du Web

Il se passe, en ce moment, quelque chose d'extraordinaire. Presque une révolution. De l'autre côté de l'Atlantique, mais aussi à d'autres endroits du monde comme en France, des individus sont en train de réinventer la façon de faire de l'informatique. Ils s'appellent Amazon, Facebook, Google, Netflix ou LinkedIn pour les plus connus. Cette nouvelle génération d'acteurs a su se libérer des dogmes du passé et aborder les sujets avec fraicheur pour apporter des solutions nouvelles, radicales, efficaces à de vieux problèmes de l'informatique. OCTO Academy…

Lire la suite
Big Data

Savoir utiliser & configurer Elasticsearch

OCTO Academy

Elasticsearch est un moteur de recherche conçu dès le départ pour être distribué et gérer des volumes de données massifs. Il se base sur la librairie Apache Lucene et lui ajoute des fonctionnalités supplémentaires pour la mise en cluster, la haute disponibilité ainsi qu'une API puissante. OCTO Academy vous propose une formation sur ce sujet. Cette formation de 3 jours a pour objet de présenter Elasticsearch et toutes les notions importantes pour développer de façon efficace avec Elasticsearch. Elle est aussi l'occasion de jeter un œil…

Lire la suite
Big Data

Vivez l’expérience formation avec OCTO

OCTO Academy

Avec la digitalisation nous apprenons de multiples façons, partout et tout le temps. Chez OCTO Academy, nous sommes sans cesse à la recherche de nouvelles formes d'apprentissage et de nouvelles sources d'inspiration pour remplir notre mission : accompagner les entreprises et leurs équipes dans leurs projets de transformation. Nos formations premium : mai-juin…

Lire la suite
Big Data

BOOSTEZ vos compétences chez OCTO Academy

OCTO Academy

Nous vous proposons une véritable EXPÉRIENCE D'APPRENTISSAGE et pas seulement du « prêt à penser » ! Nous croyons profondément que : le CONTENANT a autant de valeur et d’impact que le contenu l’APPRENTISSAGE des systèmes humains et sa compréhension sont les CLÉS du FUTUR au-delà même de l’entreprise Nos formations premium : avril - mai…

Lire la suite
Big Data

Réinventez la formation interentreprises avec OCTO Academy

Chez OCTO Academy, vous ne trouverez pas de formations sur étagères sans saveur. Notre crédo : garantir l'excellence, la variété et l'adaptabilité de nos prestations.   NOS FORMATIONS PREMIUM : MARS - AVRIL OFFICIELLES EN BIG DATA - Formation officielle administrateur "Déployer & gérer un cluster Couchbase" : 9 - 12 mars - Administrer la plateforme Hadoop 2.X Hortonworks : 9 - 12 mars - Analyse de données pour Hadoop 2.X Hortonworks avec Pig & Hive : 16 - 19 mars  - Développer des applications pour Hadoop 2.X Hortonworks avec Java : 23 -…

Lire la suite
Big Data

Quel avenir pour la Data Science? Réalités et stratégie des entreprises

Les géants du web sont à l'origine de Big Data et demeurent une source d'inspiration inépuisable faisant rêver le Data Scientist au fond de chacun de nous. Dernier exploit en date, l'algo de Google et Stanford capable de générer une légende à partir d'une image quelconque : Bluffant. Aussi passionnants qu'ils soient, ces progrès paraissent bien éloignés des préoccupations des entreprises qui nous entourent, et à raison. Les enjeux du marché Français dans les secteurs de la Banque ou de l'Industrie ne partagent que peu d'atomes…

Lire la suite
Big Data

Quelles solutions pour sécuriser un Data Lake sous Hadoop ?

Après la plateforme de batch scalable, le Data Lake, cette notion selon laquelle toutes les données de l'entreprise devraient être déversées et stockées sans discernement dans un entrepôt commun — de préférence un cluster Hadoop — est devenu au cours de l'année, un nouvel élément central de la communication des éditeurs autour d'Hadoop. Stocker de grands volumes de données dans un même cluster implique selon les industries, de faire cohabiter des données normales avec des données sensibles (données personnelles, données privées d'un client à qui on revend son service en…

Lire la suite