Data & AI

Posté le 12/01/2016 par Alexandre Masselot

Where are the scientific publications coming from? Geolocalizing Medline citationsWhen and where are the scientific publications coming from? Which country are collaborating the most? To investigate those questions, we focused on Medline, the major biology and biomedical peer reviewed citations repository.Big Data is not only a buzz word. A rich ec...

Lire la suite >

Posté le 12/01/2016 par Alexandre Masselot

D’où viennent les publications scientifiques ? Une analyse géographique des articles de Medline.Où et quand ont été publié des articles scientifiques ? Quels pays collaborent-ils le plus entre eux ? Pour tenter de répondre à ces questions, nous avons choisi de nous pencher sur Medline, la base de données de référence en matière de journaux traitant...

Lire la suite >

Posté le 25/11/2015 par Issam El Alaoui

Lors d'un projet de datascience, il n'est pas rare de proposer un certain nombre de métriques pour évaluer des modèles de machine learning. Ces métriques sont censées quantifier le niveau de la prédiction et donner une idée plus ou moins précise de la qualité du pattern obtenu. Or ces métriques, issues du monde des statistiques, ne fournissent pas ...

Lire la suite >

Posté le 23/04/2015 par Vassilina Bardol

Elasticsearch est un moteur de recherche conçu dès le départ pour être distribué et gérer des volumes de données massifs. Il se base sur la librairie Apache Lucene et lui ajoute des fonctionnalités supplémentaires pour la mise en cluster, la haute disponibilité ainsi qu'une API puissante.OCTO Academy vous propose une formation sur ce sujet. Cette f...

Lire la suite >

Posté le 27/01/2015 par Simon Maby

Les géants du web sont à l'origine de Big Data et demeurent une source d'inspiration inépuisable faisant rêver le Data Scientist au fond de chacun de nous.Dernier exploit en date, l'algo de Google et Stanford capable de générer une légende à partir d'une image quelconque :Bluffant.Aussi passionnants qu'ils soient, ces progrès paraissent bien éloign...

Lire la suite >

Posté le 23/09/2014 par Benjamin Joyen-Conseil

Aujourd’hui, je vais parler d’Apache Pig, un outil de traitement type batch s’appuyant sur Hadoop, et de test unitaire. Le but de cet article est de présenter PigUnit comme potentielle solution pour nos tests et d’automatisation des développements. Sur la fin, je donne quelques tips et contournements aux bugs existants.Pourquoi tester Pig ?J’ai ch...

Lire la suite >

Posté le 20/03/2014 par Jérôme Kehrli

Article paru dans le magazine ICT Journal du mois de Mars 2014.Les technologies Big Data sont de plus en plus utilisées au sein des banques de détail pour le profilage des clients ou les activités marketing. Au sein des banques privées, cependant, les applications sont moins évidentes et les initiatives peu nombreuses. Les opportunités existent pou...

Lire la suite >

Posté le 13/11/2013 par Charlotte Abdelnour

Intervenants :Marie-Luce Picard, Chef de Projet à EDF R&DBenoît Grossin, Ingénieur de Recherche à EDF R&DJulien Cabot, Directeur du pôle Big Data Analytics chez OCTO TechnologyRémy Saissy, Architecte chez OCTO TechnologyLes slides de la présentation sont disponibles sur notre Slideshare : cliquez ici.Un compte-rendu du petit-déjeuner est disponible...

Lire la suite >

Posté le 22/10/2013 par Charlotte Abdelnour

Le Big Data touche le paroxysme de sa médiatisation. Tout est devenu Big Data, mélangeant nouvelles approches métiers, technologies et business models.De vraies opportunités se présentent toutefois. Ainsi, la capacité à suivre en temps réel les indicateurs clés du business à partir d’un nombre croissant de sources de données est un challenge que le...

Lire la suite >

Posté le 21/05/2013 par Marine Mazeron

Petit-déjeuner mercredi 12 juin à GenèveBig Data, M****apReduce, calculs distribués, NoSQL, sont autant de buzz words et de concepts cantonnés jusqu’à maintenant à quelques acteurs spécifiques. Pourtant, il est un état de fait : nous sommes assis sur une quantité gigantesque de données dont il est difficile d’extraire l’information… D’autre part Ma...

Lire la suite >