Publications de Matthieu Lagacherie

Big Data

Une histoire de la data science, par deux data scientists

Cet article n’est pas un article sur l’histoire des sciences ou de la pensée statistique et n’a aucune prétention d’académisme ou d’objectivité. Il est le fruit d’une rencontre entre Matthieu, informaticien expert en machine learning et Michel, statisticien de formation. Ils se sont retrouvés chez OCTO par la pratique du même métier, data scientist (le lecteur souhaitant en savoir plus sur ce métier est renvoyé à (Source blog OCTO). En travaillant ensemble, ils ont compris qu’ils avaient développé, du fait de leurs cursus respectifs, des façons…

Lire la suite
Big Data

Avez-vous déjà songé à recruter un Chief Algo Officer ? (Partie 2)

Lors du précédent article, nous avions évoqué le besoin complexe de développer une approche patrimoniale envers son legacy algorithmique et de chercher à améliorer les pratiques existantes. Cet article revient sur un exemple nous venant du monde de la finance : l'algotrading et développe ensuite les clefs d'une stratégie possible pour développer le contrôle, déclarer et mettre en oeuvre un « ownership » de ses algorithmes.

Lire la suite
Digitalisation

Avez-vous déjà songé à recruter un Chief Algo Officer ? (Partie 1)

Un Chief Algo Officier, pour quoi faire ? L’idée d’un Chief Algo Officier paraît probablement saugrenue voire comique alors que beaucoup d’organisations n’entrent que progressivement dans une transformation plus ou moins assumée de leurs pratiques et relations avec leurs partenaires, fournisseurs ou clients. Pour autant, les algorithmes sont de plus en plus nombreux autour de nous et sont présents dans de nombreuses sphères de nos vies : depuis les fameuses règles de gestion des solutions logicielles « incarnant » de plus en plus les règles…

Lire la suite
Archi & techno

Apprentissage distribué avec Spark

// Les solutions big data actuelles se concentrent essentiellement sur l'aspect ETL des traitements. Le modèle MapReduce nous permet d'implémenter facilement des extractions d'informations mais de nombreuses contraintes et limitations apparaissent lors de la conception d'algorithmes de data science.  Par exemple, les algorithmes itératifs couramment utilisés en machine learning sont difficilement intégrables dans les modèles MapReduce:  le haut-niveau d'intéraction des données impose une gestion et une synchronisation complexe à différentes phases de l'analyse. Dans cet article nous nous intéressons à un use case typique en machine learning: la conception d'un modèle…

Lire la suite