Data Science

Posté le 17/12/2019 par Emmanuel Lin Toulemonde, Mehdi Houacine

Lorsque l’on s'apprête à mettre (ou lorsque l’on a mis) un système de data science en production, on souhaite s’assurer qu’il fonctionne comme prévu. Pour cela, il convient de monitorer ce système intelligent.

Lire la suite >

Posté le 29/11/2019 par Thomas Vial

Cet article s'adresse à mes collègues _data scientist_s. Il s'appuie en grande partie sur un article de 2017 intitulé “Theory-guided Data Science: A New Paradigm for Scientific Discovery from Data” [TGDS]. [TGDS] discute des apports de la data science auprès des chercheurs scientifiques. Notre propos, dans cet article, est de résumer [TGDS] à la lu...

Lire la suite >

Posté le 23/11/2019 par Marisa Faraggi

ABSTRACTThis article focuses on the features extraction from time series and signals using Fourier and Wavelet transforms. This task will be carried out on an electrocardiogram (ECG) dataset in order to classify three groups of people: those with cardiac arrhythmia (ARR), congestive heart failure (CHF) and normal sinus rhythm (NSR). Our approach co...

Lire la suite >

Posté le 20/11/2019 par Emmanuel Lin Toulemonde

En mission, nous rencontrons de plus en plus des besoins d'interprétabilité. Ce changement est dû à une évolution de la maturité des organisations sur la data science.En caractérisant un peu le trait, hier les projets de data science étaient surtout marketing (Ex : prédiction d'appétence ou d’attrition à des fins de ciblage). Ils étaient faits à pa...

Lire la suite >

Posté le 14/11/2019 par Pierre Baonla Bassom, Soufiane Benzaouia

IntroductionLes 16 & 17 Octobre 2019, nous sommes rendus à Amsterdam afin d’assister à la conférence annuelle organisée par Databricks, le Spark+AI Summit, événement devenu incontournable dans le monde du Big data et de l’IA.Cette année, ce sont plus de 2300 personnes qui ont fait le déplacement pour assister à de nombreuses présentations réparties...

Lire la suite >

Posté le 14/10/2019 par Tanguy Morelle

Partie 2 : Performance des algorithmes évolutionnistesNous avons pu voir dans la première partie les différents éléments constitutifs d'un algorithme évolutionniste et quelques cas d’utilisations classiques des algorithmes évolutionnistes avec des applications à des problèmes de données.Pour autant, ces algorithmes sont-ils compétitifs face aux aut...

Lire la suite >

Posté le 09/10/2019 par Rym Laabiyad

Compte-rendu de la matinale du Jeudi 3 Octobre 2019Jeudi 3 Octobre 2019, l’équipe RespAI (Responsible Artificial Intelligence) d’OCTO Technology, qui s’intéresse à l’usage responsable des traitements algorithmiques des données, a accueilli des intervenants aux profils variés afin de discuter d’un nouvel enjeu de l’IA : “Ethical by Design”.Ensemble,...

Lire la suite >

Posté le 30/09/2019 par Annabelle Blangero

L’usage des algorithmes de traitement de données – de la simple requête SQL aux puissants algorithmes de recommandation et de personnalisation des géants de la Tech – s’est popularisé ces dernières années, notamment pour des utilisateurs traditionnellement hors du domaine IT. Cet usage se retrouve dans tous les secteurs (industrie, éducation, santé...

Lire la suite >

Posté le 27/09/2019 par Nicolas TOUSSAINT, Jérémy Bouhi

IntroductionDVC (Data Version Control) est un package Python qui permet de gérer plus facilement ses projets de Data science. Cet outil est une extension de Git pour le Machine Learning, comme l’énonce son principal contributeur Dmitry Petrov dans cette présentation. DVC est à la fois comparable et complémentaire à Git. Il va s’occuper de synchroni...

Lire la suite >

Posté le 18/09/2019 par Samuel Rochette

Dans un article traitant des intervalles de prédiction, nous avions abordé une technique de mesure d’incertitude en régression. Qu’en est-il de cette mesure pour l’autre pan de l’apprentissage supervisé : la classification ?En classification aussi, il convient de pouvoir maîtriser le niveau de confiance dans la sortie des modèles. Prenons l’exemple...

Lire la suite >