nlp

Data Science

Nettoyage du texte en NLP : moins de vocabulaire, moins de bruit

Cet article est le deuxième de la série Analyse de tendances des réseaux sociaux. Dans l'article précédent, nous avons présenté les bases méthodologiques pour analyser des tendances à partir de données de réseaux sociaux. Nous avons notamment expliqué l’importance de bien identifier la population de référence sur laquelle porte notre étude, et de bien choisir la fonction d’extrapolation pour que nos observations soient réellement représentatives. À présent, il est temps de commencer à collecter des tweets et de se lancer dans la détection de tendances…

Lire la suite
Data

1001 façons de faire parler la donnée – Compte rendu du talk de Nicolas Cavallo à la Duck Conf 2022

Les données textuelles en grande quantité sont difficiles à traiter et à interpréter. Il est possible de leur faire dire une chose et son contraire, de telle sorte que des statistiques calculées sur du contenu de réseaux sociaux n’ont de fait aucune valeur si on ne comprend pas  la méthode par laquelle elles ont été obtenues. Dans son talk, Nicolas Cavallo  nous propose de construire ensemble un cas d’usage d’analyse de tweets portant sur l’élection présidentielle de 2022.

Lire la suite
Data Science

Comment l’IA peut-elle changer le recrutement ? (partie 3)

Dans la deuxième partie de l’article, nous avons vu une façon d’employer l'IA qui a le potentiel d’apporter la flexibilité nécessaire à une détection intelligente de mots-clés.  Dans cette troisième partie, nous allons vous présenter notre implémentation d’une solution de tri par mots-clés grâce à l’IA, ce que nous avons appris, les pistes que nous avons explorées et les challenges que nous avons rencontrés.

Lire la suite
Data Science

Comment l’IA peut-elle changer le recrutement ? (partie 2)

Dans la première partie de l’article, nous avons vu quelles étaient les solutions logicielles permettant aux entreprises de trier les candidatures. Cette démarche, qui a de l’intérêt principalement lorsque l’entreprise reçoit énormément de candidatures, repose sur une méthode simple mais très limitée. Nous avons vu que l’IA a le potentiel pour apporter des solutions aux limites évoquées mais présente aussi des écueils à éviter, notamment les biais. Dans cette deuxième partie, nous allons présenter une technique de NLP qui pourrait permettre de pallier les défauts…

Lire la suite
Data Science

Comment l’IA peut-elle changer le recrutement ? (partie 1)

Savez-vous qu’il faut évaluer en moyenne 100 candidatures pour réaliser une embauche ? C’est le résultat d’une étude menée par Lever, une société de San Francisco, basée sur les données récoltées de ses clients installés dans 40 pays. Pour gérer toutes ces candidatures, les recruteurs utilisent des outils appelés Applicant Tracking System (ATS). Ils permettent d'organiser et centraliser les candidatures provenant de différents canaux (sourcing de candidats, cooptations, jobboards, site carrière, etc.) et de suivre l'avancement du processus de sélection. Mais les recruteurs ont toujours…

Lire la suite
Digitalisation

Le Comptoir : Chatbot, où en sommes nous ?

Les Chatbots ont indéniablement été soumis à un effet de “hype” : quel impact a eu cet engouement massif et soudain sur les Géants du Web et leurs Chatbots Stores ? Et surtout, passé l'effet de mode qu’en reste-t-il en 2020 ? Qu’est-ce que la Hype ? La hype correspond à l'engouement soudain et massif qu’il peut y avoir autour d'une nouvelle technologie. Ce phénomène est théorisé par Gartner, un cabinet de conseil IT, sous forme de graphique : le Gartner Hype Cycle. Gartner Hype…

Lire la suite
Data Science

NLP : une classification multilabels simple, efficace et interprétable

Le Machine Learning nous permet aujourd’hui de classifier facilement du texte ; or, le texte appartient parfois à plusieurs catégories, d’où le nom de classification multilabels pour parler de cette tâche. Nous allons voir dans cet article comment traiter ce problème, évaluer la performance de nos algorithmes et les interpréter. Avant toute chose, le code est disponible sur Github. Il contient deux web-apps : une permettant d’entraîner un modèle sur son propre dataset et une permettant d’afficher les prédictions et de les interpréter. A noter…

Lire la suite
Data

Les réseaux de neurones récurrents : des RNN simples aux LSTM

Les réseaux de neurones constituent aujourd'hui l'état de l'art pour diverses tâches d'apprentissage automatique. Ils sont très largement utilisés par exemple dans les domaines de la vision par ordinateur (classification d'images, détection d'objets, segmentation…) et du traitement automatique du langage (traduction automatique, reconnaissance vocale, modèles de langage…). Dans un précédent article, nous avons utilisé une classe particulière de réseaux de neurones, les RNN : Recurrent Neural Networks. Cette famille de modèles, particulièrement adaptée aux données séquentielles, nous a permis de générer automatiquement, caractère par caractère,…

Lire la suite
Data Science

Comparatif des moteurs de chatbot

Si vous souhaitez développer votre propre chatbot textuel ou vocal, vous serez confrontés à la question suivante : quel moteur de langage naturel choisir selon mes contraintes et exigences. Nous proposons de vous partager notre avis sur cinq des moteurs de langage naturel les plus répandus actuellement : Luis.ai Dialogflow (anciennement api.ai) Wit.ai Recast.ai Lex Watson Ce comparatif a été réalisé de manière indépendante. OCTO n’a aucun accord ou partenariat avec les acteurs cités. Ces moteurs évoluent très vites, il est donc important de revoir…

Lire la suite
Archi & techno

Chatbots : Déployer son bot vocal en “stand-alone” ou via un agrégateur de bot comme Google Assistant?

Les chatbots vocaux sont indéniablement un sujet d’actualité ! La plupart des géants du web y ont investi massivement et proposent chacun leur version d’un assistant vocal et une enceinte connectée sur laquelle il est déployé. Comment prendre part à cet engouement ? Vaut-il mieux créer son bot vocal et le déployer sur sa propre plate-forme ou faut-il chercher à s’intégrer aux assistants vocaux des GAFAs (Amazon Alexa, Google Assistant, Microsoft Cortana, Apple Siri…)?

Lire la suite