Observabilité

Observabilité

Et si les métriques de monitoring de ML devenaient fonctionnalités ?

Les équipes développant des applications de Data Science investissent beaucoup d’énergie pour identifier et implémenter des métriques de monitoring pertinentes. Nous pensons qu’il est possible de capitaliser sur ce travail en proposant des fonctionnalités supplémentaires à nos utilisateurs afin de renforcer l’impact de nos applications. Le monitoring s’appuie notamment sur le calcul de métriques à des fins de supervisions; c'est-à-dire mesurer l’état de service et détecter des problèmes. Les métriques calculées peuvent être plus ou moins haut niveau, plus ou moins éloignées du matériel: Bas…

Lire la suite
Observabilité

Au-delà du monitoring technique, l’observabilité du système et des équipes qui le produisent

L’objectif de cet article est de proposer un lien entre observabilité des systèmes techniques et observabilité des organisations. La littérature, les conférences, les retours d’expérience commencent à être assez riches autour de l’importance de la mesure, du monitoring et de l’observabilité de systèmes techniques. Nous proposons ici d’étudier la transposition de ces concepts, ces modèles, ces automatismes à l’observabilité et au debug de systèmes sociaux-techniques. Nous allons dans un premier temps revenir sur quelques définitions et concepts régulièrement partagés autour du monitoring, de l’observabilité et…

Lire la suite
Observabilité

SLO : la puissance insoupçonnée des métriques

Lorsque l’on exploite un produit ou que l’on monte une infrastructure, il est normal de se poser la question “Est-ce que mon application fonctionne bien ?” En général, il est commun d’avoir deux réponses dans ce genre de cas : Mettre en place du monitoring illustrant le fonctionnement de mon application Mettre en place un système d’alerting pour être prévenu en cas de dysfonctionnement Cependant, rares sont les fois où l'on va se demander si les alertes positionnées sont pertinentes dans mon contexte (ex :…

Lire la suite
Observabilité

Thanos : une extension de Prometheus ?

Le monitoring, un domaine resté stable pendant plusieurs années, a été récemment bouleversé avec l’apparition de nouvelles technologies remettant en question les pratiques existantes. Depuis de nombreuses années, l’outil Prometheus a été la solution de référence pour superviser une infrastructure de type Cloud, SaaS/Openstack, OKD, K8S. Développé à l'origine par SoundCloud, mis en open source et accepté en 2016 comme deuxième projet de la CNCF (Cloud Native Computing Foundation), Prometheus est devenu tellement populaire que même certains cloud providers (Azure avec Azure Monitor et GCP…

Lire la suite
Observabilité

CR du comptoir : Les nouvelles topologies du cloud

Jeudi dernier s’est tenu un nouvel épisode des comptoirs OCTO, des rendez-vous bi-mensuels, désormais incontournables que les expertes et experts OCTO vous donnent. Un moment d’échange et de partage, surtout en ces moments difficiles de confinement et de Covid. Stay home, safe and with OCTO ;) Sujet de ce jeudi, les nouvelles topologies du Cloud, par Meriem CTO d’OCTO et Arthur, lead des pratiques Cloud chez OCTO.

Lire la suite
Observabilité

Compte-rendu de la conférence de Pierre Moorkens « Connais-tu vraiment ton cerveau ? »

« Lorsque vous êtes stressé c’est la situation qui vous gère et vous êtes con. Lorsque vous êtes serein c’est vous qui gérez. » - Pierre Moorkens Mon intention De nos jours, de plus en plus d’entreprises se rendent compte, qu’en plus des Hard skills (savoir-faire, formation, expérience professionnelle, compétences acquises…), les Soft skills (savoir-être, posture, attitude, comportements spontanément adoptés, compétences sociales, motivation…) jouent un rôle important dans leur performance. Une enquête réalisée sur les Soft skills par Monster auprès de 449 professionnels (des RH…

Lire la suite
Observabilité

Bouchons applicatifs (Partie 2)

Recherche des goulots d’étranglements La première partie de cet article s’est concentré sur la mise en place d’une politique de centralisation des journaux générés par une partie du SI d’Atomenergy. Pour rappel, l'entreprise a développé un tableau de bord énergie utilisé pour piloter le fonctionnement de ses centrales. Malheureusement, cette application est devenue très lente à charger. Nous avons été missionnés pour mettre en place une politique de détection des goulots d’étranglement. A la recherche des goulots Un des moyens les plus simples pour repérer…

Lire la suite