SRE

FinOps: comment économiser 100 000 $/an en ouvrant simplement AWS Cost Explorer

Posté le 09/06/2026 par Vinorth Varatharasan

REX FinOps : en ouvrant AWS Cost Explorer sur un data lake à 6 500 $/mois, trois anomalies apparaissent. AWS KMS à 4 000 $/mois, des licences fantômes pour des développeurs partis, 10 pipelines CI/CD redondantes. Optimisation des coûts cloud : 100 000 $ d'économies annuelles. Sans outil, sans migration. Juste de la curiosité. Checklist incluse.

Interviews d'experts - épisode #2 : Observabilité

Cloud & Platform

Posté le 25/03/2026 par Julien Tellier, Mathieu Laurent, Guillaume Estassy

Lors cette série d’interviews, OCTO vous propose un aperçu des sujets à considérer dans votre trajectoire des mois à venir. Aujourd’hui, Guillaume Estassy, nous parle d’Observabilité.

Le bottleneck n'est jamais là où vous croyez : 4 bugs en cascade sur une API audio temps réel

Software Engineering

Posté le 20/03/2026 par Vinorth Varatharasan

« Combien d'utilisateurs simultanés peut-on supporter ? » Une question simple, quatre bottlenecks en cascade. Event loop bloqué, quotas invisibles, race condition gRPC : sur une API audio FastAPI/Cloud Run, chaque fix révélait le problème suivant. REX complet avec méthodo, métriques et code.

Une gestion d’incidents méthodique : transformer chaque dysfonctionnement en opportunité pour améliorer son système

Cloud & Platform

Posté le 03/10/2025 par Simon LEFORT

Depuis plus de 2 ans, nous sommes responsables d'un système critique qui doit être disponible 24/7. Dans cet article, nous allons vous partager ce que nous avons mis en place pour gérer au mieux les incidents : nos pratiques, nos outils, et nos apprentissages.

Kubernetes : arrêter ses environnements de développement pour réduire les coûts

Cloud & Platform

Posté le 25/02/2025 par Yannig Perre

Comment arrêter ses environnements avec Kubernetes ? Bonnes pratiques pour optimiser les coûts cloud et mieux gérer les environnements de développement

Être prêt pour la prod : checklist prod-ready

Cloud & Platform

Posté le 18/12/2024 par Cédric Martin, Julien Tellier, Jennifer Pelisson, Adrien Saunier

Qu’est-ce qu’une application réellement prête pour la production ? Découvrez une checklist pragmatique pour sécuriser la mise en prod sans sacrifier la qualité.

En cas d’urgence, brisez la glace : “generic mitigations” et gestion d’incident

Cloud & Platform

Posté le 29/07/2024 par Adrien Saunier

J’ai une mauvaise nouvelle pour vous. Votre système informatique rencontrera des incidents, et toujours au pire moment. Si le système est secondaire, l'impact sera faible. Mais s'il est crucial, mieux vaut être préparé. Dans cet article, nous abordons la gestion d’incidents, par l'angle des generics mitigations pour protéger vos utilisateurs.

Goodbye Passwords ? Intégrez les Passkeys avec Auth0 et Keycloak

Software Engineering

Posté le 02/07/2024 par Paul Juquelier, Bastien Mourrat

Découvrez comment implémenter les passkeys avec Auth0 et Keycloak pour remplacer les mots de passe par une authentification plus sûre et simple.

Surveillance des comportements des containers

Cloud & Platform

Posté le 07/05/2024 par Cyril Tavian

Explorez comment mettre en place une surveillance efficace des conteneurs avec Falco sur Kubernetes. Notre article détaille les étapes pour configurer Falco afin de détecter et répondre aux menaces de sécurité en temps réel, offrant une visibilité précieuse sur les activités suspectes dans votre environnement de conteneur

Évolution vs. stabilité : comment piloter la fiabilité de ses services ? Compte-rendu du talk de Simon Lefort et Simon Devineau à la Duck Conf 2024

Cloud & Platform

Posté le 19/04/2024 par Hà Hông Viêt LÊ

Évolution vs. stabilité : comment piloter la fiabilité de ses services ? Les Simon nous présentent leurs constats et solutions pour aider les équipes à dialoguer et décider rationnellement

12 3 4