SRE

REX FinOps : en ouvrant AWS Cost Explorer sur un data lake à 6 500 $/mois, trois anomalies apparaissent. AWS KMS à 4 000 $/mois, des licences fantômes pour des développeurs partis, 10 pipelines CI/CD redondantes. Optimisation des coûts cloud : 100 000 $ d'économies annuelles. Sans outil, sans migration. Juste de la curiosité. Checklist incluse.

Lors cette série d’interviews, OCTO vous propose un aperçu des sujets à considérer dans votre trajectoire des mois à venir. Aujourd’hui, Guillaume Estassy, nous parle d’Observabilité.
Le bottleneck n'est jamais là où vous croyez : 4 bugs en cascade sur une API audio temps réel
Software Engineering
« Combien d'utilisateurs simultanés peut-on supporter ? » Une question simple, quatre bottlenecks en cascade. Event loop bloqué, quotas invisibles, race condition gRPC : sur une API audio FastAPI/Cloud Run, chaque fix révélait le problème suivant. REX complet avec méthodo, métriques et code.
Une gestion d’incidents méthodique : transformer chaque dysfonctionnement en opportunité pour améliorer son système
Cloud & Platform
Depuis plus de 2 ans, nous sommes responsables d'un système critique qui doit être disponible 24/7. Dans cet article, nous allons vous partager ce que nous avons mis en place pour gérer au mieux les incidents : nos pratiques, nos outils, et nos apprentissages.

Comment arrêter ses environnements avec Kubernetes ? Bonnes pratiques pour optimiser les coûts cloud et mieux gérer les environnements de développement

Qu’est-ce qu’une application réellement prête pour la production ? Découvrez une checklist pragmatique pour sécuriser la mise en prod sans sacrifier la qualité.

J’ai une mauvaise nouvelle pour vous. Votre système informatique rencontrera des incidents, et toujours au pire moment. Si le système est secondaire, l'impact sera faible. Mais s'il est crucial, mieux vaut être préparé. Dans cet article, nous abordons la gestion d’incidents, par l'angle des generics mitigations pour protéger vos utilisateurs.

Découvrez comment implémenter les passkeys avec Auth0 et Keycloak pour remplacer les mots de passe par une authentification plus sûre et simple.

Explorez comment mettre en place une surveillance efficace des conteneurs avec Falco sur Kubernetes. Notre article détaille les étapes pour configurer Falco afin de détecter et répondre aux menaces de sécurité en temps réel, offrant une visibilité précieuse sur les activités suspectes dans votre environnement de conteneur
Évolution vs. stabilité : comment piloter la fiabilité de ses services ? Compte-rendu du talk de Simon Lefort et Simon Devineau à la Duck Conf 2024
Cloud & Platform
Évolution vs. stabilité : comment piloter la fiabilité de ses services ? Les Simon nous présentent leurs constats et solutions pour aider les équipes à dialoguer et décider rationnellement