
Après trois jours à la Devoxx France 2026,, voici mon top 3 des conférences qui m’ont le plus marquée.

Arrêtons-nous une seconde sur le bruit ambiant."L'IA va remplacer les développeurs." "Dans cinq ans, coder sera un métier obsolète." "ChatGPT fait déjà le travail d'une équipe entière." Ces phrases, vous les avez lues, entendues, peut-être même prononcées. Elles circulent dans les conférences tech, les threads LinkedIn, les réunions de direction.

Contrairement aux dynamiques économiques habituelles, l'intelligence artificielle semble progressivement inverser la logique traditionnelle de création de valeur : ce ne sont plus nécessairement les profils les plus juniors qui sont valorisés, mais les plus expérimentés.

Les outils d’IA générative transforment en profondeur notre rapport à l’expertise. Leur capacité à simuler une intelligence, une créativité, voire une intentionnalité, pose une question vertigineuse : et si ces technologies, conçues pour nous assister, finissaient par nous convaincre que nous sommes nous-mêmes des imposteurs ?
Llama.cpp, SGLang, vLLM : quel framework d'inférence LLM choisir pour votre assistant de code ?
Data & AI
Étude d’une architecture auto-hébergée (LiteLLM + vLLM/SGLang/llama.cpp) sur GPUs H100/L40S avec le modèle Devstral-Small-2-24B. Tests jusqu’à 200 utilisateurs via llm-grill, notre outil d'évaluation open source.

Lors cette série d’interviews, OCTO mobilise ses experts pour vous décrypter l’actualité. Aujourd’hui, Brice Le Roux, expert Ops, nous parle de GreenOps & FinOps.

Grâce à l'IA, la production logicielle tend à se démocratiser au sein de l’entreprise, il devient essentiel de mettre en place dès maintenant un accompagnement structuré autour de l’IA. À défaut, la DSI pourrait de se transformer en « Wall-E du code », contrainte de trier et réparer les déchets d’une production logicielle devenue incontrôlée.
Design ops, Product ops, Research ops : comment passer de pompier à stratège en 3 mois
Product & Design
Les fonctions opérationnelles des équipes Produit - Design Ops, Product Ops et Research Ops - sont soumises actuellement à une pression sans précédent, à l’heure de l’hyper-accélération provoquée par l’Intelligence Artificielle. Je vous partage ici une méthode en 3 temps pour construire une stratégie Ops qui tient la route !

Gauthier Fiorentino, lors de la Duck Conf 2026, nous propose une critique constructive des architectures SPA/PESPA pour leur impact sur l'accessibilité et l'écoconception. 56 % du temps d'affichage est gaspillé à exécuter du JS pour générer du HTML. La solution : appliquer la Rule of Least Power en privilégiant le rendu serveur et le modèle MPA.

Combien coûte vraiment un million de tokens quand on ne paie plus l’API, mais l’infrastructure qui les produit ? En partant du prefill, du decode, du batching, du KV cache et des modèles MoE, on estime combien de tokens une infrastructure GPU peut générer.