Data & AI
Mistral AI NOW Summit : Entre ambitions technologiques et réalités d'adoption en entreprise
Data & AI
Au AI Now Summit 2026, Mistral a présenté une vision ambitieuse de l’IA industrielle : maîtrise de l’infrastructure, modèles spécialisés, agents outillés et souveraineté des données. Derrière la vitrine, une conférence utile pour lire les vrais enjeux d’adoption de l’IA en entreprise.

Après une consolidation de notre veille sur le sujet, nous vous proposons de survoler l'histoire de quelques termes de ces dernières années, pour ensuite les articuler entre eux.

C’est dans les vieux pots que l’on fait les meilleures soupes, cet article est un plaidoyer pour ne pas oublier les bonnes pratiques du logiciel mais plutôt les utiliser et les adapter pour maximiser l’impact des agents de code.

L’IA générative s’invite dans les pratiques Produit avec une promesse simple : aller plus vite. Mais derrière ce gain apparent, elle déplace surtout les points de friction de l’organisation. Ce n’est pas seulement notre manière de produire qui change ; c’est la répartition même de la valeur dans les équipes qui commence à bouger.

Arrêtons-nous une seconde sur le bruit ambiant."L'IA va remplacer les développeurs." "Dans cinq ans, coder sera un métier obsolète." "ChatGPT fait déjà le travail d'une équipe entière." Ces phrases, vous les avez lues, entendues, peut-être même prononcées. Elles circulent dans les conférences tech, les threads LinkedIn, les réunions de direction.

Contrairement aux dynamiques économiques habituelles, l'intelligence artificielle semble progressivement inverser la logique traditionnelle de création de valeur : ce ne sont plus nécessairement les profils les plus juniors qui sont valorisés, mais les plus expérimentés.

Les outils d’IA générative transforment en profondeur notre rapport à l’expertise. Leur capacité à simuler une intelligence, une créativité, voire une intentionnalité, pose une question vertigineuse : et si ces technologies, conçues pour nous assister, finissaient par nous convaincre que nous sommes nous-mêmes des imposteurs ?
Llama.cpp, SGLang, vLLM : quel framework d'inférence LLM choisir pour votre assistant de code ?
Data & AI
Étude d’une architecture auto-hébergée (LiteLLM + vLLM/SGLang/llama.cpp) sur GPUs H100/L40S avec le modèle Devstral-Small-2-24B. Tests jusqu’à 200 utilisateurs via llm-grill, notre outil d'évaluation open source.

Grâce à l'IA, la production logicielle tend à se démocratiser au sein de l’entreprise, il devient essentiel de mettre en place dès maintenant un accompagnement structuré autour de l’IA. À défaut, la DSI pourrait de se transformer en « Wall-E du code », contrainte de trier et réparer les déchets d’une production logicielle devenue incontrôlée.

Combien coûte vraiment un million de tokens quand on ne paie plus l’API, mais l’infrastructure qui les produit ? En partant du prefill, du decode, du batching, du KV cache et des modèles MoE, on estime combien de tokens une infrastructure GPU peut générer.