Chapitre 05
Choix technologiques
Quel modèle, pour quel usage, hébergé où ? Ce chapitre donne les critères de décision, le paysage des modèles en 2026, des recommandations concrètes par cas d'usage et l'architecture cible.
Chapitre 05
Quel modèle, pour quel usage, hébergé où ? Ce chapitre donne les critères de décision, le paysage des modèles en 2026, des recommandations concrètes par cas d'usage et l'architecture cible.
Performance sur le type de tâche visé.
Prix au token + coût d'infrastructure.
Temps de réponse.
Niveau de maîtrise juridictionnelle.
Taille du contexte, vision, agents, multimodal.
Intégrations, outils tiers, communauté, documentation.
Cette photographie reflète l'état du marché à juin 2026. Le rythme reste soutenu : un nouveau modèle phare paraît en moyenne tous les 3 à 6 mois, et les références positionnées « haut de gamme » aujourd'hui basculent typiquement vers le « quotidien » d'ici quelques mois — quand elles ne sont pas tout simplement supplantées. C'est précisément pour cette raison qu'il vaut mieux raisonner par catégorie que par nom de modèle : la liste ci-dessous est destinée à vieillir, la grille de lecture non.
Raisonnement complexe, code avancé, agents. Coût élevé → forte valeur ajoutée.
Modèles fermés
Modèles ouverts
La majorité des usages. Bon ratio qualité / prix / latence.
Modèles fermés
Modèles ouverts
Tâches simples à grande échelle. Coût & latence très bas.
Modèles fermés
Modèles ouverts
Code, image, vidéo, voix, embeddings.
Modèles fermés
Modèles ouverts
Pas un modèle unique : une stratégie multi-modèles, arbitrée entre qualité, coût et souveraineté.
| Cas d'usage | Modèle recommandé | Hébergement | Justification |
|---|---|---|---|
| Assistant général | Claude Sonnet / GPT-4o | Cloud EU | Qualité + intégration M365 |
| Code (devs) | Claude / GitHub Copilot | Cloud EU | Performance code supérieure |
| RAG documentaire interne | Mistral Large + embeddings OSS | Cloud souverain / Bedrock EU | Équilibre souveraineté / qualité |
| Chatbot client externe | Claude Haiku / Mistral Small | Bedrock EU / souverain | Coût + latence + souveraineté |
| Traitement à gros volume | Mistral Small / Claude Haiku | Selon volume | Coût critique |
| Automatisations / agents | Claude Sonnet / GPT-4o | Selon sensibilité | Qualité de raisonnement |
| Analyse stratégique / COMEX | Claude Opus / GPT premium | Cloud EU + ZDR | Qualité maximale |
| Données ultra-sensibles | Llama 70B / Mistral open weight | On-premise | Souveraineté maximale |
| Génération d'images marketing | Firefly + Midjourney | API directes | Firefly « safe » commercialement |
| Transcription / synthèse | Teams Copilot, Otter | Cloud EU | Intégration fluide |
Du poste de travail à l'infrastructure modèles — avec une gateway IA au centre pour le routage multi-modèles, le filtrage, l'audit et le FinOps.