Claude (Sonnet 4.6 / Opus 4.7)
Anthropic
Contexte 200k tokens (1M sur Opus en bêta)
+ Forces Raisonnement profond, respect des instructions précises, tool use solide, prompt caching natif, refus argumenté plutôt qu'hallucination.
− Faiblesses Coût élevé, latence non négligeable, pas multimodal natif sur tous les usages (vision OK, audio non).
GPT (4o / o1 / o3)
OpenAI
Contexte 128k tokens (200k sur GPT-4.1)
+ Forces Généraliste, écosystème mature, coût compétitif sur GPT-4o-mini, function calling robuste, voix native sur 4o.
− Faiblesses Moins consistant que Claude sur tâches longues, occasionnellement obéit trop (suggestions hasardeuses), dépendance à OpenAI seul fournisseur cloud.
Gemini (2.5 Pro / 3 Flash)
Google
Contexte 1M tokens natif (2M en bêta sur Pro)
+ Forces Contexte le plus long du marché, multimodal natif (image + vidéo + audio + PDF dans le même prompt), excellent pour analyse documentaire massive, prix attractif sur Flash.
− Faiblesses Plus volatile sur raisonnement complexe vs Claude, ecosystem Vertex AI parfois lourd, latence variable selon zone GCP.
Mistral Large 2 / Medium 3 / Small
Mistral AI
Contexte 128k tokens
+ Forces Français de référence (vocabulaire métier idiomatique), hébergement européen souverain (Scaleway, OVH), licence Apache 2.0 sur certaines variantes, prix bas sur Small.
− Faiblesses Moins capable que Claude/GPT/Gemini sur tâches très complexes ou code obscur, écosystème plus petit, pas de prompt caching généralisé.
DeepSeek (R1 / V3)
DeepSeek AI
Contexte 64k tokens (128k sur V3)
+ Forces Raisonnement compétitif Opus à coût marginal, open weights, excellent pour code, économie sur runs longs.
− Faiblesses Hébergement Chine par défaut (data sensitivity), modèle weights publics donc support commercial limité, qualité multilingue inégale.