Latest posts
-
Claude Opus 4.8
Modèle phare d’Anthropic pour le codage agentique et les tâches complexes en entreprise, avec un score SWE-bench Pro de 69,2% et un contexte de 1M tokens.
-
Gemini 3.1 Pro
Modèle multimodal de pointe de Google, leader sur de nombreux benchmarks dont GPQA Diamond (94,3%) et ARC-AGI-2, avec un contexte de 1M tokens.