GLM 4.7 : un saut générationnel open source pour le code et l’agentique

🎥 Synthèse

À la fin, on comprend pourquoi GLM 4.7 change d’échelle pour l’open source orienté code et agents.

visionnage_actif
- Démonstrations visuelles clés.
- Enchaînement de cas d’usage variés.
- Appréciation qualitative difficile à résumer sans images.

1 idée à tester : évaluer GLM 4.7 sur un workflow agentique multi-outils réel.
1 notion à creuser : MoE + long contexte pour assistants autonomes.
1 limite / biais : accessibilité matérielle et coût énergétique.

🔍 Synthèse détaillée

Segment 1 — Présentation générale
- Modèle de 358B paramètres, licence MIT.
- Architecture Mixture of Experts.
- Contexte jusqu’à 200k tokens, sorties jusqu’à 128k tokens.
Segment 2 — Performances et benchmarks
- +6 points sur SWE-bench.
- Forte progression sur Terminal Bench 2.0.
- Gains significatifs en raisonnement math/logique (HLE).
Segment 3 — Capacités agentiques
- Enchaînement de tâches complexes.
- Usage plus pertinent des outils externes.
Segment 4 — Démonstrations pratiques
- OS interactif simulé (apps, terminal fonctionnel).
- Jeux 3D jouables (bataille navale, course).
- Landing page animée et application mobile de suivi sportif.
Segment 5 — Positionnement
- Numéro 1 open source sur Code Arena.
- Performances comparables à des modèles propriétaires récents.
- Classement global ~9e tous modèles confondus.