MLMove : des bots Counter-Strike coordonnés par transformer plutôt que par navigation classique

🎥 Résumé analytique

🎯 Promesse cognitive

À la fin, on comprend comment une architecture inspirée des LLM peut produire des comportements tactiques crédibles et coordonnés dans un FPS multijoueur.

🧩 Carte du contenu (sommaire)

Pourquoi les bots FPS classiques atteignent leurs limites
Utilisation d’un transformer pour apprendre le mouvement humain
Construction et nettoyage du dataset Counter-Strike
Architecture technique du modèle MLMove
Résultats observés et perception humaine
Potentiel industriel et limites actuelles

✅ Ce que la vidéo apporte en plus de la lecture de ce post

Démonstrations visuelles des déplacements coordonnés
Explications détaillées des contraintes gameplay Counter-Strike
Retours d’expérience directs du chercheur
Discussion concrète sur coûts mémoire, CPU et industrialisation

🕒 Niveau d’engagement recommandé

visionnage_actif
- Les démonstrations visuelles sont centrales
- Plusieurs subtilités gameplay seraient difficiles à saisir uniquement par texte
- Les implications techniques sont importantes pour les projets IA/simulation

🧰 Pistes d’exploitation et points de vigilance

1 idée à tester : utiliser des transformers spécialisés pour modéliser la coordination tactique d’ailiers IA dans un simulateur aérien.
1 notion à creuser : exploitation des attention masks comme outil d’analyse comportementale et de coaching tactique.
1 limite / biais : le modèle reste fortement spécialisé sur un mode de jeu et une carte unique.

🔍 Déroulé détaillé et analyse critique

📄 Voir la synthèse détaillée

Déroulé structuré

Segment 1 — Pourquoi les bots classiques plafonnent
- Les bots FPS traditionnels utilisent navmesh + behavior trees
- Les comportements humains avancés nécessitent énormément de logique codée à la main
- Les joueurs pros exploitent des micro-positionnements impossibles à généraliser facilement
Segment 2 — Le concept MLMove
- Utilisation d’un transformer similaire aux LLM
- Le modèle apprend directement les déplacements humains
- Focus exclusif sur le mouvement et la coordination
- Le tir/combat reste géré par behavior tree classique
Segment 3 — Construction du dataset
- Extraction de milliers d’heures de démos Counter-Strike
- Nettoyage des rounds inutiles et comportements parasites
- Restriction volontaire au mode “retake” sur Dust2
- Capture des états joueurs à 16 Hz
Segment 4 — Architecture technique
- Embedding des états joueurs
- Transformer chargé des relations inter-joueurs
- Sortie sous forme de probabilités d’actions de mouvement
- Prédictions multi-horizon temporel (présent + futur proche)
Segment 5 — Résultats comportementaux
- Les bots reproduisent des comportements tactiques crédibles
- Coordination implicite entre équipiers
- Gestion des angles et couvertures convaincante
- Certaines incohérences persistent (agressivité, inertie)
Segment 6 — Implications industrielles
- Modèle extrêmement compact : ~21 MB
- Fonctionnement CPU temps réel
- Pas besoin de cloud ni GPU serveur
- Vision opposée au discours dominant sur les IA gigantesques
Segment 7 — Perspectives futures
- Généralisation à plusieurs cartes et modes
- Exploitation des attention masks
- Couplage futur avec des LLM de haut niveau
- Création d’un langage comportemental tactique

Points notables

Le modèle contient seulement 5,4 millions de paramètres
Entraînement réalisable sur une machine desktop unique
Le système tourne à moins de 0,5 ms par frame moyenne
Les transformers sont présentés comme outils relationnels N² entre entités
Le projet insiste sur la spécialisation métier plutôt que sur les modèles généralistes massifs

Limites & biais (factuels)

Modèle limité à Dust2 et au mode retake
Le comportement de tir n’est pas appris
Forte dépendance à la qualité du dataset humain
La coordination reste crédible mais pas parfaite
Le projet reste une preuve de concept académique