CommunityDéveloppement et programmationgithub.com

trajectoryRL/trajrl-bench

TrajRL-Bench: AI agent skills benchmark. SSH sandbox with mock services, LLM judge scoring, split-half delta evaluation. Leaderboard at trajrl.com/bench

Qu'est-ce que trajrl-bench ?

trajrl-bench is a Claude Code agent skill that trajRL-Bench: AI agent skills benchmark. SSH sandbox with mock services, LLM judge scoring, split-half delta evaluation. Leaderboard at trajrl.com/bench.

Compatible avec~Claude Code~Codex CLI~Cursor

Part ofAgent Workflows

npx skills add trajectoryRL/trajrl-bench

Installed? Explore more Développement et programmation skills: steipete/bluebubbles, steipete/eightctl, steipete/blucli · View all 6 →

Voir l'original→Voir toutes les compétences

Demander à votre IA préférée

Ouvre une nouvelle conversation avec cette compétence d'agent déjà préchargée.

ChatGPT Claude Gemini Grok Perplexity DeepSeek

Documentation

Que fait trajrl-bench ?

TrajRL-Bench: AI agent skills benchmark. SSH sandbox with mock services, LLM judge scoring, split-half delta evaluation. Leaderboard at trajrl.com/bench

← More Développement et programmation skills

trajectoryRL/trajrl-bench

Qu'est-ce que trajrl-bench ?

Demander à votre IA préférée

Documentation

Que fait trajrl-bench ?

Skills associés

steipete/bluebubbles

steipete/eightctl

steipete/blucli

steipete/bear-notes

steipete/camsnap

steipete/gifgrep