trajectoryRL/trajrl-bench

TrajRL-Bench: AI agent skills benchmark. SSH sandbox with mock services, LLM judge scoring, split-half delta evaluation. Leaderboard at trajrl.com/bench

trajrl-bench 是什么？

trajrl-bench is a Claude Code agent skill that trajRL-Bench: AI agent skills benchmark. SSH sandbox with mock services, LLM judge scoring, split-half delta evaluation. Leaderboard at trajrl.com/bench.

兼容平台~Claude Code~Codex CLI~Cursor

Part ofAgent Workflows

npx skills add trajectoryRL/trajrl-bench

Installed? Explore more 编程与开发 skills: steipete/bluebubbles, steipete/eightctl, steipete/blucli · View all 6 →

查看原文→浏览所有技能

在你喜欢的 AI 中提问

打开一个已预加载此 Agent Skill 的新对话。

ChatGPT Claude Gemini Grok Perplexity DeepSeek

文档

trajrl-bench 是做什么的？

TrajRL-Bench: AI agent skills benchmark. SSH sandbox with mock services, LLM judge scoring, split-half delta evaluation. Leaderboard at trajrl.com/bench

trajectoryRL/trajrl-bench

trajrl-bench 是什么？

在你喜欢的 AI 中提问

文档

trajrl-bench 是做什么的？

相关技能

steipete/bluebubbles

steipete/eightctl

steipete/blucli

steipete/bear-notes

steipete/camsnap

steipete/gifgrep