bettyguo/agent_eval

An open-source benchmark for Claude Code skill bundles (.claude/skills/) and CLAUDE.md configs. Pass@k + cost + reliability, content-addressed leaderboard, runs on Anthropic / OpenAI / Google.

지원 대상✓Claude Code✓Codex CLI~Cursor

npx skills add bettyguo/agent_eval

원본 보기→모든 스킬 둘러보기

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

ChatGPT Claude Gemini Grok Perplexity DeepSeek

문서

bettyguo/agent_eval

An open-source benchmark for Claude Code skill bundles (.claude/skills/) and CLAUDE.md configs. Pass@k + cost + reliability, content-addressed leaderboard, runs on Anthropic / OpenAI / Google.

관련 스킬

Cal-Starfur/claude-skills

Skill audit tracker, changelogs, and reference docs for the Claude AI skill ecosystem — Wigglers Room project

community

degausai/wonda

Terminal-native AI content creation workflow tool.

community

kepano/obsidian-skills

Agent skills for Obsidian. Teach your agent to use Markdown, Bases, JSON Canvas, and use the CLI.

community

caezium/nib

Turn an idea or article into original editorial illustrations starring an avatar you own — a free agent skill (Claude Code, Codex, Cursor, Gemini) + a desktop app.

community

withqwerty/football-docs

Searchable football data provider documentation for AI coding agents. Like Context7 for football data.

community

2233admin/obsidian-llm-wiki

Your markdown vault, compiled into a 6-persona MCP team for Claude Code, Codex, OpenCode, and Gemini CLI. Headless-first. Cites, doesn't guess.

community

← More 라이팅 & 에디팅 skills