iamalimaybe/llm-evaluation-registry

LLM Evaluation Registry is a backend-led quality layer for AI workflows. It tracks prompts, models, reusable test cases, evaluation runs, validation results, regressions, and human review notes so AI behavior can be measured instead of guessed.

llm-evaluation-registry 是什么？

llm-evaluation-registry is a Claude Code agent skill that lLM Evaluation Registry is a backend-led quality layer for AI workflows. It tracks prompts, models, reusable test cases, evaluation runs, validation results, regressions, and human review notes so AI behavior can be measured instead of guessed.

兼容平台~Claude Code~Codex CLI~Cursor

npx skills add iamalimaybe/llm-evaluation-registry

Installed? Explore more 生产力与协作 skills: steipete/gemini, steipete/gh-issues, steipete/skill-creator · View all 6 →

查看原文→浏览所有技能

在你喜欢的 AI 中提问

打开一个已预加载此 Agent Skill 的新对话。

ChatGPT Claude Gemini Grok Perplexity DeepSeek

iamalimaybe/llm-evaluation-registry

llm-evaluation-registry 是什么？

在你喜欢的 AI 中提问

文档

llm-evaluation-registry 是做什么的？

相关技能

steipete/gemini

steipete/gh-issues

steipete/skill-creator

steipete/clawhub

steipete/coding-agent

steipete/mcporter