CommunityProductivity & Collaborationgithub.com

iamalimaybe/llm-evaluation-registry

LLM Evaluation Registry is a backend-led quality layer for AI workflows. It tracks prompts, models, reusable test cases, evaluation runs, validation results, regressions, and human review notes so AI behavior can be measured instead of guessed.

What is llm-evaluation-registry?

llm-evaluation-registry is a Claude Code agent skill that lLM Evaluation Registry is a backend-led quality layer for AI workflows. It tracks prompts, models, reusable test cases, evaluation runs, validation results, regressions, and human review notes so AI behavior can be measured instead of guessed.

Works with~Claude Code~Codex CLI~Cursor

npx skills add iamalimaybe/llm-evaluation-registry

Installed? Explore more Productivity & Collaboration skills: steipete/gemini, steipete/gh-issues, steipete/skill-creator · View all 6 →

View original→Browse all skills

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

ChatGPT Claude Gemini Grok Perplexity DeepSeek

Documentation

What does llm-evaluation-registry do?

← More Productivity & Collaboration skills

iamalimaybe/llm-evaluation-registry

What is llm-evaluation-registry?

Ask in your favorite AI

Documentation

What does llm-evaluation-registry do?

Related Skills

steipete/gemini

steipete/gh-issues

steipete/skill-creator

steipete/clawhub

steipete/coding-agent

steipete/mcporter