farhanic017/vision-tool

Ferramenta de análise de imagem e vídeo para assistentes de codificação AI que não possuem visão nativa. Funciona com qualquer modelo, seja como CLI, MCP ou skill opencode.

Funciona com✓Claude Code~Codex CLI~Cursor✓Gemini CLI✓OpenCode

npx skills add farhanic017/vision-tool

Ver original→Navegar por todas as habilidades

AI Overview & Summary

O farhanic017/vision-tool é uma habilidade versátil que permite que assistentes de codificação AI (como Claude Code, Cursor, Codex, etc.) realizem análise de imagens e vídeos, mesmo sem suporte nativo a visão. Ele funciona com qualquer modelo e pode ser utilizado via interface de linha de comando (CLI), protocolo MCP (Model Context Protocol) ou como skill do opencode. A ferramenta oferece suporte a 12 backends de visão, incluindo Gemini, GPT-4o, Claude e outros, garantindo ampla compatibilidade. Um dos principais diferenciais é a segurança: nenhum segredo (API keys, tokens) é codificado diretamente no arquivo, utilizando variáveis de ambiente ou métodos seguros de configuração. Isso torna a habilidade ideal para equipes que precisam de análise visual em seus fluxos de desenvolvimento de software sem comprometer a segurança ou a flexibilidade de escolha do modelo AI subjacente.

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

ChatGPT Claude Gemini Grok Perplexity DeepSeek

Documentação