rajpra808/browser-agent

Vision-based browser automation CLI — LLM sees screenshot, clicks coordinates, repeats. No selectors. Supports Claude, Gemini, OpenAI, Ollama (local/free).

browser-agent 是什么？

browser-agent is a Claude Code agent skill that vision-based browser automation CLI — LLM sees screenshot, clicks coordinates, repeats. No selectors. Supports Claude, Gemini, OpenAI, Ollama (local/free).

兼容平台✓Claude Code✓Codex CLI~Cursor✓Gemini CLI

Part ofAgent Workflows

npx skills add rajpra808/browser-agent

Installed? Explore more 生产力与协作 skills: steipete/gemini, steipete/gh-issues, steipete/skill-creator · View all 6 →

查看原文→浏览所有技能

在你喜欢的 AI 中提问

打开一个已预加载此 Agent Skill 的新对话。

ChatGPT Claude Gemini Grok Perplexity DeepSeek

文档

browser-agent 是做什么的？

Vision-based browser automation CLI — LLM sees screenshot, clicks coordinates, repeats. No selectors. Supports Claude, Gemini, OpenAI, Ollama (local/free).

Source: https://github.com/rajpra808/browser-agent

Discovered during the daily awesomeskills.dev agent-skill hunt.

rajpra808/browser-agent

browser-agent 是什么？

在你喜欢的 AI 中提问

文档

browser-agent 是做什么的？

相关技能

steipete/gemini

steipete/gh-issues

steipete/skill-creator

steipete/clawhub

steipete/coding-agent

steipete/mcporter