CommunityArte y diseñogithub.com

brycewang-stanford/Paper-WorkFlow

经管/社科实证论文 · 从一句话 idea 到可投稿全文的 AI 全流程总编排器 — an end-to-end meta-orchestrator that turns a research idea into a submission-ready empirical paper.

Compatible conClaude Code~Codex CLI~Cursor
npx skills add brycewang-stanford/Paper-WorkFlow

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

Documentación

Paper-WorkFlow — 经管 / 社科实证论文全流程总编排器

Overview

这是一个 meta-orchestrator(总编排器)。它的职责不是亲自完成研究的每一步,而是把一篇 实证论文从无到有需要的所有环节,编排成一条 10 个阶段(Stage 0–9)+ 2 道硬闸门 的可控流水线,每个 阶段都通过 Skill 工具调用既有 skillAgent 工具派发并行 subagent 来完成,主 代理只负责规划、路由、状态跟踪、阶段间审阅与交付

它站在两套成熟范式的肩膀上:

  • do-agent 的多代理 + 上下文保护范式(本仓库授权模仿):子代理自己把产出写盘、 只向主代理回传状态摘要,绝不回传完整内容;主代理上下文极其稀缺,必须做上下文工程。
  • paper-pipeline 的固定顺序 + 可断点续跑 + 交互档位范式:用 workflow_state.json 记录进度,每阶段有横幅、有快照备份、可中断后从断点恢复;开跑前一次性问清交互档位。

核心纪律:能调用就不要重写。 本仓库 skills/67-econfin-workflow-toolkit/ 已经提供了 覆盖全流程的 47 个 skill;本编排器的价值在于把它们按正确顺序、用正确的上下文、在正确 的人类决策点串起来,而不是复制它们的逻辑。每个阶段「调用哪个 skill」见 references/skill-map.md,「每阶段怎么跑」见 references/stage-playbook.md,「现代因果推断与应用计量的最低证据包」见 references/research-grade-methods.md


这条流水线(固定主线,可按入口跳入)

Stage阶段主要调用的 skill(位于 67-econfin-workflow-toolkit/,除非另注)产出落盘
0Intake & Setup(编排器本体)工作区、workflow_state.json、入口路由
1选题与设计econfin-idea-findernovelty-checksignificance-searchjournal-digesteconfin-proposal01_proposal/proposal.md
2数据data-fetcherdata-cleaning02_data/clean.parquet + codebook.md
3计量识别、估计与方法闸门按设计择一:did-analysis / iv-estimation / rdd-analysis / synthetic-control / panel-data / ols-regression / time-series / ml-causal(+ StatsPAI MCP + research-grade methods pack)03_analysis/ 代码 + design_register.md + method_gate.md
4表与图table + figure04_results/*.tex + *.pdf/png
5写作初稿paper-writer05_draft/main.tex + ref.bib
6全流程打磨paper-pipeline(内部跑 polish→self-revise→style→polish→reference-verify)打磨后的 main.tex
7语言与去 AI 味readability / fix-chinese + (44/47/48/49 去 AIGC 集合)去味后的稿件
8模拟评审与修订referee-reportpaper-referee-revise(或 paper-self-revise修订稿 + response letter
9选刊与投稿paper-submission + reference-verify(终审)期刊清单 + cover letter
复盘与交付(编排器本体)FINAL_REPORT.md + 打包交付物

完整阶段细节、每阶段的 plan→execute→review→revise 微循环、subagent 派发模板,全部在 references/stage-playbook.md主代理在进入某阶段时才去读 对应章节(渐进式加载,省上下文)。

双硬闸门 = 方法闸门 + 初稿质量门。 Stage 3 结束必须先过 research-grade-methods.mdMethod Gate:设计注册、 最低诊断证据、稳健性矩阵与复现脚本齐了,才能把结果送进表图和写作。Stage 7 跑完再过 Draft Quality Gate:结构完整、识别可信、表图齐备、语言无 AI 味的初稿,必须由独立 critic 按 7 维 rubric 打分达标,才算「可投稿级初稿」。任何闸门未达标都按回退指令重做,绝不把 「流程跑完」当成「研究可信」。


Phase 0:Setup(在调用任何子 skill 之前,把下面这些全部做完)

  1. 取北京时间Bash: TZ='Asia/Shanghai' date '+%Y-%m-%d %H:%M',记为 NOW,用于命名与 状态文件。(沿用 do-agent 的「先取日期时间」纪律。)

  2. 判定入口(entry-point routing)。用户带来的东西决定从哪个 Stage 进入——不要一律从 Stage 1 开始:

    用户带来的从哪进入说明
    只有一个研究方向 / 一句话想法Stage 1完整走选题漏斗
    一份已成形的 proposal(X→M→Y、识别策略、样本)Stage 2跳过选题,直接取数
    已清洗好的数据 + 设计Stage 3直接估计
    已有回归结果 / 表图Stage 5直接写初稿
    一份 main.tex 初稿Stage 6直接进打磨流水线
    一份初稿 + 审稿意见Stage 8直接按意见修订
    一份成稿要投稿Stage 9直接选刊

    入口不明确时用 AskUserQuestion 一次问清;能从 $ARGUMENTS(路径后缀 .tex/.md/ 数据扩展名、是否像期刊名)推断就别问。

  3. 建工作区。在用户指定目录(缺省为当前工作目录)下创建 paper_workspace/{研究短名}_{NOW紧凑时间戳}/,内部用 assets/init_workspace.sh 铺出标准 骨架(00_meta/ 01_proposal/ 02_data/ 03_analysis/ 04_results/ 05_draft/ 06_polish/ 07_dehumanize/ 08_review/ 09_submission/ logs/ backups/)。若同名目录已存在,另建新目录、 绝不覆盖do-agent 纪律)。完整布局见 references/workspace-and-state.md

  4. 一次性问清三件套(用一个 AskUserQuestion,多选/多题,避免来回打断):

    • 交互档位全自动(只在最终交付时汇报)/ 阶段确认推荐缺省:每阶段末给摘要、 等放行再进下一阶段)/ 全程交互(每个子 skill 跑自己原生的逐项审批,投稿前终版用)。 —— 这个选择就是各子 skill「快速通道」所需的显式 opt-in
    • 目标期刊(Stage 1/6/9 都要用,提前问以免中途卡住):给 JF/JFE/RFS/MS/QJE/AER/ 《经济研究》/《管理世界》等常见项 + "Other" 自由填;也可填「暂不确定,由 Stage 1 推荐」。
    • 语言:英文稿 / 中文稿 / 中英双语 —— 决定 Stage 7 走 readability 还是 fix-chinese+ 去 AIGC 集合,以及 Stage 5/6 的写作规范。
  5. 写状态文件 00_meta/workflow_state.json(复制 assets/workflow_state.template.json 后填写)。填入 project.{short_name, created_at_beijing=NOW, entry_stage, mode, target_journal, language}, 并把每个 Stage 置为 pending|in_progress|done|skippedmethod_gatequality_gate 起始置 pending(字段含义见 references/workspace-and-state.md)。每个阶段开始置 in_progress、完成置 done,并刷新 last_updated_beijing——这就是断点续跑的依据。

  6. 断点续跑检查。若工作区已存在 workflow_state.json 且有未完成阶段,展示进度并询问: 从第一个未完成阶段继续,还是重头来?(与 paper-pipeline 一致。)

  7. 不要为「计划」单独求批准。Setup 完成后,直接建任务跟踪并开跑do-agent 纪律: 规划阶段结束即执行)。人类决策点交给「阶段确认 / 全程交互」档位去守,而不是在开跑前反复确认。


多代理 + 上下文保护协议(贯穿所有阶段,源自 do-agent

主代理上下文是最稀缺资源。任何"重读大文件、跑长代码、扫一堆文献"的脏活累活,都派给 subagent(Agent 工具)或交给子 skill,主代理只持有指针与状态。硬规则:

  1. 子代理自己写盘,只回传状态摘要。给每个 subagent 显式指定它的输入文件输出文件, 要求它"处理完立即把结果写到指定文件,只向主代理回传 ≤10 行的状态摘要(做了什么、写到哪、 关键数字、是否通过、下一步建议)"。严禁把完整产出回传主代理。
  2. 主代理为子代理放行 Read + Write + Bash(必要时含 Skill),让它能独立完成闭环。
  3. 能并行就并行。同一阶段内彼此独立的任务(如多个稳健性检验、多个候选期刊匹配、多份机制 检验)一次性并行派发(每批 ≤10 个 subagent,参考 do-agent 的 10-agent 上限与 idea-finderPARALLEL_BATCH_SIZE=5)。有依赖的串行。
  4. 每阶段是一个 do-agent 微循环plan(规划/收集) → execute(执行/整合) → review(审阅/挑错) → revise(按审阅修订)。重活阶段(1 选题、3 估计、6 打磨、8 评审)尤其 要派一个独立 critic subagent 做对抗式审阅,再据其反馈修订。
  5. 子 skill 的调用方式:轻量、需要主线上下文的(如 paper-style 要顺着同一份 main.tex) 直接在主代理里调;重量、可隔离的(如多路文献扫描、批量稳健性)派 subagent,并在 subagent 的 prompt 里强制要求它按下文「子 skill 调用协议」加载对应子 skill(优先 Skill(<注册名>)、 not found 则 Read 该 SKILL.md),绝不许它凭记忆脑补(参考 idea-finder 让每个 subagent 强制加载 econfin-proposal+novelty-check 的做法)。
  6. 日志:每阶段把"调用了哪些 skill / 派了哪些 agent / 产出了哪些文件 / 关键决策"追加到 logs/stage_<N>.md,作为复盘与续跑的审计轨迹。

子 skill 调用协议(怎么把被编排的 skill 真正跑起来)

本编排器的全部价值都建立在「能正确调起子 skill」上。子 skill 是仓库内的文件夹不保证在 用户运行时里注册为可被 Skill 工具直接触发的 skill。因此每次调用按下面的优先级走(权威细节见 references/skill-map.md 第 0 节):

  1. 优先 Skill 工具——Skill(skill="<注册名>", args=...)注册名 = 该 skill SKILL.md 前言的 name: 字段,不一定等于文件夹名。已知大小写/改名差异:econfin-proposalEconfin-Proposalsignificance-searchSignificance-Searchchinese-pptchinese-ppt2command-developmentCommand Development用注册名,别用文件夹名猜。
  2. Skill 报「not found」就立刻退回 Read 内联执行(稳路径,永远可用): Read skills/67-econfin-workflow-toolkit/<folder>/SKILL.md,把它的正文当作本步操作手册逐步执行 ——轻量步骤在主代理里跑,重量步骤把「Read 这个 SKILL.md 并按它执行」写进 subagent 的 prompt。 不要反复重试 Skill,也不要凭记忆脑补子 skill 的逻辑(这正是 idea-finder 反复警告的劣化)。
  3. 覆盖会写到仓库外的输出路径econfin-idea-finderF:\Dropbox\CC\选题大全\)与 journal-digestF:\OneDrive\研究发展部\期刊速递\)在其 SKILL.md 里硬编码了 Windows 绝对输出路径。调用它们时 必须在 args / subagent prompt 里把输出目录改写为工作区内路径(候选→01_proposal/candidates/, 期刊摘要→01_proposal/journal_digest.md)。模板见 references/subagent-templates.md

派 subagent 调子 skill 时,SKILL.md 路径必须是仓库内完整路径——subagent 的工作目录可能与主 代理不同,给错路径它就找不到文件、转而脑补,产出不可复现的劣化结果。


阶段执行协议(每个 Stage 都按这个走)

进入任一阶段时,按固定四步执行(细节在 playbook 对应章节):

  1. 打横幅,让用户始终知道流水线在哪:

    ════════════════════════════════════════
      Stage N/9 · <阶段名>  —  <一句话目的>
      调用:<本阶段要用的 skill 列表>
    ════════════════════════════════════════
    
  2. 置状态 in_progress → 读 references/stage-playbook.md 的 对应章节 → 按其 plan→execute→review→revise 跑(该用 SkillSkill,该派 AgentAgent,全程守上面的上下文保护协议)。

  3. 冲突 / 退化检查(沿用 paper-pipeline):若工作区被多端编辑(Overleaf/Dropbox),每阶段 前后 Glob 一次 *冲突副本*/*conflicted copy*,发现就停下让用户定夺哪份为准。每阶段末把 关键产物快照进 backups/after_stage<N>/,作为回滚路径。

  4. 阶段闸门:置状态 done → 按交互档位决定是否暂停:

    • 全自动:直接进下一阶段;
    • 阶段确认(缺省):输出本阶段摘要卡(产出文件清单 + 关键数字 + 红旗 + 下阶段计划), 等用户放行;
    • 全程交互:本阶段内各子 skill 已逐项审批过,这里再做一次阶段级确认。

    遇到硬阻断(平行趋势不过、IV 弱工具、查新发现撞车、数据取不到)时:不要硬往下走—— 按 playbook 的「失败回退」分支处理(换识别策略 / 换样本 / 退回 Stage 1 改设计),并在摘要卡 里显著标红告诉用户发生了什么、采取了什么回退。(参考 China-CF-study 的「预期实证结果 无法实现时自动切换备选方案」纪律。)


研究级方法闸门(Method Gate)—— Stage 3 之后、Stage 4 之前强制执行

Stage 3 的目标不是「跑出显著系数」,而是把识别设计、估计量、诊断证据和稳健性矩阵落成可审计产物。 因此 Stage 3 必须加载 references/research-grade-methods.md,并完成:

  1. 设计注册:写 03_analysis/design_register.md,明确 estimand、处理定义、比较组、识别假设、 主估计量、替代估计量和失败回退。
  2. 最低证据包:按方法分支补齐必需 artifact。交错 DiD 需 CS/SA/BJS 等 group-time 或事件研究稳健 估计;RDD 需 bandwidth、robust bias-corrected CI、density/covariate continuity;DML/HTE 需 cross-fitting、nuisance diagnostics、overlap 与 seed stability;其它分支见 methods pack。
  3. 方法闸门报告:写 03_analysis/method_gate.md,逐项列出必需证据是否存在、路径在哪里、是否 PASS。若 NOT PASS,不得进入 Stage 4;必须按报告回 Stage 1/2/3 修设计、数据或估计。
  4. 写入状态:更新 workflow_state.json.method_gatedecisions,记录主设计、主估计量、缺失 artifact、是否放行。

质量门可以比方法闸门更严,但不能更松:若 method_gate.md 未通过,初稿质量门的「识别可信度」不得 达标。这个约束把现代实证研究的 reviewer 标准前置到写作之前,避免后面用语言包装弥补方法硬伤。


初稿质量门(Draft Quality Gate)—— 把「高质量」从口号变成可验收的闸门

Stage 7 结束、Stage 8 开始之前,强制插入一道质量门。这是本编排器兑现「高质量初稿」承诺 的地方:不靠主代理自我感觉良好,而是派一个独立的「顶刊 AE」critic subagent,按 references/quality-rubric.md 的 7 维评分卡对当前初稿打分。

怎么跑(一次 Agent 派发,模板见 subagent-templates.md §QG):

  1. critic subagent 读 07_dehumanize/main.tex(含表图、ref.bib)+ 01_proposal/proposal.md(对照 贡献承诺)+ 03_analysis/results/summary.md(对照真实结果),逐维打分并写入 00_meta/quality_scorecard.md,只向主代理回传「总分 / 各维分 / 是否达标 / 最关键的 3 条短板」。
  2. 7 个维度(满分各 10,细则见 rubric):① 选题与贡献锋利度 ② 识别可信度 ③ 稳健性完整度 ④ 结果与解读克制度 ⑤ 写作与结构 ⑥ 引用真实性与文献定位 ⑦ 可复现性。
  3. 达标线:每维 ≥ 7 总分 ≥ 56/70 第②③⑥维(识别 / 稳健 / 引用)无任何「致命红 旗」。三者全满足 → 标记 quality_gate=passdraft_milestone=done,进入可选的 Stage 8–9。
  4. 未达标 → 按 rubric 的「短板 → 回退阶段」映射退回重做(识别问题回 Stage 3、贡献单薄回 Stage 1、写作问题回 Stage 5/6、AI 味回 Stage 7、引用问题回 reference-verify),最多回退 2 轮; 2 轮后仍卡在某维,则在质量门记录「已知短板」并显著标红告知用户,由用户裁决是否带病进入投稿。
  5. 每轮打分都追加进 logs/quality_gate.md,让用户看到分数如何随修订上升(审计轨迹)。

质量门不是重跑 Stage 6 的打磨,也不替代 Stage 8 的模拟评审:打磨改语言、评审挑学术硬伤、 质量门只做一件事——按统一 rubric 量化「这份初稿够不够格」并决定放行还是回炉。它把「高质量」 落成一个有阈值、可回退、可审计的闸门。


收尾:复盘与交付

所有目标阶段 done 后(初稿质量门已 pass),主代理产出 FINAL_REPORT.md(落在工作区 根目录),含:

  • 一页流水线复盘表:每个 Stage 调用了什么、产出了什么、关键数字、走过哪些回退分支;
  • 方法闸门报告:嵌入或链接 03_analysis/design_register.md03_analysis/method_gate.md, 说明主设计、主估计量、最低证据包、缺失/回退历史;
  • 初稿质量门评分卡(嵌入或链接 00_meta/quality_scorecard.md):7 维终评分 + 达标判定 + 回退历史,证明「高质量」不是自我宣称而是过了闸门;
  • 交付物清单(带相对路径链接):proposal.md / 清洗后数据 + codebook / 分析代码 / 出版级表图 / main.tex+ref.bib / response letter / 期刊清单 + cover letter;
  • 可复现说明:环境依赖、一键重跑命令、数据来源与版权注记;
  • 下一步建议:还差哪些稳健性、投稿前最后检查清单。

最后把交付物打包路径告知用户。全程不需要人工干预即可从 Setup 跑到交付全自动 档位); 其余档位只在阶段闸门处征求放行。


关键约束(务必遵守)

  • 绝不替子 skill 重新发明轮子。识别策略、表格规范、查新逻辑、审稿口吻……都在既有 skill 里, 本编排器只负责"在对的时点把对的 skill 喂对的输入"。
  • 绝不伪造数据 / 结果 / 文献。引用核验交给 reference-verify;数据来源交给 data-fetcher; 计量结论以真实运行结果为准(可用 StatsPAI MCP 链路:detect_design → preflight → recommend → fit(as_handle) → audit_result → sensitivity_from_result → bibtex)。
  • 绝不贴空方法标签。DiD / IV / RDD / SDID / DML / causal forest 等标签必须对应 research-grade-methods.md 要求的证据包;缺 method_gate.md 或闸门未过,就不得把相关结果写成主 因果发现。
  • 人类决策点不可跳过(除非 全自动 档位且用户已显式授权):选题定标题、定目标期刊、识别 策略拍板、投稿前终审——这些在阶段闸门处守住。
  • 上下文保护优先于一切:任何会把大段文本灌回主代理的操作,改成"写盘 + 回传摘要"。

进一步阅读(按需加载,别一次性全读进上下文)

  • references/stage-playbook.md — 10 个阶段的逐阶段操作手册 (含每阶段的 skill 调用、subagent 派发模板、失败回退分支)。
  • references/skill-map.md — 第 0 节是**子 skill 调用机制 + 注册名对照表
    • 输出路径重定向**(编排能否跑通的关键);其余是「任务 → 用哪个 skill」的全量路由表。
  • references/quality-rubric.md初稿质量门的 7 维评分卡:每维 评分细则、致命红旗清单、达标阈值、「短板 → 回退阶段」映射。
  • references/subagent-templates.md可直接复制的 subagent 派发模板:Stage 1 选题漏斗、Stage 3 稳健性矩阵、各阶段 critic、初稿质量门评分器,均已内置 上下文保护契约与输出路径重定向。
  • references/workspace-and-state.md — 工作区目录布局、 workflow_state.json 字段含义、subagent 输入/输出文件约定。
  • 演示物料(可选教学用):本仓库根目录有一份 30 页流程 PPTX 与一个可一键运行的 DiD 演示 Notebook,适合在讲解本流水线时配合展示。

Skills relacionados

THEFABIAN10/AIFoundry-AgentsV2-HostedWorkflow

🚀 Build and manage multi-agent workflows in Azure AI Foundry using Python for streamlined orchestration and enhanced project control.

community

wondelai/pragmatic-programmer

Apply meta-principles of software craftsmanship: DRY, orthogonality, tracer bullets, and design by contract. Use when the user mentions "best practices", "pragmatic approach", "broken windows", "tracer bullet", "software craftsmanship", "technical debt prevention", "prototype vs tracer bullet", or "code ownership". Also trigger when evaluating build-vs-buy decisions, designing estimation approaches, or choosing between reversible and irreversible architectural decisions. Covers estimation, domain languages, and reversibility. For code-level quality, see clean-code. For refactoring techniques, see refactoring-patterns.

community

affaan-m/prisma-patterns

Prisma ORM patterns for TypeScript backends — schema design, query optimization, transactions, pagination, and critical traps like updateMany returning count not records, $transaction timeouts, migrate dev resetting the DB, @updatedAt skipped on bulk writes, and serverless connection exhaustion.

community

employeesavingsplanmelagra893/SkillAnything

Automate skill acquisition and task execution using a modular Python framework compatible with Claude Code, OpenClaw, and Codex.

community

1139030773-cmd/agent-workflow-system

中英双语 AI 工作流系统,7个协作技能覆盖引导/规划/执行/审计/收尾全生命周期。Bilingual AI workflow system — 7 collaborative skills for project guidance, planning, execution, auditing, and closeout. Claude Code & Codex.

community

pt1987/claude-code-psadt-skill

Claude Code skill for the full PSADT v4.x → Intune Win32 packaging lifecycle: guided build, packaging, testing, and optional direct Graph upload.

community