Community研究與資料分析github.com

O0000-code/meta-analysis-skill

Publication-grade meta-analysis & systematic review as an agent skill — run by Claude Code · Codex · any SKILL.md agent, with seven human sign-off gates and red lights computed by R. PRISMA 2020 · GRADE · AMSTAR 2.

相容平台Claude CodeCodex CLI~Cursor
npx skills add O0000-code/meta-analysis-skill

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

說明文件

Meta-Analysis

定量元分析专用 Skill。在 systematic-review 完成 L1-L8 之后,从 L9 起大幅扩展为完整定量合并工作流。R 统计由 Claude Code 在本地 R 环境直接执行 Rscript(metafor 等),原始输出(summary / warnings / sessionInfo)入审计包、红灯由 R 算(不靠 LLM 读数字),与 ssci-plots 联动产出 forest / funnel plot。

快速入口:第一可执行步骤见 §3 主 Agent 启动流程 + §4.2 L9.1 效应量提取。详细方法见 references/ + scripts/ + 底座 SSOT。


1. 触发与适用场景

1.1 触发短语

英文:meta-analysis、effect size pooling、random-effects model、forest plot、funnel plot、heterogeneity I-squared、meta-regression、subgroup analysis、Hunter-Schmidt、RVE meta-analysis、three-level meta-analysis、MASEM、meta-analytic SEM、reliability generalization、p-curve、PET-PEESE、RoBMA、metafor、psychmeta。

中文:元分析、Meta 分析、定量综合、效应量合并、森林图、漏斗图、异质性、随机效应模型、Meta 回归、亚组分析、心理学元分析、量表元分析、信度概化、心理测量元分析、依赖效应量、RVE 元分析、三层元分析、出版偏倚、p 曲线。

1.2 反向触发(不适用 / 切到其他 Skill)

用户场景切到
只做检索/筛选/RoB(L1-L8),不做合并systematic-review
只做定性证据综合(无效应量)systematic-review(质性路径)或 literature-set-review
已收集文献集,要写综述但不做合并literature-set-review
叙述综述 / 范围综述 / 整合综述field-overview-review
50 年/30 年的领域发展史综述field-evolution-review
理论建构 / 构念分析 / 对立理论比较theoretical-review
渲染 forest/funnel plotssci-plots(联动)

1.3 启用条件提示

  • 心理学场景(默认必读):触发关键词含心理学构念、量表(BDI、SCL-90、Big Five 等)、APA 期刊、JARS、复制危机。同时加载 SSOT-PSYCHOLOGY-SUPPLEMENTS.md(含 8 议题)。
  • 中文场景:用户中文交流、提及《心理学报》《心理科学进展》、CNKI、GB/T 7714。同时加载 SSOT-CHINESE-CONTEXT.md
  • 网络元分析:用户比较 ≥3 种治疗或提及 NMA / network meta-analysis。同时加载 SSOT-SYNTHESIS-METHODS.md §4。

2. 假设前提(L1-L8 已就绪)

本 Skill 假设 L1-L8 已就绪:用户已通过 systematic-review 或自行完成研究问题构造、检索、筛选、提取、RoB(详见 §13 与 systematic-review 联动)。如未完成 L1-L8,主 Agent 应建议先切到 systematic-review。


3. 主 Agent 角色与责任

你是协调者、判断者、规划者,不是执行者。 每个 SubAgent 必须使用当前可用的最强模型(与主 Agent 同级,不为省成本降级);默认阻断;同消息内多 Agent 调用 = 并行。

3.1 主 Agent 必读(启动后立即加载,不等待"何时加载"决策表)

主 Agent 在 Skill 触发后立即加载以下 SSOT,不允许等到工作流中后段才"按需加载":

全 6 Skill 共享必读(强制):

  • review-methodology-foundations/references/SSOT-AI-FAILURE-DEFENSES.md(4 类 LLM 失败模式与防御 — MA 4 类全部 CORE,§2 §3 加强)
  • review-methodology-foundations/references/SSOT-LIFECYCLE-12-PHASES.md(任意位置确认当前阶段)
  • review-methodology-foundations/references/SSOT-METHODOLOGY-TERMINOLOGY.md(跨阶段术语统一)

MA 特定必读

  • SSOT-EFFECT-SIZE-DECISION.md(L9.1 必读)
  • SSOT-SYNTHESIS-METHODS.md(L9.4 模型选择 / L9.5 异质性 / L9.9 出版偏倚)
  • SSOT-PSYCHOLOGY-SUPPLEMENTS.md(心理学场景默认必读,含 8 议题)

MA 在 SSOT-AI-FAILURE-DEFENSES 的强防御项(4 类全 CORE,§2 §3 加强):

  • §2 效应夸大加强:除 Cohen 表外,加 Funder & Ozer 2019 严格标准;CI 强制延伸到所有 subgroup / meta-regression 结果
  • §3 置信幻觉加强:异质性 I² > 75% 强制不呈现合并效应;publication bias 必做清单 = funnel(contour-enhanced)+ 回归检验(Egger / Peters / Harbord,按效应量类型路由)+ 心理学补充 ≥ 1(p-curve / p-uniform* / PET-PEESE / selection models / RoBMA);trim-and-fill 仅作敏感性分析(与 §4.2 L9.9 一致)

3.2 启动流程(第一可执行步骤指引)

派发顺序按 §4 工作流: 0. MA 入口 preflight(关 BK-1):派 L9.1 前确认 decisions/01/02/07/08 已就绪——联合路径由 SR L1-L8 产出;独立 MA 入口(用户已自行完成 L1-L8、直接进 MA)须先据 §3.3"独立 MA 入口脚手架"从 decisions_templates/ 拷模板填好这 4 档。缺任一即阻断 L9.1(不读决策档案直接执行违反 §3.3 强制必读)。

  1. L9.1 派发 Effect-Size-Extractor(第一可执行步骤,见 §4.2)→ 每研究效应量 + SE
  2. L9.2-L9.4 串行(校正 → 依赖 → 模型选择)
  3. L9.5 异质性先行(其阻断信号决定 L9.6/L9.7 是否强制)→ L9.6/L9.7 可并行;L9.8 敏感性须串行于 L9.5 之后(leave-one-out / FE vs RE / τ² 估计器对照都依赖 L9.5 已定的模型基线,不与 L9.5 并行
  4. L9.9 单独跑(依赖前面结果);L9.10 按需
  5. L10 GRADE → L11 写作(含 Chart-Bridge ssci-plots 联动)→ L12 自评

3.3 跨阶段决策档案规则(强制)

主 Agent 在每阶段产出后将决策结论写入 decisions/ 子目录(与本任务工作目录平级)。每个决策档案为独立 md 文件(YAML frontmatter + 正文,≤ 100 行/档),不复制 SSOT 内容。

MA 决策档案目录结构(与 SR 联合时复用 SR 的 01-08):

decisions/
  01_type_decision.md          # L1:含心理学场景判定(关键 — 决定 L11 加载 JARS-Quant)
  02_research_question.md      # L2:PICO + 效应量预设
  03_mode_decision.md          # L3:严格 vs 学习
  07_data_types.md             # L7:双人提取字段
  08_rob_tool_decision.md      # L8:RoB 工具
  09_synthesis_decision.md     # L9:FE/RE/RVE/三层/MASEM 选择 + k 阈值
  09.1_effect_size.md          # L9.1:效应量类型 + SE 反算
  09.4_model_selection.md      # L9.4:FE vs RE
  09.5_heterogeneity.md        # L9.5:I² / Q / τ² / 95% PI
  09.6_subgroup.md             # L9.6:k≥10 启用
  09.9_publication_bias.md     # L9.9:4+ 工具
  10_grade_decision.md         # L10
  11_reporting_standard.md     # L11:APA MARS Table 9 + PRISMA 2020 + 12 处差异

独立 MA 入口决策档案脚手架(关 BK-1,必读):MA 第一可执行步骤 L9.1 必读 decisions/01/02/07/08(§3.3 跨阶段强制必读 + decision-provenance §3),但这 4 档的生产者在 SR L1-L8。两条入口分别这样落地,避免独立入口"必读却无人创建"而卡死

  • 联合路径path: combined_with_sr):SR L1-L8 已产 01/02/03/07/08(共用同一 decisions/ 目录)→ MA 直读不重写(衔接门见 §13.1 N-4)。
  • 独立 MA 入口path: standalone,用户已自行完成 L1-L8、直接进 MA):主 Agent 在派 L9.1 之前,把用户已完成的 L1-L8 结论落成 01_type_decision.md(含心理学判定)/ 02_research_question.md(PICO + 效应量预设)/ 07_data_types.md(数据类型 + 信度 + n)/ 08_rob_tool_decision.md——直接拷 review-methodology-foundations/decisions_templates/ 对应空白模板骨架填写(模板含 frontmatter + 决策结论/依据/上下游/校验结构)。
  • 结构性阻断门(非"prompt 提醒")01/02/07/08 缺任一 → preflight 阻断 L9.1(视作"未读决策档案直接执行");不允许主 Agent 即兴补写无模板的决策档案,也不允许跳过这 4 档直接派 Extractor。

decisions_templates/空白模板骨架(S4 建,路径 review-methodology-foundations/decisions_templates/),覆盖 SR 11 类 + MA 5 个 09.x 子阶段 + 监督产物 04a/07a/09.x_audit。它是"给 01/02/07/08 一个可拷的起点",本身不是决策实例。

跨阶段强制必读:L9/L10/L11/L12 阶段的所有 SubAgent prompt 必含:

**必读(决策档案)**- decisions/01_type_decision.md(含心理学判定 → L11 加载 JARS-Quant 的依据)
- decisions/02_research_question.md
- decisions/03_mode_decision.md
- decisions/07_data_types.md
- decisions/08_rob_tool_decision.md
- decisions/09*.md(按本阶段需要选 09.1/09.4/09.5 等)
- decisions/10_grade_decision.md(仅 L11/L12)
- decisions/11_reporting_standard.md(仅 L12)

主 Agent 在 L11 写作前必须二次验证:当前 L11 SubAgent 计划的报告标准与 decisions/01_type_decision.md(含心理学判定)+ decisions/11_reporting_standard.md 一致。心理学场景必须叠加 JARS-Quant Table 9 在 PRISMA 2020 上。不一致即阻断。详见 references/decision-provenance.md

3.4 必须亲自做 vs 必须外包

必须亲自做必须外包给 SubAgent
阅读用户需求 + 关键文件任何 R 代码生成(按 §5 R 包路径选择 + 模板)
决定是否走"SR L1-L8 + MA L9-L12"联合工作流任何效应量提取/转换的具体执行
撰写规划文档(L9 子顺序、R 包、模型选择理由)任何模型拟合输出的解读
评估每轮 SubAgent 产出(计算正确性 / 模型合理性 / PB 稳健性)任何出版偏倚检验的具体执行与解读
与用户的关键沟通(数据格式确认、模型仲裁、最终交付)任何 APA MARS 报告章节的撰写
决策档案的写入与维护

3.5 不允许的妥协

  • 不允许主 Agent 直接写 R 代码 / 直接调 MCP(PRES-003)
  • 不允许 SubAgent 替主 Agent 做"是否信任合并效应"的最终判断
  • 不允许跳过出版偏倚检验或异质性披露阶段
  • 不允许 I² > 75% 时仅呈现合并效应作为主要结论(违反 SSOT-AI-FAILURE-DEFENSES §3)
  • 不允许 k < 5 时强行 RVE / 三层(详见 §4.2 L9.3)
  • 不允许 k < 10 时强行 publication bias 检验(详见 §11.5)

4. 完整工作流(12 阶段对齐)

按 12 阶段对齐(参见 SSOT-LIFECYCLE-12-PHASES.md)。MA 在 SR 基础上 L9 大幅扩展为 10 子阶段。

4.1 12 阶段总览(L1-L8 默认由 SR 完成)

阶段关键产出决策档案SSOT
L1类型识别(含心理学判定)01_type_decision.mdSSOT-REVIEW-TYPES
L2PICO + 效应量预设02_research_question.mdSSOT-PICO-FRAMEWORKS
L3严格 vs 学习模式03_mode_decision.mdSSOT-MODE-PROFILES
L4检索(PsycINFO + ClinicalTrials.gov + 灰色文献)SSOT-SEARCH-STRATEGY
L5-L6PRISMA 流程 + 双盲筛选SSOT-PRISMA-FLOW-DIAGRAM
L7双人提取(含 ES + SE + 信度 + n)07_data_types.mdSSOT-EXTRACTION-FIELDS
L8RoB(含 Metapsy 心理治疗扩展)08_rob_tool_decision.mdSSOT-ROB-TOOL-MAPPING
L9定量合并(10 子阶段,本 Skill 核心)09*.mdSSOT-SYNTHESIS-METHODS + SSOT-EFFECT-SIZE-DECISION
L10GRADE10_grade_decision.mdSSOT-GRADE-FRAMEWORK
L11APA MARS + PRISMA 2020 + ssci-plots 联动11_reporting_standard.mdSSOT-REPORTING-STANDARDS
L12AMSTAR 2 自评SSOT-AMSTAR-2-CHECKLIST

如果用户未完成 L1-L8,主 Agent 先建议切到 systematic-review。

4.2 L9:定量合并(10 子阶段,第一可执行步骤)

L9.1 效应量提取第一可执行步骤):派发前 preflight(关 BK-1/BK-7)——① 确认 decisions/01/02/07/08 已就绪(独立入口按 §3.3 脚手架先建、联合入口由 SR 产;缺则阻断);② 联合路径必读 decisions/09_synthesis_decision.md 的切换结论(≠"推荐切 MA"则阻断,见 §13.1 N-4)。preflight 通过后派 Effect-Size-Extractor → 5 决策树(D1 二分 / D2 连续 / D3 有序 / D4 计数 / D5 生存)+ 7 SE 反算公式 + 8 unit-of-analysis + 零事件处理。详见 references/L9.1-effect-size-extraction.md。SSOT:SSOT-EFFECT-SIZE-DECISION §1-§5。

L9.2 效应量校正:派 Correction-Agent → Hedges' g 校正(默认 N < 60 关键,校正失败回退见 §11.6)+ Hunter-Schmidt artifact correction(仅心理学量表)。Bare-bones vs Psychometric 模式选择。详见 references/L9.1-effect-size-extraction.md §3 + references/L9-psychology-special.md

L9.3 依赖性处理(k 阈值决策):判断依赖性 → 选择方法。

场景推荐方法k 阈值R 包
多 outcome / 多时点 / 多对照,依赖结构未知RVEk ≥ 5(< 5 不允许)robumeta + clubSandwich
层级明确 + k ≥ 20三层k ≥ 20(< 20 给 CR2 校正;< 5 不允许)metafor rma.mv()
多变量关系建模(中介/调节)MASEMk ≥ 10metaSEM
k < 5不允许 RVE / 三层走单研究叙述 + sensitivity 单独报告(A 级替代路径)

派 Dependency-Agent。详见 references/L9-psychology-special.md

L9.4 固定/随机效应模型选择:派 Model-Selection-Agent → 决策树 + 默认 RE(FE 仅在干预真无效假设下)+ τ² 估计器(REML 默认)+ HKSJ CI(k > 2 + τ² > 0 时优于 Wald)+ k=2-4 决策表(详见 §11.4)。详见 references/L9.4-fixed-random-models.md

默认 RE 模型的诚实披露(L9.4 末尾必嵌入 — C4 三段体例): 段 1(教材原假设):FE vs RE 选择依赖研究者对异质性的判断(Borenstein 2009; Cochrane §10)。 段 2(LLM 实现差异):本元分析默认采用 RE,FE 仅在干预真无效假设下使用。差异 3 处:(1) 无显式用户提供异质性假设;(2) k < 10 时使用 HKSJ;(3) k = 2-4 时跑 FE+RE 双 sensitivity(Cochrane v6.5 §10.10.4)。 段 3(缓解 + Limitations):报告 FE+RE 双结果;k ≥ 5 报 PI;心理学场景 + k < 5 报 PI 但显式标注"normal 假设不稳健"。在 Discussion 披露默认 RE 的方法学选择。

L9.5 异质性检验:派 Heterogeneity-Agent → Q + I² + τ² + 95% PI(k ≥ 5 必报;心理学必报)。I² > 75% 不允许仅呈现合并效应I² > 90% 完全禁止合并 + 强制 subgroup / meta-regression(详见 §11.5)。详见 references/L9.5-heterogeneity.md

L9.6 子组分析(k ≥ 10):派 Subgroup-Agent → 预设 vs 事后必须区分(JARS Table 9 §METHOD §6)+ 正式统计检验子组间(不允许仅比较子组内 P 值)+ ICEMAN 6 维度。详见 references/L9.6-subgroup-metaregression.md

L9.7 Meta-regression(k ≥ 10):派 Metaregression-Agent(与 L9.6 可并行)→ 每分类特征 ≥ 10 项观察 + 比率类用 log-transformed。详见 references/L9.6-subgroup-metaregression.md

L9.8 敏感性分析:派 Sensitivity-Agent(串行于 L9.5 之后——leave-one-out / FE vs RE / τ² 估计器对照 / 排除高 RoB 复算都需要 L9.5 已定的模型基线,不与 L9.5 并行;与 L9.9 可并行)→ Leave-one-out + FE vs RE vs HKSJ + 不同 τ² 估计器 + 不同 effect measure + 排除高 RoB 复算。

L9.9 出版偏倚:派 PublicationBias-Agent → 核心必做(funnel + Egger/Harbord/Peters;k ≥ 10 才有效,详见 §11.5);心理学补充 ≥ 1(p-curve / PET-PEESE / RoBMA / Selection models)。依赖效应量(L9.3 判定三层/RVE)→ 发表偏差用 Egger-MLMA(scripts/egger_mlma.R),非单水平 Egger;RoBMA 需 JAGS 默认不选(缺则降级 puni_star+PET-PEESE)。Trim-and-fill 已被 Cochrane v6.5 降级(仅作敏感性分析)。详见 references/L9.9-publication-bias.md

L9.10 MASEM(按需):仅中介/调节 SEM 综合启用。TSSEM / One-Stage MASEM。详见 references/L9-psychology-special.md §3。

4.3 L10:GRADE 证据等级

派 GRADE-Agent → 元分析专属考虑:不精确(CI 跨决策阈值)、不一致(I² > 50% 通常降级)、出版偏倚(funnel 不对称 + Egger p < 0.10 降级)+ 结合 RoB 2 / ROBINS-I。SSOT:SSOT-GRADE-FRAMEWORK

4.4 L11:报告(APA MARS Table 9 + PRISMA 2020 + 联动产图)

派 Write-Agent(2-2-1 备份法)+ 报告标准核对 SubAgent。

  • APA MARS Table 9:13 章节完整对接
  • PRISMA 2020:27 条清单
  • JARS-Quant 12 处差异(心理学场景 — 由决策档案 01_type_decision.md 心理学判定触发):预先/事后假设分组、心理测量学特征、构念效度、测量误差伪迹、moderator vs subgroup、效应量+CI 强制、Hedges 校正、Bayesian 先验、统计代码位置、不利效应章节
  • 联动 ssci-plots:forest plot、funnel plot(contour-enhanced)、SoF 表

详见 references/L11-mars-reporting.md。SSOT:SSOT-REPORTING-STANDARDS §1.3.1 + §3。

4.5 L12:自评(AMSTAR 2 元分析维度)

派 Self-Assessment Agent → AMSTAR 2 16 项 + 7 关键域。SSOT:SSOT-AMSTAR-2-CHECKLIST


5. R 包路径(按议题映射)

议题主 R 包代码模板
标准元分析(FE/RE)metaforscripts/metafor_basic.R
依赖效应量(RVE)robumeta + clubSandwich + wildmetascripts/rve_clubSandwich.R
依赖效应量发表偏差(Egger-MLMA)metafor rma.mv / robumeta+clubSandwichscripts/egger_mlma.R
三层元分析metafor rma.mv()scripts/metafor_basic.R(含 rma.mv 块)
心理测量(Hunter-Schmidt)psychmetascripts/psychmeta_hunter_schmidt.R
MASEMmetaSEM(+ OpenMx / lavaan)scripts/metaSEM_masem.R
p-curve / p-uniformpuniform · dmetar::pcurvescripts/puniform_pcurve.R
PET-PEESEstats::lm(WLS 原始实现;metafor mods 为可辩护变体,须披露)scripts/metafor_basic.R §11 + references/L9-r-code-templates.md §8
Selection modelsweightr(示例代码)
RoBMARoBMA需 JAGS 系统库(本机缺)→ 默认不选,降级 puni_star + PET-PEESE(见 §11.2 / L9.9 §4.3)
贝叶斯元分析brms · rstanarm · bayesmeta(高级,按需)

桥接哲学:本 Skill 由 Claude Code 在本地 R 环境直接执行 Rscript(metafor 等)跑出统计结果——不再生成代码让用户复制到外部环境跑后回填。print(summary()) + warnings() + sessionInfo() 原始输出原样进审计包(侧车文件 + 审核卡⑤段下钻),可复现;阻断/披露红灯由 scripts/audit_parse.Rrma 对象字段直接算出 flag JSON,不靠 LLM 读 summary 文本。保留的原则内核:不编造统计结果、人在签核点担责、可复现。详见 references/L9-r-code-templates.md

LLM 介导本地执行工作流的诚实披露(嵌入 references/L9-r-code-templates.md 顶部 — C4 三段体例): 段 1(教材原假设):标准元分析假设分析师直接编写并执行 R 代码(或用 JASP / RevMan GUI),完全控制数据输入、模型设定、输出验证。 段 2(LLM 实现差异):本综述由 Claude Code 在本地 R 环境直接执行 LLM 生成的 Rscript,并把原始输出(summary / warnings / sessionInfo)留痕入审计包;阻断/披露判定由固定的 audit_parse.R 从 rma 对象字段算出,不靠 LLM 解读输出文本。这消除了"复制粘贴回填 / 预期与实际数据格式错配"那一类旧风险。仍存在的真局限:R 代码仍由 LLM 生成,可能存在编译通过但结果错误的细微 bug(错变量名 / 错函数调用)——本地执行不能自动证明结果正确。 段 3(缓解 + Limitations):(1) 脚本经回归测试套件(tests/)验证 + 原始输出可人工复核,红灯由 R 算降低 LLM 读错数字的风险;(2) 至少包含一项 sensitivity analysis(leave-one-out / 替代 τ² 估计器)以检测异常;(3) 人在签核点对统计判断拍板担责;可复现性靠 sessionInfo + 固定脚本。在 Discussion/Limitations 仍应披露"统计由 LLM 介导的本地自动化工作流完成"是方法学特征。

详见 references/L9-r-code-templates.md


6. 何时加载哪个 references 文件

何时加载(具体决策动作粒度)references 文件
当主 Agent 在 L9.1 阶段需要决策效应量类型 / SE 反算 / unit-of-analysis 时references/L9.1-effect-size-extraction.md
当主 Agent 在 L9.4 阶段需要决策 FE/RE/HKSJ 时references/L9.4-fixed-random-models.md
当主 Agent 在 L9.5 阶段需要披露异质性指标(含 I² > 75% 阻断决策)时references/L9.5-heterogeneity.md
当主 Agent 在 L9.6 / L9.7 阶段(k ≥ 10)需要派发子组 / meta-regression SubAgent 前references/L9.6-subgroup-metaregression.md
当主 Agent 在 L9.9 阶段(k ≥ 10)需要派发出版偏倚 SubAgent 前references/L9.9-publication-bias.md
当主 Agent 派发任何 R 代码生成 SubAgent 前references/L9-r-code-templates.md
当心理学场景触发,主 Agent 在 L9.2-L9.10 中需要决策 8 议题(RVE/三层/MASEM/H-S/RG)时references/L9-psychology-special.md
当主 Agent 在 L11 写作前需要决策 APA MARS Table 9 + JARS-Quant 12 处差异时references/L11-mars-reporting.md
当主 Agent 派发任何 SubAgent 时按需查阅模板references/subagent-templates.md
当主 Agent 派发任何 Review-Agent 前(与四铁律 + AI 失败防御对接)references/quality-control.md
当主 Agent 任何阶段需要写入或查询决策档案时references/decision-provenance.md

7. 字数控制

字数公式、矩阵与调整因子详见 SSOT-WORDCOUNT-RULES.md §3.1(综述类型 × 文献规模矩阵第 5 行:元分析)+ §3.3(调整因子)+ §3.4.5(元分析特殊条款)+ §4(字数纪律)。本节不复制 SSOT 数字。

7.1 默认与三种确认模式

  • 默认字数:14,000 字(参见 SSOT-WORDCOUNT-RULES §2.2 元分析行)
  • 下限:参见 SSOT §3.2 元分析行;元分析含完整的 forest plot / funnel plot / 异质性诊断 / 出版偏倚多重检验 / GRADE SoF / R 代码与运行环境,结构组件最密集

三种确认模式(参见 SSOT §5):

  • 模式 A:用户已指定具体字数 → 直接采用
  • 模式 B:用户未指定 → 按 SSOT §2.2 默认 14,000 字 + 一句通知 + 不阻塞
  • 模式 C:用户选"自适应" → L8 完成后按 SSOT §3.1 矩阵 + §3.3 调整因子 + §3.4.5 元分析特殊条款估算

7.2 元分析特殊条款(参见 SSOT §3.4.5)

按 SSOT §3.3 调整因子取值:

  • 完整元分析(含 forest + funnel + Egger/Harbord + 至少 1 项心理学补充 PB):+30%
  • ≥ 3 个森林图(多 outcome / 子组对照 / sensitivity):+20%
  • Hedges' g 校正、Hunter-Schmidt、RVE / 三层 / MASEM 等:每议题 +10%
  • HKSJ + 95% PI + Bayesian 替代分析:+10%

7.3 字数纪律(PRES-006 + SSOT §4)

不硬凑 / 不铺陈 / 质量优先(详细定义参见 SSOT §4)。

启动阶段确认:在 L1(类型识别)后、L2(PICO + 效应量预设)前向用户确认字数目标。字数严重不匹配时按 §11.7 决策。


8. 何时加载底座 SSOT

何时加载(具体决策动作粒度)加载 SSOT
主 Agent 启动后立即必读(不等触发表)SSOT-AI-FAILURE-DEFENSES(4 类全部)+ SSOT-LIFECYCLE-12-PHASES + SSOT-METHODOLOGY-TERMINOLOGY
当主 Agent 在 L1 需要确认综述类型时SSOT-REVIEW-TYPES
当主 Agent 在 L2 需要选 PICO 框架时SSOT-PICO-FRAMEWORKS
当主 Agent 在 L9.1 需要做效应量类型决策(连续/二分/相关 + 标准化)+ SE 反算时SSOT-EFFECT-SIZE-DECISION §1-§5
当主 Agent 在 L9.4-L9.10 需要做综合方法(FE/RE、I²、出版偏倚)决策时SSOT-SYNTHESIS-METHODS §3-§10
当心理学场景触发(L9.2 校正 / L9.3 依赖 / L9.10 MASEM / L9.9 PB 心理学补充 / 复制危机)SSOT-PSYCHOLOGY-SUPPLEMENTS §2 8 议题
当主 Agent 在 L8 需要按设计选 RoB 工具(含 Metapsy 心理治疗扩展)时SSOT-ROB-TOOL-MAPPING
当主 Agent 在 L10 启用 GRADE 时SSOT-GRADE-FRAMEWORK
当主 Agent 在 L11 写作前需要确定报告标准(APA MARS Table 9 + PRISMA 2020 + 12 处差异)时SSOT-REPORTING-STANDARDS §1.3.1 + §3
当主 Agent 在 L11 写作 PRISMA 流程图 / PRISMA-S 时SSOT-PRISMA-FLOW-DIAGRAM + SSOT-PRISMA-S-TEMPLATE
当主 Agent 在 L7 需要确定提取字段时SSOT-EXTRACTION-FIELDS
当主 Agent 在 L12 自评时SSOT-AMSTAR-2-CHECKLIST
当中文场景触发(CNKI / GB/T 7714 / 中文心理学三大期刊)SSOT-CHINESE-CONTEXT
当主 Agent 在 L3 需要决定严格 vs 学习模式时SSOT-MODE-PROFILES
当主 Agent 在 L1 / L11 需要确定字数公式时SSOT-WORDCOUNT-RULES

底座 SSOT 路径前缀:review-methodology-foundations/references/。本 Skill 引用而不复制粘贴


9. 严格 / 学习 / 监督模式

参见 SSOT-MODE-PROFILES.md v2.0.0(元分析子集 §4.5 + 三模式定义 §1)。

  • 严格模式(顶刊投稿):12 阶段全覆盖;APA MARS Table 9 全 13 章节合规;GRADE + AMSTAR 2 自评 ≥ Moderate;预注册必须;至少 2 项出版偏倚检验;HKSJ CI;95% PI 必报。
  • 学习模式(课程作业):保留 L1-L2-L9.1/L9.4/L9.5/L9.9-L11 核心;可跳过 L9.7 / L9.10 / L12;必须显式声明简化点("Method Limitations")。
  • 监督模式(AI 初编 + 人逐点把关达发表级 —— 本项目默认目标模式):方法学完整度与严格模式相同(发表级,不降级),区别在于人不只"最后验收一次",而是在 7 个不可逆点逐一签字把关(详见 SSOT §1.4)。

学习模式不允许跳过 L9.5(异质性披露)和 L9.9(核心出版偏倚)—— 这是元分析的科学合理性骨架

学习模式简化点的诚实披露按 C4 三段体例(应用 SR L6 §6.1 范本,详见 references/L11-mars-reporting.md §"学习模式披露原文")。

9.1 监督模式(Supervised Mode)

一句话:AI 把粗活干完(检索、双盲筛选、双人提取、跑 R、出图、初稿),人只在机器判不了的 7 个关键节点拍板——方法学和严格模式一样完整,但每个不可逆的决策都有人亲自签字担责。定义见 SSOT-MODE-PROFILES.md §1.4。

什么时候选它:教授/导师要的"AI 初编、人 check、确保不出错、达发表级"——既不放心让 AI 全自动一路跑过关键判断(那是严格模式的全自动假设),又不能用课程级的随机抽查(达不到发表级)。一个研究者 + AI 协作产出可投稿的元分析、但要对每个关键判断亲自把关时,选监督模式。

它和严格模式差在哪:方法学完整度一模一样(都是发表级 Tier 1 全覆盖),唯一区别是把"最后人验收一次"换成"7 个不可逆点各审一次"。这 7 个点(元分析侧主要落在 L7 提取校准/低置信、L9 模型+异质性、L9.6/9.9 解读+发表偏差、L11 引用终审)每点产一张为它定制的审核卡,人看卡拍板"接受还是打回"。

为什么是"真门"而不是"提醒一下":每个签核点的裁决落进 decisions/ 对应文件的 user_signoff 标记。下游阶段启动前由 preflight 脚本读它——没签字 / pending / 打回 → 脚本退出码 ≠ 0,下游根本启动不了。同时红灯由 R 算(不是 AI 读 summary)、可复现性硬检查(缺 sessionInfo / 退出码 ≠ 0 / 红灯 / κ 太低 / 种子召回不足)先于人审直接阻断。7 门的运行时操作契约(每门触发时机、产物路径、preflight 命令、缺签阻断哪个下游、硬检查、审核面上限)见 review-methodology-foundations/references/SUPERVISED-MODE-GATES.md

平衡(两边都不过拟合):不处处拦人审——绿档字段免审、双盲一致项自动放行、统计无红灯则该点无人审队列、可逆中间产物不设门;也不放任 AI 跑过关键判断——7 个不可逆冻结点、双提取分歧/低置信/关键数值/红档字段必审。每个签核点待审条数设上限,超限收紧上游过滤而非把长清单甩给人。

披露:监督模式产出须披露"哪些步 AI 做、人在 7 签核点各审了什么"(RAISE:人类监督 + 透明披露 + 最终责任在人;7 签核记录即天然披露载体)。详见 SSOT §6.6。


10. 心理学场景与中文场景的特殊处理

10.1 心理学场景(默认必读 — 由 decisions/01_type_decision.md 心理学判定触发)

触发判定:按 SSOT-PSYCHOLOGY-SUPPLEMENTS.md §0.4 4 类信号清单(APA 期刊 / 量表名 / 心理学构念 / 复制危机 + JARS 关键词)扫描,任 1 类命中即触发;判定结果(yes/no/boundary)写入 decisions/01_type_decision.md 心理学判定字段(决定 L11 是否叠加 JARS-Quant + L9.x 是否启用 8 议题)。

参见 SSOT-PSYCHOLOGY-SUPPLEMENTS.md §2 心理学元分析 8 议题:

  1. RVE(依赖效应量未知结构,k ≥ 5)→ robumeta + clubSandwich
  2. Three-Level(层级明确,k ≥ 20)→ metafor rma.mv
  3. MASEM(多变量 SEM 综合,k ≥ 10)→ metaSEM
  4. Hunter-Schmidt(信度衰减校正,仅心理学量表)→ psychmeta
  5. Reliability Generalization(信度本身是综述对象)→ psychmeta + REGEMA
  6. p-curve / p-uniform*(evidential value 诊断,k_significant ≥ 5)→ puniform / dmetar::pcurve
  7. PET-PEESE(校正后效应量估计,k ≥ 10)→ metafor mods
  8. RoBMA(贝叶斯加权综合)→ RoBMA(需 JAGS,本机缺→默认不选/降级 puni_star+PET-PEESE)。依赖效应量场景(L9.3 判定三层/RVE)发表偏差用 Egger-MLMA(scripts/egger_mlma.R),非单水平检验

心理学元分析必报清单(在标准 Cochrane 元分析报告之外):

  • 95% prediction interval(异质性更大,必报;k < 5 + 心理学场景仍报但显式标注"normal 假设不稳健",详见 §11.5)
  • 依赖效应量处理(RVE / 三层)
  • Attenuation correction(如适用)
  • p-curve / p-uniform 诊断
  • PET-PEESE 敏感性
  • RoBMA 贝叶斯综合(如可用;需 JAGS,本机缺→默认不选/降级 puni_star+PET-PEESE)
  • 预注册声明 + ITT 报告

详见 references/L9-psychology-special.md

10.2 中文场景

参见 SSOT-CHINESE-CONTEXT.md

  • CNKI / 万方 / VIP 检索(覆盖中文研究):用户在 L4 应同时检索这些库
  • 中英文术语对照:"元分析" / "Meta 分析" / "森林图" / "异质性" / "随机效应模型" / "亚组分析" / "信度概化"
  • GB/T 7714-2015 引用格式(中文期刊投稿)
  • 《心理学报》《心理科学进展》:要求与 APA MARS 类似但语言中文 + GB/T 7714;Open Science 政策(预注册声明、数据共享)
  • 中文场景 L11 输出:中文报告 + 中文 forest plot 标签
  • 中文检索回退:检索主路径 = paper-search-pro(HTTP,无 MCP);OpenAlex/SS/CrossRef/PubMed 对中文覆盖有限 → 0 命中时主 Agent 引导用户人工导出 CNKI/万方题录 → ingest_search_exports.py 摄入;详见 §11.1

11. 故障诊断与回退

本章节按"诊断信号 + 阈值 + 回退路径"三件套组织。故障切换决策写入 decisions/<阶段>_failure_switch.md。

11.1 检索主路径与回退(含中文场景)

本环境检索主路径 = paper-search-pro Skill(OpenAlex / Semantic Scholar / CrossRef / PubMed 均走 HTTP API,对应 key 已配齐,无需任何 MCP server)。本机不存在 semantic-scholar / openalex MCP server(核实于 MASTER_CONTEXT §6 实测环境)——因此故障诊断信号以"paper-search-pro 检索结果异常"为准,以"SS/OpenAlex MCP 报错"为准(那类报错在本环境永不出现)。中文检索因 OpenAlex/SS/CrossRef/PubMed 覆盖中文文献有限,主路径 = 用户人工导出 CNKI/万方 → systematic-review/scripts/ingest_search_exports.py 摄入。

故障信号阈值 / 触发条件回退路径
英文检索 0 命中 / 召回过低关键词为英文,paper-search-pro 命中明显不足扩展同义词 / 放宽布尔逻辑重检;跨源交叉(OpenAlex↔CrossRef↔PubMed)补召回
中文检索经 paper-search-pro 0 命中0 命中 + 关键词为中文(a) 用户人工导出 CNKI / 万方 / VIP 题录 → ingest_search_exports.py 摄入统一字段;(b) 已有文献集时转 literature-set-reviewSubAgent 不擅自降级英文检索代替中文检索
检索整体不可用(HTTP 持续失败 / 网络受限 / key 失效)持续失败 ≥ 3 次阻断 + 警示用户 + 主 Agent 不强行降级到本地推理凭记忆编造文献;引导用户人工导出题录后走 ingest_search_exports.py
检索元数据不完整(abstract 缺失 ≥ 50%)缺失率 ≥ 0.5(a) 派 firecrawl-abstract Skill 补抽(见下注降级路径);(b) 退回扩展同义词重检

firecrawl-abstract 降级注:本环境semantic-scholar MCP server → 该 Skill 的 paper_details(Semantic Scholar API / SS 法)通道不可用;默认走 Firecrawl Scrape / Firecrawl Extract 两法(Firecrawl key 在场可用),按 DOI / URL 抓取并解析摘要。

11.2 R 包不可用回退(MA 专属)

故障信号触发条件回退路径
metafor 不可用library(metafor) 报错(a) 提示 install.packages("metafor");(b) 给 Python statsmodels 等价代码(仅基础 RE);(c) 警示替代方法的解读差异(statsmodels 不实现 HKSJ)
puniform 不可用报错dmetar::pcurve 替代;或 R 代码模板让用户安装
robumeta / clubSandwich 不可用(RVE)报错提示安装;或转单研究叙述(k 不足时)
metaSEM / psychmeta 不可用报错提示安装;或转 Hunter-Schmidt 手算模板
RoBMA / JAGS 不可用jags_ok=FALSE(Sys.which("jags")="" 或 RoBMA/rjags 缺)自动降级 puni_star + PET-PEESE(本机可跑);披露"因缺 JAGS 未执行 RoBMA",不写"已通过"
完全无 R 环境用户声明无 R(a) 转手算模板(基础 RE / FE);(b) Python statsmodels + scipy.stats 等价基础代码;(c) 阻断高级方法(RVE / 三层 / MASEM 不允许)

R 包替代方法的诚实披露(C4 三段体例,必嵌入 Limitations):

段 1:原方法假设使用 metafor(Viechtbauer 2010)+ HKSJ 小样本调整。 段 2:本元分析使用 Python statsmodels 因 R 不可用。差异:(1) HKSJ 未实现,使用标准 Wald CI(k 小时低估不确定性);(2) τ² 估计器仅 DerSimonian-Laird;(3) Cochran's Q 计算同 metafor。 段 3:通过 leave-one-out 与 PI 报告缓解差异 1;在 Discussion 披露此局限。

11.3 检索回报极端值(如 MA 接 SR L4)

场景阈值决策
identify_count > 1000010000强烈建议降级(PICO 扩窄 / 切到 FO)
identify_count > 5000050000强制降级(不允许继续作为 SR/MA)
identify_count < 55阻塞 + 切到 LS 或扩展 PICO
identify_count 在 5-20 之间区间警示 + 询问用户是否扩展 PICO 或转 LS

11.4 数据严重不足 — k=2-4 决策表(核心)

应用 W5_FIX_PLAN F.P0.5 + Cochrane v6.5 §10.10.4:

k 值决策详细处理
k = 1不元分析无法合并,单研究叙述
k = 2不元分析转 SWiM/Popay;标注"k 不足以合并";如必须给数值,仅报每研究效应 + CI
k = 3元分析允许但谨慎FE+RE 双跑 + Discussion 显式 "k 不足"局限段 + sensitivity(leave-one-out)
k = 4同 k=3 + PI 警示FE+RE 双跑 + sensitivity + 报 PI 但显式标注"normal 假设不稳健"
k ≥ 5默认 REREML + HKSJ(k > 2 + τ² > 0)+ 必报 95% PI

心理学场景特别约束:心理学场景 + k < 5 → 仍报 PI 但显式标注"normal 假设不稳健"(应用 W5_FIX_PLAN F.P1.3);非心理学 + k < 5 → 不报 PI,给 sensitivity 分析。

11.5 异质性极端 / 综合失败

场景阈值决策
I² > 75%75%不允许仅呈现合并效应;改用 subgroup / meta-regression(Cochrane v6.5 Ch.10)
I² > 90%90%完全禁止合并 + 必须 subgroup / meta-regression / SWiM(W5_FIX_PLAN F.P1.4)
k < 5 异质性高k 阈值不元分析,转 SWiM/Popay;或叙述综合
k < 10 时出版偏倚检验不可用10Egger / Harbord / Peters 在 k < 10 时低功效 → 不报检验结果;改给定性披露"由于研究数 < 10,未做 publication bias 检验"+ 在 Discussion 披露

11.6 校正失败 / 应用判断

故障决策(应用 W5_FIX_PLAN F.P1.5 Correction-Agent 决策表)
Hedges' g J 因子计算失败(degrees of freedom 不可获取)退回 Cohen's d + 标注"未做小样本校正"
Hunter-Schmidt:构念测量误差是否报告已报告 → 应用 artifact correction
Hunter-Schmidt:多研究信度/范围限制不齐全文献级抽样校正 + sensitivity(不校正版本作 baseline)
Hunter-Schmidt:语料无信度数据不校正 + 显式披露"无信度数据,不应用 H-S 校正"

11.7 字数严重不匹配(引用 SSOT-WORDCOUNT-RULES §8)

偏差决策
偏差 ≥ 30%报告用户 + 建议调整(写作完成后)
偏差 ≥ 50%强制调整或转 Skill

12. 输出格式与文件命名

12.1 标准交付物清单(你产出什么)

  • 完整定量元分析报告(按 APA MARS / JARS-Quant Table 9 + PRISMA 2020)
  • 效应量提取与计算(5 决策树 + 7 SE 反算 + Hedges' g / Hunter-Schmidt 校正)
  • 模型选择与合并(FE / RE / RVE / 三层 / MASEM)
  • 异质性披露(I²/Q/τ²/95% PI 必报;I² > 75% 不允许仅呈现合并效应)
  • 子组分析与 meta-regression(k ≥ 10 + ICEMAN 6 维 + 预设 vs 事后区分)
  • 出版偏倚检验(funnel + Egger/Harbord + 至少 1 项心理学补充:p-curve / PET-PEESE / RoBMA / selection models;k ≥ 10)
  • 可运行 R 代码(metafor / robumeta / clubSandwich / psychmeta / metaSEM / puniform / RoBMA(需 JAGS,默认不选))
  • GRADE 证据等级(含元分析专属考虑:异质性、不精确、出版偏倚降级)
  • 联动产图建议(forest / funnel / SoF 表 → 切到 ssci-plots)
  • 决策档案(decisions/ 子目录 — 跨阶段一致性保障)

12.2 决策档案目录(与本任务工作目录平级)

decisions/
  01_type_decision.md ... 11_reporting_standard.md
  09.1_effect_size.md / 09.4_model_selection.md / 09.5_heterogeneity.md / 09.6_subgroup.md / 09.9_publication_bias.md

12.3 SubAgent 产出文件命名(L<N>_<task>.<ext> — 唯一标准)

这是全库产出文件命名的唯一权威(关 BK-11)。subagent-templates / L9-r-code-templates / scripts/*.R 的读写名一律对齐本表,不得另起裸名(如 effect_sizes.csv / *_results_summary.txt 等旧裸名已废弃)。扩展名按语义:数据 .csv / 文档 .md / 图 .png(ssci-plots 渲染) 或 .pdf(metafor 直出) / R 脚本 .R / R 原始输出 .txt

# —— L9 数据 / 决策产出 ——
L9.1_effect_sizes.csv         # L9.1 效应量数据(R-ready:study_id/outcome_name/yi/vi/sei/n_total + 可选 effect_id/subgroup/year/reliability_xx/reliability_yy)
L9.1_extraction_decisions.md  # L9.1 提取决策记录(原 extraction_decisions.md)
L9.2_corrections.csv          # Hedges' g + Hunter-Schmidt 校正后值
L9.3_dependency.md            # 依赖结构判断
L9.4_model_selection.md       # FE/RE 决策 + τ² 估计器
L9.5_heterogeneity.md         # I² + Q + τ² + 95% PI
L9.6_subgroup.md              # 子组分析(k ≥ 10)
L9.7_metaregression.md        # meta-regression(k ≥ 10)
L9.8_sensitivity.md           # leave-one-out 等
L9.9_publication_bias.md      # funnel + Egger + 心理学补充
L9.10_masem.md                # 按需(MASEM 结论)
L9_psychology_special.md      # (S5) 心理学专题 SubAgent 产出(替原裸名 psychology_special.md)
L10_grade.md                  # GRADE 评估
L11_draft_A.md / L11_draft_B.md / L11_merged_1.md / L11_merged_2.md / L11_final.md  # 2-2-1
L11_mars_compliance.md        # MARS-Compliance-Agent 产出(原 mars_compliance.md)
L11_claims_vs_data.md / L11_ref_verify_report.md  # 监督模式 SP6/SP7 产物(S6 接线)
L12_amstar2.md                # 自评
# —— R 脚本 / 原始输出(统一 L9_/L9.x_ 前缀,替代旧 *_results_summary.txt 散名)——
L9_meta_analysis_main.R       # 完整工作流主 R 脚本(原 meta_analysis_main.R)
L9_meta_results.txt           # metafor 基础 R 原始输出(原 meta_results_summary.txt)
L9.3_rve_results.txt          # RVE R 原始输出(原 rve_results_summary.txt)
L9.2_psychmeta_results.txt    # Hunter-Schmidt R 原始输出(原 psychmeta_results_summary.txt)
L9.9_pcurve_results.txt       # p-curve/p-uniform R 原始输出(原 pcurve_results_summary.txt)
L9.9_egger_mlma_results.txt   # (S5) Egger-MLMA(依赖效应量多水平/RVE 发表偏差)R 原始输出
L9.10_masem_results.txt       # MASEM R 原始输出(原 metaSEM_results_summary.txt)
# —— Chart-Bridge 数据 + 图(见 §13.2 + L9-r-code-templates §10)——
L9_forest_data.csv            # Chart-Bridge 森林图 per-study 数据(列 study/es/ci_lo/ci_hi/weight;R 导出 → 主 Agent 喂 ssci-plots)
L9_forest_pooled.csv          # 森林图 pooled diamond + 异质性侧车(es_overall/ci_lb/ci_ub/I2/Q/tau2)
L9_funnel_data.csv            # Chart-Bridge 漏斗图 per-study 数据(列 study/es/sei)
L9_funnel_pooled.csv          # 漏斗图 pooled 标量 + Egger 侧车(pooled/egger_intercept/egger_p/k)
L11_forest_plot.pdf / L11_funnel_plot.pdf  # metafor 直出(草图/敏感性速览)
L11_forest_plot.png / L11_funnel_plot.png  # ssci-plots 渲染(发表级,§13.2 联动产出)

图扩展名裁定(锁4 §4.2.4):保留两条产图路径各自原生扩展名、前缀统一 L11_——.pdf = metafor 直接 pdf() 出的草图(快速自检);.png = ssci-plots 通过 Chart-Bridge 渲染的发表级图(APA 7 + CVD-safe)。两者并存不冲突。


13. 与其他 Skill 的关系

13.1 联合工作流:systematic-review + meta-analysis

推荐路径

用户场景:定量合并 23 项 RCT
  ↓
Step 1:先调用 systematic-review 完成 L1-L8
  - L1 类型识别(含心理学判定)→ decisions/01_type_decision.md(MA 沿用)
  - L2-L8 全部
  ↓
Step 2:切换到 meta-analysis 完成 L9-L12
  - L9.1-L9.10 定量合并
  - L10 GRADE
  - L11 APA MARS(含 forest plot 联动 ssci-plots)
  - L12 AMSTAR 2 自评

主 Agent 在用户表达"我已完成检索/筛选/RoB,需要做定量合并"时,可直接进入本 Skill(独立 MA 入口,按 §3.3 脚手架先建 01/02/07/08);表达"完整系统综述含定量合并"时建议联合工作流。

联合路径 decisions/ 共用 + 09↔09.1 衔接门(关 BK-7,N-1..N-4)

  • N-1 同一 decisions/ 目录:联合路径 SR 与 MA 共用同一 decisions/(与工作目录平级)。MA 不新建独立目录,直读 SR 已产的 01..08 + 09_synthesis_decision.md
  • N-2 09_synthesis_decision.md 共用、MA 只读不覆盖:SR 在 L9 产它(含"切 MA"结论 + 推荐模型族);MA 接力只读不重写,当"是否进 MA + 模型族"输入。
  • N-3 MA 从 09.1 续编:MA 在同目录新建 09.1/09.4/09.5/09.6/09.9 子阶段档,与 09 并存(小数层级天然区分,不存在覆盖)。
  • N-4 触发器升为阻断门(写死):主 Agent 进入 MA L9.1 前,必读 decisions/09_synthesis_decision.md:若其切换结论 ≠ "推荐切 MA" → 阻断(不应进 MA,回 SR L9 SWiM/Popay);若 = 推荐切 MA → 读取其推荐模型族(FE/RE/RVE/三层/MASEM)作为 L9.3/L9.4 的输入约束。这把 BK-7 从"易漏的手工搭桥"升级为"阻断门保护的写死接力"。

联合路径 L10-L12 归属(锁4 §4.4 裁定):以元分析为终点的联合路径,meta-analysis 拥有 L9-L12——由 MA 产 10_grade_decision.md + 11_reporting_standard.md + L12_amstar2.md(依据 MA §12.1 交付物清单 + 本 §13.1 联合工作流)。纯 SR 路径(无 MA)的 L10-L12 仍由 SR 完成。

SR L7 → MA L9.1 字段映射:详见 systematic-review references/L7-extraction-dual.md §11(映射表本体,对接本 Skill L9.1-effect-size-extraction.md §8.2 输入契约——study-level 原始统计量;L9.1 负责把原始量经 escalc 算成 ES/SE/yi/vi/sei)。

13.2 联动 ssci-plots:forest / funnel plot 渲染(Chart-Bridge 转换契约)

本 Skill 不直接渲染图,链路是"R 导出 CSV → 主 Agent 协调转 Python 列表 → ssci-plots 渲染"(ssci-plots 是 Python/matplotlib,吃列表,不吃 metafor 对象)。完整转换契约(输入列 / 输出对象 / 失败阻断门)见 references/L9-r-code-templates.md §10 Chart Bridge。要点:

  1. R 导出references/L9-r-code-templates.md §10 的 Chart-Bridge 段,在 metafor_basic.Rres_re 之后跑):L9_forest_data.csv(列 study, es, ci_lo, ci_hi, weight + pooled 合并行)+ L9_funnel_data.csv(列 study, es, sei + pooled 标量)。
  2. 主 Agent 协调(不靠 SubAgent 自拉 ssci-plots):主 Agent 读 CSV → 构 Python studies = [(name, es, ci_lo, ci_hi, weight), ...] + pooled diamond + 异质性(I²/Q/τ²) Note → 调 ssci-plots forest/funnel 模式(apply_style → loop → save_figure)→ 出 L11_forest_plot.png / L11_funnel_plot.png + APA 7 caption。
  3. 失败阻断门L9_forest_data.csv / L9_funnel_data.csv 缺失或 0 行 → 阻断(不编图数据、不空跑)。这是结构性人在环门(BK-12)。

13.3 Skill 边界速查

用户需求切到
已收集文献,要写综述但不做合并literature-set-review
50 年/30 年的领域发展史field-evolution-review
整合综述(量化 + 质性 + 理论)field-overview-review
严格 PRISMA 系统综述(不含定量合并)systematic-review
渲染 forest/funnel plotssci-plots(联动)
验证引用准确性academic-ref-check(联动)
找文献paper-search-pro(前置)

14. SubAgent 任务模板

详见 references/subagent-templates.md。所有模板按 L9 子阶段重组,每个 SubAgent 含 6 段标准结构(角色 / 必读 / 任务步骤 / 输出契约 / 自检清单 / 失败回退)+ 占位符决策框架。

主要角色:Effect-Size-Extractor (L9.1) · Correction-Agent (L9.2) · Dependency-Agent (L9.3) · Model-Selection-Agent (L9.4) · Heterogeneity-Agent (L9.5) · Subgroup-Agent (L9.6) · Metaregression-Agent (L9.7) · Sensitivity-Agent (L9.8) · PublicationBias-Agent (L9.9) · MASEM-Agent (L9.10) · GRADE-Agent (L10) · Write-Agent A/B + Evaluate-Agent 1/2 + Final-Agent (L11, 2-2-1) · Review-Citation/Logic/Expression/Format (L11) · MARS-Compliance-Agent (L11) · Self-Assessment Agent (L12, AMSTAR 2)。

主 Agent 编排建议:L9.1 → L9.2/L9.3/L9.4 串行;L9.5 异质性先行 → L9.6/L9.7 可并行L9.8 敏感性串行于 L9.5 之后(依赖 L9.5 模型基线,不与 L9.5 并行;可与 L9.9 并行);L9.9 单独(依赖 09.4/09.5);L9.10 按需。

双人提取 LLM 编排(应用 SR L6 §6.1 范本 — C4 三段体例):派 2 个独立 Effect-Size-Extractor SubAgent(A/B prompt 隔离)+ Cohen's κ 字段级 + 仲裁 SubAgent。详见 references/L9.1-effect-size-extraction.md §双人提取章。


15. 参考文档清单

15.1 references/ 文件

  • decision-provenance.md:跨阶段决策档案机制说明
  • L9.1-effect-size-extraction.md:5 决策树 + 7 SE 反算 + 8 unit-of-analysis + 零事件 + Hedges' g + Hunter-Schmidt + 双人提取 LLM 编排
  • L9.4-fixed-random-models.md:FE/RE 选择决策树 + τ² 估计器 + HKSJ CI + k=2-4 决策
  • L9.5-heterogeneity.md:I²/Q/τ²/95% PI 阈值与披露(含 I² > 90% 极端)
  • L9.6-subgroup-metaregression.md:k ≥ 10 + ICEMAN 6 维度
  • L9.9-publication-bias.md:funnel / Egger / Harbord / PET-PEESE / p-curve / RoBMA / Selection models(含 k < 10 不可用披露)
  • L9-r-code-templates.md:按议题分组的 R 代码模板(含 Chart Bridge 调用 + LLM 生成 R 代码诚实披露)
  • L9-psychology-special.md:RVE / 三层 / MASEM / Hunter-Schmidt / RG / 8 议题决策路径 + Correction-Agent 决策表
  • L11-mars-reporting.md:APA MARS Table 9 完整 13 章节 + JARS-Quant 12 处差异 + 学习模式简化点披露
  • subagent-templates.md:按 L9 子阶段重组的 SubAgent 模板(统一"输出契约"命名)
  • quality-control.md:与四铁律 + AI 失败防御 4 类(§1 §2 §3 §4 全部)对接

15.2 scripts/ R 代码模板(5 个)

  • metafor_basic.R:基础元分析(FE/RE + heterogeneity + subgroup + meta-regression + funnel + Egger + PET-PEESE)
  • rve_clubSandwich.R:RVE 依赖效应量元分析
  • psychmeta_hunter_schmidt.R:Hunter-Schmidt 心理测量元分析
  • metaSEM_masem.R:MASEM(TSSEM + One-Stage)
  • puniform_pcurve.R:p-curve + p-uniform*

15.3 底座 SSOT 引用清单

参见 §8。所有 SSOT 位于 review-methodology-foundations/references/,由该底座 Skill 维护。本 Skill 引用而不复制粘贴。


16. 变更记录

  • 2026-06-10(v2.0.1):修复轮 F1–F17(依据 = 2026-06-10 实测审计)。R 代码层:Q_between 假阳性修正(含截距混合效应模型)、puniform/puni_star 形参与方法错位、三水平 LRT 嵌套模型、PET-PEESE 条件逻辑反保守修正、RoBMA API 核实、metafor_basic.R 头部声明对齐 + 新增 Peters/PET-PEESE 块、新建 tests/ 回归测试套件。文档层:PET-PEESE 文本统一为 Stanley & Doucouliagos (2014) 金标准、RVE 阈值三处统一(k≥5 + 强制 CR2;k<10 披露)、硬编码模型名参数化(规范性语句改为"当前可用的最强模型",披露模板改占位符)、SSOT 引用归属修正(Chen, Cohen & Chen 2010 / Bonett 2002 / Hagger et al. 2016 RRR)、trim-and-fill 移出必做清单、新建 SSOT-INDEX.md 修复断链。
  • 2026-06-19(S2 WP-A):§5 / §17 桥接哲学披露段(含 intro line 17 + 诚实披露三段体例 + L9-r-code-templates.md 顶部披露原文)改为 Claude Code 本地 Rscript 真跑——原始输出(summary/warnings/sessionInfo)入审计包、红灯由 audit_parse.R 算、人在签核点担责;不再"AI 生成代码 + 用户外部跑后回填"。保留"LLM 生成代码可能有编译通过但结果错误的细微 bug"这条真局限(未洗白)。未触碰 §5 R 包路径映射表。
  • 2026-06-20(S4 WP-C 编排修补):关 BK-1/BK-2/BK-11/BK-12。①BK-1 MA 入口脚手架:§3.2 入口 preflight + §3.3 独立 MA 入口决策档案脚手架(缺 01/02/07/08 阻断 L9.1)+ §4.2 L9.1 派发前 preflight;配套 review-methodology-foundations/decisions_templates/ 全集空白模板。②BK-12 L9.8 串行:§3.2/§4.2/§14 把 L9.8 敏感性从"与 L9.5 并行"改为"串行于 L9.5 之后"(依赖 L9.5 模型基线)。③BK-11 命名统一:§12.3 补全为全产物唯一标准命名表(含 R 原始输出 / Chart 数据 / 图扩展名裁定),全库对齐。④BK-7 衔接门 + 锁4 L10-L12 裁定:§13.1 加 N-1..N-4 共用 decisions/ + 09↔09.1 阻断门 + L10-L12 归 MA。⑤BK-12 Chart-Bridge:§13.2 改为"R 导出 CSV → 主 Agent 协调转 Python 列表 → ssci-plots 渲染 + 无图数据阻断门"(ssci-plots 吃列表非 metafor 对象)。未触碰 §5 桥接段(S2)/ R 包表 RoBMA 行(S5)。
  • 2026-06-20(S5):关 BK-8 / BK-10。①BK-8 Egger-MLMA:依赖效应量(L9.3 判定三层/RVE)发表偏差改用多水平/RVE Egger(scripts/egger_mlma.R),非单水平 Egger/Harbord/Peters;§5 R 包表新增 Egger-MLMA 行、§4.2 L9.9 + §10.1 议题8 加路由提示、§12.3 登记 L9.9_egger_mlma_results.txt(R 原始输出)+ L9_psychology_special.md(替原裸名 psychology_special.md)。②BK-10 RoBMA 降级:RoBMA 需 JAGS 系统库(本机缺,jags_ok=FALSE)→ 默认不选,缺 JAGS 自动降级 puni_star + PET-PEESE(本机可跑),全链不停;§5/§10.1/§11.2/§12.1 标注。诚实降级:RoBMA 因缺 JAGS 未本机执行=未验证,未写"已跑/已通过"。
  • 2026-06-23(S6B WP-E② 监督模式):关 BK-9。§9 标题改"严格 vs 学习"→"严格 / 学习 / 监督",新增 §9.1 监督模式(= 严格方法学完整度 + 人在 7 不可逆点 SP1-SP7 结构性强制门决策审核;何时选=教授诉求"AI 初编+人 check 达发表级";真门=preflight 缺签 exit≠0 + 红灯由 R 算 + 硬检查先于软评;平衡=两边都不过拟合 + 审核面上限;披露=RAISE 人类监督+透明+最终责任);指向操作契约 review-methodology-foundations/references/SUPERVISED-MODE-GATES.md + SSOT-MODE-PROFILES v2.0.0。用户面文字按 scripts/CARD_NARRATIVE_VOICE.md 精神去黑话。仅改 §9(OWNER_MAP §2.1 段落 owner),未触碰 §5 桥接段/R 包表/其余章节。
  • 2026-06-23(S7 WP-F Lane A 检索回退一致化):关 doc 12c P2-3/P2-4。§11.1 检索回退表去除本环境不存在的 SS MCP 假信号(batch_search 报错 / phantom limit / fields 类型 / "SS MCP 不返回 CNKI"),主路径改为 paper-search-pro(HTTP,OpenAlex/SS/CrossRef/PubMed key 已配)/ 中文人工导出 CNKI 万方 → ingest_search_exports.py 摄入;保留真实回退(中文 0 命中→人工导出+摄入/转 literature-set-review、整体不可用→阻断警示不凭记忆编造、元数据补抽)与关键约束"不擅自降级英文检索代替中文检索";§10.2 中文检索回退 cross-ref 同步去 SS MCP 框架。新增 firecrawl-abstract SS 法降级注:本环境无 SS MCP → paper_details(SS 法) 不可用,默认走 Firecrawl Scrape/Extract 两法。仅改 §10.2/§11.1(OWNER_MAP §2.1 S7 段落 owner),未触碰 §11.2(S5 RoBMA 降级)/其余章节。

SKILL.md 结束。详细方法论见 references/ + scripts/ + 底座 SSOT。

相關技能