CommunityVidéo et animationgithub.com

AnsirStudio/self-distiller

Distill scattered material into a structured, reusable markdown identity layer + a compact profile card for any agent. Inspired by Karpathy's LLM Wiki & the honcho project.

Compatible avecClaude Code~Codex CLI~Cursor
npx add-skill AnsirStudio/self-distiller

name: self-distiller description: 从一个人的素材(与 AI 的对话、笔记、视频、文章、工作记录、设计收藏等)里蒸馏出一份结构化、可复用的个人「身份层」——稳定身份、性格、偏好、当前关注,以及一张能粘进任意 agent 当自我介绍的压缩名片。这是一个只负责「写入/蒸馏」的操作手册(不负责查询问答)。当用户说:蒸馏我自己/我的画像、把这批素材里关于我的提炼出来、更新我的 profile/偏好、做一个能塞进别的 agent 的自我介绍时使用。独立可用,不依赖任何特定项目文件。

self-distiller —— 个人身份蒸馏操作手册

把零散素材里"关于这个人本身"的信息,蒸馏成一套结构化、可复用、可溯源的 markdown 身份层。

它只做一件事:蒸馏(写入)。 输入 = raw/ 里的素材;输出 = 写进 self/ 五件套。它不负责查询/问答——"调用这份画像去回答问题"是另一回事(由别的 skill 或项目的 CLAUDE.md 规范),不在本手册内。 它不会自己定时运行。 整理/合并是一个被调用时执行的操作(见 §3)。要不要定期跑,由排程或项目策略决定,不是本 skill 的职责。 语言: 用使用者偏好的语言书写。隐私: 身份信息敏感,所在仓库应私有。 独立性: 只管"关于使用者本人"的事实;不知道也不依赖其它 skill。

0. 首次运行:预检 + 搭目录(幂等)

缺什么补什么,已存在跳过。从 templates/ 拷模板:

<项目根>/
├── self/                 # 身份层(本 skill 写入)
│   ├── observations.md   # 真相之源:只追加的原子事实流
│   ├── identity.md       # 稳定身份与性格
│   ├── preferences.md    # 偏好(每条标适用域)
│   ├── now.md            # 当前关注(会被新值取代)
│   └── profile.md        # 压缩名片(≈150 token,出口)
└── raw/                  # 素材来源(读取用,完整树,缺则建)
    ├── inbox/            # 新素材先落这;蒸馏后清空
    ├── chats/ articles/ research/ videos/ papers/ work/ ideas/ design/   # research/=搜索/深度调研报告
    └── attachment/       # 图片/媒体(被 md 引用)

自我事实可来自任何来源(一段对话、一条视频、一份旧方案、一批设计收藏),不止 chats。

1. 工作流:DISTILL(蒸馏)

每次蒸馏按此顺序:

  1. raw/(尤其 inbox/),逐个来源处理。
  2. 判断相关性:这条素材有没有"关于这个人本身"的信息?没有就跳过(那是纯客观知识,不归本 skill)。
  3. 抽取原子事实(核心,见 §2):从内容里析出关于此人的显式事实 + 可推断的性格/偏好。
  4. 写入 observations.md:每条原子事实只追加,带来源 + 日期 + explicit/inferred 标记。绝不改写旧条目。
  5. 人审门控(见 §4):把"建议进 identity/preferences/now 的条目"列给本人确认,通过后才固化。
  6. 路由(见 §3):确认后的事实归并进对应页(identity / preferences / now)。
  7. 更新 profile.md:重生成压缩名片(≈150 token)。
  8. 记一笔:在 observations.md 顶部或项目 log.md 写明本次新增/更新了什么。
  9. inbox/ 清空 = 本批已蒸馏(注意:已蒸馏 ≠ 已核实,verified 由本人盖章)。

整理(合并)是同一工作流的"批量版":被调用"整理一下我的画像"时,跳过 1–2,直接对 observations.md 全量做 §3 的归并、去重、用新值取代旧值(now)、过期项标注不删。

2. 怎么蒸馏:从素材分析一个人(核心)

这是本 skill 的灵魂。读一段内容时,按下面的方法把"这个人是谁"析出来。

2.1 两类事实

  • explicit(显式):本人直接说的。例:"我是服装设计专业" → [explicit] 学服装设计
  • inferred(推断):从言行模式推出的性格/价值观/审美,必须写出依据 + confidence。例:多次主动收集低饱和配色 → [inferred, conf=medium] 审美偏好低饱和/莫兰迪,依据:反复收藏此类配色

2.2 抽取写作规范

  • 原子且自包含:一条只说一件事,单独读也懂("此人对这次面试紧张",不是"很紧张")。
  • 绝对日期(2026年6月16日,不是"昨天")。
  • 正确归属:是本人的就标本人;引用别人的别记成他自己的。
  • 带来源:来源:[[raw/chats/...]]
  • 按出处去重:写入前 grep 来源,同一来源同一事实只记一次。

2.3 分析维度(从素材里找这些信号)

读内容时,主动在这几个维度上找线索(详表见 reference.md):

  • 身份背景:职业、教育、经历、所在地。
  • 价值观/原则:他在乎什么、反感什么、做选择的依据。
  • 性格特质:如何反应、表达风格、情绪模式(例:思维发散、追求掌控、谨慎/果断)。
  • 思维方式:怎么推理、怎么做决定、容易卡在哪。
  • 偏好(标适用域):沟通 / 工作 / 学习 / 设计审美。
  • 当前关注:在忙什么、近期目标(→ now,易变)。
  • 审美倾向:反复被什么吸引(配色/版式/风格)。

2.4 护栏

  • 别过度推断:证据薄的性格判断标 conf=low 或先不写,宁缺勿编。
  • 绝不编造:没有就留 ___,不脑补。
  • 敏感内容走 §4 人审,不静默写入。

3. 路由:哪条事实进哪页

  • observations.md —— 全部原子事实都先进这里(真相之源,只追加)。
  • identity.md —— 稳定的身份与性格(evergreen)。
  • preferences.md —— 偏好,每条标适用域(通用/代码/写作/设计审美/沟通/学习)。
  • now.md —— 当前关注(volatile,新值取代旧值,旧的移"曾经在忙",不删)。
  • profile.md —— 从上面三页蒸馏出的压缩名片,只挑稳定且对回答有用的,≈150 token。

4. 人审门控(比知识库更严)

身份信息敏感、最容易写歪:抽出的事实(尤其 inferred 性格判断)先列给本人确认再固化进四页;一切页 verified: false,只有本人能改 true。

5. 跨 agent 使用(不属于蒸馏,仅说明出口)

profile.md 是出口:复制进任意 agent 的自定义指令即可。控量原则:永远只带 profile(L0);按场景再加相关偏好(L1);完整 observations 只在需要时检索,不整体注入(L2)。真正的"问答式调用这份画像"是另一个 skill 的事,不在本手册。


  • 详细分析维度、事实分类、frontmatter 规范 → 见 reference.md
  • 五件套空白模板 → 见 templates/
  • 一个完整蒸馏范例(对话 → 抽取 → 归档)→ 见 examples/

Skills associés