目标

本流程用于 paper archive root 目录内的论文分析与长期存档。每次用户给出 arXiv、PDF、论文项目页或论文标题时,按同一流程产出可追溯的 Markdown 笔记,并维护作者关系和跨论文关系。

输入

常见输入包括:

  • arXiv abstract URL,例如 https://arxiv.org/abs/2606.04075
  • PDF URL。
  • 项目仓库或论文官网。
  • 论文标题或作者名。

若用户没有明确要求联网,但材料来自外部 URL、arXiv 或需要最新版本,必须访问来源确认版本、作者和日期。

输出文件

每篇论文对应一个独立 Markdown 文件:

<arxiv-id>-<short-title-slug>.md

示例:

2606.04075-llms-hack-rewards-and-society.md

每次新增或更新论文后,同步更新:

papers-index.md

阅读顺序

  1. 打开 arXiv abstract 页面,记录标题、作者、提交日期、版本、主题分类、项目链接。
  2. 下载 PDF 和 arXiv source。优先读 TeX source;PDF 用于核对页数、图表和排版信息。
  3. 抽取章节结构、摘要、图表标题、定理、表格、实验设置和结论。
  4. 先读 introduction 和 conclusion,确认论文真实目标。
  5. 再读 method / system / theory / experiment,梳理证据链。
  6. 最后读 limitation、ethics、appendix 和 project README,补齐边界条件。

分析维度

每篇论文至少回答这些问题:

  • 论文要解决什么问题。
  • 作者的核心假设是什么。
  • 方法或系统设计如何工作。
  • 关键实验、定理或案例支撑什么结论。
  • 哪些结论证据强,哪些需要谨慎。
  • 对 LLM 安全、系统、理论、评测或产品有什么可复用启发。
  • 论文的外部有效性、实验范围和实现限制是什么。

交流沉淀

完成初版阅读和分析后,若用户继续围绕该论文追问、质疑、要求类比、纠偏、总结或生成社交媒体表达,需要把有长期价值的讨论回写到对应论文笔记。

沉淀内容包括:

  • 对论文主张的更精确表述。
  • 用户指出的概念修正、边界条件和反例。
  • 公式化重述、因果链、直觉解释和工程判断。
  • 对论文结论强弱的再校准。
  • 与已有论文、技术博客、框架或系统实现的新关系。
  • 可复用的诊断指标、评测 checklist 或实践建议。

写入位置:

  • 默认写入对应笔记的 本地讨论补充 章节。
  • 若讨论修正了 一句话结论局限主要启发跨论文关系,同步更新对应章节。
  • 若讨论产生新的作者关系、主题延展、方法复用或跨材料关系,同步更新 papers-index.md

写法要求:

  • 标明这是本地讨论后的分析收敛,避免写成论文作者原始主张。
  • 保留用户提出的关键判断,但用可复查的技术语言表达。
  • 对未验证推论写清楚适用条件和待复验指标。

作者关系分析

每篇论文必须有 作者与关系 章节。

记录内容:

  • 每位作者及机构。
  • 同机构作者群。
  • 跨机构桥接作者。
  • equal contribution、corresponding author、实验室或项目组织线索。
  • 与当前 papers-index.md 中已有作者是否重叠。
  • 与已有论文是否存在同主题、同方法、同系统、同数据集、同机构或引用关系。

判断要求:

  • 来源明确的事实直接写事实。
  • 由机构、署名顺序或邮箱推断的关系,用“关系判断”表述。
  • 没有证据时写“未发现作者重叠”或“需要后续来源确认”。

笔记结构

新增论文笔记使用 paper-note-template.md。若论文是纯理论、系统、方法论或安全评测,可调整章节名,但必须保留以下核心章节:

  • Source
  • 作者与关系
  • 一句话结论
  • 论文脉络
  • 关键实验/定理
  • 主要启发
  • 局限
  • Reference Intake Brief

若阅读后的交流产生了有效补充,必须加入或更新:

  • 本地讨论补充

Markdown 公式写法

站点在构建期使用 KaTeX 渲染 Markdown 里的 LaTeX 公式。推荐写法:

  • 行内公式:$a_t = b_t + c_t$
  • 块级公式:
$$
L_t = \sum_i g_i g_i^\top
$$

兼容写法:

  • 行内公式:\(...\)
  • 块级公式:\[...\]
  • 块级环境:\begin{equation}...\end{equation}

写作要求:

  • 普通美元金额和 shell 变量尽量放进反引号代码中,例如 `$HOME`
  • 长公式优先使用块级公式,减少表格和移动端横向撑开。
  • 公式只用于保留必要符号、更新规则和定理表达;正文解释仍需用自然语言说明变量含义。

索引更新

更新 papers-index.md 时必须同步处理:

  1. 当前收录 表格新增或更新该论文。
  2. 作者关系图谱 新增 cluster 或更新已有 cluster。
  3. 跨论文关系 写入与已有论文的主题、作者、机构、引用或方法关系。
  4. 若论文属于新主题,建立新的 cluster。
  5. 若论文延续已有主题,写清楚它补充了什么视角。

安全与双用途处理

涉及安全、漏洞、攻击、绕过、滥用、社会制度套利、模型越狱或 agent 工具滥用时:

  • 保留问题定义、机制、评测结果、防御启发和治理建议。
  • 避免沉淀逐步可执行攻击流程。
  • 对真实世界机构、法律或合规议题,标明论文实验是否为模拟环境。
  • 对高风险推论,区分作者主张和本地分析。

质量检查

提交最终回答前检查:

  • 文件是否落盘。
  • papers-index.md 是否更新。
  • 每篇论文是否包含作者关系。
  • 是否保留来源 URL 和版本日期。
  • 是否区分来源事实、作者主张和本地推论。
  • 是否把阅读后的有效交流提炼进对应笔记。
  • 是否存在先否定前项、再强调后项的对照式中文表达。
  • 是否避免长段复制论文原文。

最终回复

最终回复只报告:

  • 新增或更新了哪些文件。
  • 核心变更点。
  • 是否完成验证。
  • 若有无法完成的事项,说明原因。