SOP
Paper Analysis Workflow
本目录用于论文阅读、分析、作者关系跟踪和 Markdown 存档的工作流。
目标
本流程用于 paper archive root 目录内的论文分析与长期存档。每次用户给出 arXiv、PDF、论文项目页或论文标题时,按同一流程产出可追溯的 Markdown 笔记,并维护作者关系和跨论文关系。
输入
常见输入包括:
- arXiv abstract URL,例如
https://arxiv.org/abs/2606.04075。 - PDF URL。
- 项目仓库或论文官网。
- 论文标题或作者名。
若用户没有明确要求联网,但材料来自外部 URL、arXiv 或需要最新版本,必须访问来源确认版本、作者和日期。
输出文件
每篇论文对应一个独立 Markdown 文件:
<arxiv-id>-<short-title-slug>.md
示例:
2606.04075-llms-hack-rewards-and-society.md
每次新增或更新论文后,同步更新:
papers-index.md
阅读顺序
- 打开 arXiv abstract 页面,记录标题、作者、提交日期、版本、主题分类、项目链接。
- 下载 PDF 和 arXiv source。优先读 TeX source;PDF 用于核对页数、图表和排版信息。
- 抽取章节结构、摘要、图表标题、定理、表格、实验设置和结论。
- 先读 introduction 和 conclusion,确认论文真实目标。
- 再读 method / system / theory / experiment,梳理证据链。
- 最后读 limitation、ethics、appendix 和 project README,补齐边界条件。
分析维度
每篇论文至少回答这些问题:
- 论文要解决什么问题。
- 作者的核心假设是什么。
- 方法或系统设计如何工作。
- 关键实验、定理或案例支撑什么结论。
- 哪些结论证据强,哪些需要谨慎。
- 对 LLM 安全、系统、理论、评测或产品有什么可复用启发。
- 论文的外部有效性、实验范围和实现限制是什么。
交流沉淀
完成初版阅读和分析后,若用户继续围绕该论文追问、质疑、要求类比、纠偏、总结或生成社交媒体表达,需要把有长期价值的讨论回写到对应论文笔记。
沉淀内容包括:
- 对论文主张的更精确表述。
- 用户指出的概念修正、边界条件和反例。
- 公式化重述、因果链、直觉解释和工程判断。
- 对论文结论强弱的再校准。
- 与已有论文、技术博客、框架或系统实现的新关系。
- 可复用的诊断指标、评测 checklist 或实践建议。
写入位置:
- 默认写入对应笔记的
本地讨论补充章节。 - 若讨论修正了
一句话结论、局限、主要启发或跨论文关系,同步更新对应章节。 - 若讨论产生新的作者关系、主题延展、方法复用或跨材料关系,同步更新
papers-index.md。
写法要求:
- 标明这是本地讨论后的分析收敛,避免写成论文作者原始主张。
- 保留用户提出的关键判断,但用可复查的技术语言表达。
- 对未验证推论写清楚适用条件和待复验指标。
作者关系分析
每篇论文必须有 作者与关系 章节。
记录内容:
- 每位作者及机构。
- 同机构作者群。
- 跨机构桥接作者。
- equal contribution、corresponding author、实验室或项目组织线索。
- 与当前
papers-index.md中已有作者是否重叠。 - 与已有论文是否存在同主题、同方法、同系统、同数据集、同机构或引用关系。
判断要求:
- 来源明确的事实直接写事实。
- 由机构、署名顺序或邮箱推断的关系,用“关系判断”表述。
- 没有证据时写“未发现作者重叠”或“需要后续来源确认”。
笔记结构
新增论文笔记使用 paper-note-template.md。若论文是纯理论、系统、方法论或安全评测,可调整章节名,但必须保留以下核心章节:
Source作者与关系一句话结论论文脉络关键实验/定理主要启发局限Reference Intake Brief
若阅读后的交流产生了有效补充,必须加入或更新:
本地讨论补充
Markdown 公式写法
站点在构建期使用 KaTeX 渲染 Markdown 里的 LaTeX 公式。推荐写法:
- 行内公式:
$a_t = b_t + c_t$ - 块级公式:
$$
L_t = \sum_i g_i g_i^\top
$$
兼容写法:
- 行内公式:
\(...\) - 块级公式:
\[...\] - 块级环境:
\begin{equation}...\end{equation}
写作要求:
- 普通美元金额和 shell 变量尽量放进反引号代码中,例如
`$HOME`。 - 长公式优先使用块级公式,减少表格和移动端横向撑开。
- 公式只用于保留必要符号、更新规则和定理表达;正文解释仍需用自然语言说明变量含义。
索引更新
更新 papers-index.md 时必须同步处理:
当前收录表格新增或更新该论文。作者关系图谱新增 cluster 或更新已有 cluster。跨论文关系写入与已有论文的主题、作者、机构、引用或方法关系。- 若论文属于新主题,建立新的 cluster。
- 若论文延续已有主题,写清楚它补充了什么视角。
安全与双用途处理
涉及安全、漏洞、攻击、绕过、滥用、社会制度套利、模型越狱或 agent 工具滥用时:
- 保留问题定义、机制、评测结果、防御启发和治理建议。
- 避免沉淀逐步可执行攻击流程。
- 对真实世界机构、法律或合规议题,标明论文实验是否为模拟环境。
- 对高风险推论,区分作者主张和本地分析。
质量检查
提交最终回答前检查:
- 文件是否落盘。
papers-index.md是否更新。- 每篇论文是否包含作者关系。
- 是否保留来源 URL 和版本日期。
- 是否区分来源事实、作者主张和本地推论。
- 是否把阅读后的有效交流提炼进对应笔记。
- 是否存在先否定前项、再强调后项的对照式中文表达。
- 是否避免长段复制论文原文。
最终回复
最终回复只报告:
- 新增或更新了哪些文件。
- 核心变更点。
- 是否完成验证。
- 若有无法完成的事项,说明原因。