阅读方法

以硬件为主线的 AI 史

“在既有硬件、内存、互连、数据管线和推理部署条件下, 哪些 AI 方法得以落地、成为主流,又有哪些被淘汰?”

本项目通过硬件视角重读 AI 历史。 从 1986 年到 2026 年, 132 篇研究论文归入 10 个计算范式——每个范式都由设备约束、内存上限和互连条件共同界定, 并决定哪些方法可行、哪些方法难以成立。

文献库由 120 篇公认经典论文12 篇 2025/2026 年暂定补充的前沿论文组成。 这些前沿论文按其计算结构意义和方法贡献筛选,暂不以长期引用或 Test of Time 奖项作为主要依据。

英文文档为准。中文翻译位于 history/zh/ 目录下,由 GLM 辅助生成并经交叉核验,需链接回英文源文件。


引用统计使用原则

OpenAlex 引用统计在论文队列中作为优先级信号使用, 不是历史证据。它们有助于在构建阅读列表时发现高影响力论文。

引用统计并非衡量技术质量、历史重要性或计算结构意义的直接指标。 许多对计算主线至关重要的论文引用数并不突出,因为后续综述论文替代了对它们的引用。

每次 OpenAlex 查询都记录查询日期,因为引用统计和合并后的 OpenAlex work ID 可能随时间变化。

Test of Time 奖项仅在官方来源已查验并记录后方可使用。

来源规范

  • 优先使用原始论文、模型/系统报告、基准论文和权威领域报告。
  • OpenAlex 引用统计仅作为优先级信号,不单独作为历史证据。
  • 记录 OpenAlex 查询日期,因为引用统计和合并后的文献版本可能变化。
  • Test of Time 奖项仅在已查验并记录官方来源后方可使用。

计算结构阅读方法

英文原文文件:00_method.md

核心规则

本项目以设备为先。方法被解读为对计算结构的适配:设备类型、内存容量、内存带宽、互联条件、批处理、数据管线、训练规模与推理预算。

Canonical 语言

  • 英文为基准源文件。
  • 中文翻译位于 history/zh/
  • 中文文件是验证材料,必须链接到英文源文件。
  • 中文副本不得引入英文源文件中不存在的论断。

来源规范

  • 优先使用原始论文、模型/系统报告、基准论文和权威领域报告。
  • OpenAlex 引用数仅作为优先级信号,不单独充当历史证据。
  • 记录 OpenAlex 查询日期,因为引用数与合并后的 work 版本可能发生变化。
  • Test-of-time 奖项须在查验并记录官方来源后方可使用。

论文阅读卡

每篇已下载论文必须有一张阅读卡,包含以下部分:

  • 元数据:标题、年份、作者、来源 URL、PDF 路径、文本路径、引用来源/日期。
  • 计算设置:设备类型、训练/推理规模、并行方式、内存和数据约束。
  • 瓶颈:FLOPs、内存、带宽、通信、延迟、数据或部署约束。
  • 方法适配:为什么该方法适合这个计算设置。
  • 证据:基准、缩放结果、消融或采用信号。
  • 历史影响:该设置使什么变得可行或主流。
  • 局限:论文没有解决什么,以及后续计算范式改变了什么。
  • 链接:计算范式、方法索引条目与对照更新。

按计算范式阅读

每个计算范式的 README 应先从硬件与设置事实入手,再解释方法;不可仅从算法家族出发。

范式必填字段:

  • 设备与设置
  • 瓶颈
  • 适配的方法
  • 已过时或边缘化的方法
  • 代表性论文
  • 开放问题

验收规则

  • 扩展前至少排队 120 篇论文。
  • 每个已下载 PDF 都有抽取文本和阅读卡。
  • 每个计算范式至少有 8 篇排队论文,或有明确的缺漏说明。
  • 分支总结必须链接到论文卡、来源报告或对照。
  • python3 scripts/check_history_acceptance.py 必须通过。已完成阅读卡的占位符扫描也应为空。