Mixed precision
英文原文文件:mixed_precision.md
计算解释
以低精度训练换取加速器吞吐量提升,同时在关键处通过 loss scaling 与 FP32 状态维持收敛。
支撑阅读卡
- Mixed Precision Training (2017,
multi_gpu_dense_training) - BitNet b1.58 2B4T Technical Report (2025,
efficient_edge_inference)
后续计算范式下过时或退居次要的内容
仅通过已链接的阅读卡追踪,不将本方法页视为独立证据来源。