- 昨日不在
- 3/9深入理解内存一致性:从原子操作到指令集架构
- 3/9专题:LeetGPU - 从零手写 CUDA 算子
- 3/9详解 Git 的三种 Merge Request 形式
- 3/9深入理解 RPC 语义:从可能交付到精确一次
- 3/6专题:Transformer 深度解析 (Transformer Insider)
- 3/6Attention 的秩崩溃问题
- 3/6ReLU/GeLU 神经网络是相联存储器吗?
- 3/6KV Cache:大模型推理的性能瓶颈与优化艺术
- 3/6LayerNorm 的位置之争:Pre-LN vs Post-LN
- 3/6Transformer 中的残差连接到底在做什么
- 3/6旋转位置编码(RoPE)的几何直觉
- 3/6从词表到语义:Softmax 权重共享 (Weight Tying)
- 3/6为什么 Attention 需要除以 :从数值稳定性到梯度流
- 1/1深度解析流量治理——从重试风暴到自适应限流算法