时间轴 | Agicy's Blog

跳至主要內容

昨日不在

2026

2025

agicy

学生

19文章

专题：LeetGPU - 从零手写 CUDA 算子
详解 Git 的三种 Merge Request 形式
专题：Transformer 深度解析 (Transformer Insider)
Attention 的秩崩溃问题
ReLU/GeLU 神经网络是相联存储器吗？
KV Cache：大模型推理的性能瓶颈与优化艺术
LayerNorm 的位置之争：Pre-LN vs Post-LN
Transformer 中的残差连接到底在做什么
旋转位置编码（RoPE）的几何直觉
从词表到语义：Softmax 权重共享 (Weight Tying)
为什么 Attention 需要除以：从数值稳定性到梯度流
深度解析流量治理——从重试风暴到自适应限流算法
解析循环冗余校验码——能检能纠的强大能力
巧用 Linux 网络机制，打通网际孤岛
Hive UDAF 实战——高性能的用户在线时长聚合函数
现代化的 FreeSWITCH SIP 服务器
VuePress 博客自动部署实践

此处应有页脚。

Copyright © 2026 agicy