Swish-Gated Linear Unit
2026/6/6大约 1 分钟
Swish-Gated Linear Unit
题目描述
编写一个 GPU 程序,对一维输入向量实现 SwiGLU(Swish-Gated Linear Unit)激活函数的前向传播。输入张量形状为 ,元素类型为 float32。
SWiGLU 的定义如下:
将输入 从中间分成两半 和 。对前半部分计算 SiLU:
SwiGLU 输出为:
输出张量的长度为 。
实现要求
- 不允许使用外部库。
solve函数签名必须保持不变。- 最终结果必须存储在
output张量中。
示例
示例 1
Input: [1.0, 2.0, 3.0, 4.0] (N=4)
Output: [2.1931758, 7.0463767]示例 2
Input: [0.5, 1.0] (N=2)
Output: [0.31122968]约束条件
- , 为偶数。
- 输入值 。
- 性能测试在 的规模下进行。
解题思路
SwiGLU 是 LLaMA、Mistral、Gemma 等现代大模型使用的 FFN 激活函数。核心计算是分半后的 SiLU 门控 + 逐元素乘法。输入的两半在内存中连续,每个线程只需从相邻位置读取两部分,访存模式友好。欢迎在 GitHub Discussions 分享你的解法。