ReLU
2026/6/6小于 1 分钟
ReLU
原始题目:LeetGPU - ReLU
题目描述
编写一个 GPU 程序,对 32 位浮点数向量执行 ReLU(Rectified Linear Unit)激活函数。ReLU 将所有负值设为零,正值保持不变:
实现要求
- 不允许使用外部库。
solve函数签名必须保持不变。- 最终结果必须存储在
output中。
示例
示例 1
Input: [-2.0, -1.0, 0.0, 1.0, 2.0]
Output: [0.0, 0.0, 0.0, 1.0, 2.0]示例 2
Input: [-3.5, 0.0, 4.2]
Output: [0.0, 0.0, 4.2]约束条件
- 。
- 性能测试在 的规模下进行。
解题思路
ReLU 是最简单的逐元素激活函数之一,每个元素独立计算 ,完全数据并行。计算强度极低(1 FLOP + 1 比较 + 2 次 4 字节内存访问),属于典型的内存带宽受限内核。欢迎在 GitHub Discussions 分享你的解法。