Sigmoid Activation
2026/6/6小于 1 分钟
Sigmoid Activation
题目描述
编写一个 GPU 程序,对 32 位浮点数向量逐元素应用 sigmoid 激活函数。对于输入向量 中的每个元素 ,计算:
并将结果存储在输出向量 中。sigmoid 函数将任意实数映射到 区间。
实现要求
- 不允许使用外部库。
solve函数签名必须保持不变。- 最终结果必须存储在向量 中。
示例
示例 1
Input: X = [0.0, 1.0, -1.0, 2.0]
Output: Y = [0.5, 0.7311, 0.2689, 0.8808]示例 2
Input: X = [0.5, -0.5, 3.0, -3.0]
Output: Y = [0.6225, 0.3775, 0.9526, 0.0474]约束条件
- 。
- 输入值为有限的 32 位浮点数。
- 性能测试在 的规模下进行。
解题思路
Sigmoid 的核心计算瓶颈在 。对于大的正输入,,sigmoid ;对于大的负输入,,sigmoid 。处理方式包括使用 __expf() 内置或分段近似来避免溢出的同时保证精度。属于内存带宽受限内核。欢迎在 GitHub Discussions 分享你的解法。