Value Clipping
2026/6/6大约 1 分钟
Value Clipping
题目描述
编写一个 GPU 程序,对一维输入向量执行裁剪操作。给定输入张量(形状 ,类型 float32),将每个元素裁剪到指定范围 内:
该操作确保所有值落在指定范围内,广泛用于 ML 中的激活值稳定化和量化前预处理。
实现要求
- 不允许使用外部库。
solve函数签名必须保持不变。- 最终结果必须存储在
output张量中。
示例
示例 1
Input: input = [1.5, -2.0, 3.0, 4.5], lo = 0.0, hi = 3.5
Output: [1.5, 0.0, 3.0, 3.5]示例 2
Input: input = [-1.0, 2.0, 5.0], lo = -0.5, hi = 2.5
Output: [-0.5, 2.0, 2.5]约束条件
- 。
- 。
- 。
- 性能测试在 的规模下进行。
解题思路
裁剪操作是典型的逐元素 Map 操作。每个元素经过两次比较(下界和上界),可以使用 min + max 的组合或 clamp。在 CUDA 中 fminf 和 fmaxf 是硬件支持的指令。与 ReLU 类似,这是一个内存带宽受限的内核。欢迎在 GitHub Discussions 分享你的解法。