Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →https://triton.hyper.ai/
triton.language.interleave(a, b)
沿着最后 1 个维度交错 2 个张量的值。这 2 个张量必须有相同形状。等同于 tl.join(a, b).reshape(a.shape[-1:] + [2***a.shape[-1]]) 。
参数:
- a (Tensor) – 第 1 个输入张量。
- b (Tensor) – 第 2 个输入张量。