Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →https://triton.hyper.ai/

triton.language.interleave(a, b)

沿着最后 1 个维度交错 2 个张量的值。这 2 个张量必须有相同形状。等同于 tl.join(a, b).reshape(a.shape[-1:] + [2***a.shape[-1]])

参数

  • a (Tensor) – 第 1 个输入张量。
  • b (Tensor) – 第 2 个输入张量。