# 运行时错误：Triton编译失败：不支持的指令 'mma.sync.aligned.m16n8k16.row.col.f16.f16.f16'

- **ID:** `cuda/triton-asm-unsupported`
- **领域:** cuda
- **类别:** build_error
- **验证级别:** ai_generated
- **修复率:** 80%

## 根因

Triton内核使用了目标GPU架构不支持的PTX指令（例如mma.sync），通常是由于GPU较旧或计算能力不正确。

## 版本兼容性

| 版本 | 状态 | 引入 | 弃用 |
|------|------|------|------|
| Triton 2.1.0 | active | — | — |
| PyTorch 2.2.0 | active | — | — |
| NVIDIA T4 (sm_75) | active | — | — |

## 解决方案

1. ```
   Run the kernel on a GPU with compute capability >= 8.0 (Ampere or newer). Alternatively, disable Triton by setting environment variable `TORCHDYNAMO_USE_TRITON=0` to fall back to CUDA kernels.
   ```

## 无效尝试

- **** — The error is hardware-limited, not software. (70% 失败率)
- **** — Triton uses its own JIT compiler, independent of TensorExpr. (90% 失败率)
