pytorch-labs
diff --git a/‎test/test_gpu/skip_tests_h100_pytorch.yaml
Lines changed: 2 additions & 0 deletions b/‎test/test_gpu/skip_tests_h100_pytorch.yaml
Lines changed: 2 additions & 0 deletions
diff --git a/‎test/test_gpu/skip_tests_h100_triton_main.yaml
Lines changed: 2 additions & 0 deletions b/‎test/test_gpu/skip_tests_h100_triton_main.yaml
Lines changed: 2 additions & 0 deletions
diff --git a/‎tritonbench/kernels/attention_utils.py
Lines changed: 1 addition & 0 deletions b/‎tritonbench/kernels/attention_utils.py
Lines changed: 1 addition & 0 deletions
@@ -12,6 +12,8 @@ flash_attention:
   - triton_tutorial_flash_v2_ws
   - triton_tutorial_flash_v2_tma_ws
   - triton_tutorial_flash_v2_tma_ws_persistent
+blackwell_attentions:
+  - gluon_blackwell_fwd
 # the two requires full fbgemm instead of genai flavor
 fp8_gemm_rowwise:
 fp8_gemm_rowwise_grouped:
 
@@ -12,6 +12,8 @@ flash_attention:
   - triton_tutorial_flash_v2_ws
   - triton_tutorial_flash_v2_tma_ws
   - triton_tutorial_flash_v2_tma_ws_persistent
+blackwell_attentions:
+  - gluon_blackwell_fwd
 # the two requires full fbgemm instead of genai flavor
 fp8_gemm_rowwise:
 fp8_gemm_rowwise_grouped:
 
@@ -16,6 +16,7 @@
 PEEL_LAST = os.getenv("PEEL_LAST_ITER")
 WITH_TMA = os.getenv("WITH_TMA")
 HAS_EXPLICIT_WS = os.getenv("ENABLE_EXPLICIT_WS")
+SUPPORT_GLUON = os.getenv("WITH_GLUON")
 
 
 class TmaAutoTuneHelper: