silu_mul API Update (#4359)

sunfish2010 · facebook-github-bot · commit 9db5e09f6956 · 2025-06-17T10:36:13.000-07:00
Summary: Pull Request resolved: #4359 X-link: facebookresearch/FBGEMM#1427 As titled. add optional inputs to torch api Reviewed By: levendlee Differential Revision: D76395658 fbshipit-source-id: 4b31ab23351350fed55bd6bcdbb9a3bb049ce36f
diff --git a/fbgemm_gpu/experimental/gen_ai/gen_ai/moe/activation.py b/fbgemm_gpu/experimental/gen_ai/gen_ai/moe/activation.py
@@ -135,37 +135,37 @@ def silu_mul_quant(
 
 torch.library.define(
     "fbgemm::silu_mul",
-    "(Tensor x0, Tensor x1) -> Tensor",
+    "(Tensor x0, Tensor x1, Tensor? valid_token_count=None) -> Tensor",
 )
 
 
 @torch.library.impl(_SILU_MUL_OP_NAME, "Meta")
-def silu_mul_meta(x0, x1):
+def silu_mul_meta(x0, x1, valid_token_count):
     return x0.new_empty(x0.shape)
 
 
 @torch.library.impl(_SILU_MUL_OP_NAME, "CUDA")
-def silu_mul_cuda(x0, x1):
-    return silu_mul(x0, x1)
+def silu_mul_cuda(x0, x1, valid_token_count):
+    return silu_mul(x0, x1, valid_token_count)
 
 
 _SILU_MUL_OP_QUANT_NAME = "fbgemm::silu_mul_quant"
 
 torch.library.define(
     "fbgemm::silu_mul_quant",
-    "(Tensor x0, Tensor x1, Tensor? scale_ub) -> Tensor",
+    "(Tensor x0, Tensor x1, Tensor? scale_ub=None, Tensor? valid_token_count=None) -> Tensor",
 )
 
 
 @torch.library.impl(_SILU_MUL_OP_QUANT_NAME, "Meta")
-def silu_mul_quant_meta(x0, x1, scale_ub):
+def silu_mul_quant_meta(x0, x1, scale_ub, valid_token_count):
     pt_dtype, tl_dtype, max_fp8, eps = get_fp8_constants()
     return torch.empty(x0.shape, device=x0.device, dtype=pt_dtype)
 
 
 @torch.library.impl(_SILU_MUL_OP_QUANT_NAME, "CUDA")
-def silu_mul_quant_cuda(x0, x1, scale_ub=None):
-    return silu_mul_quant(x0, x1, scale_ub)
+def silu_mul_quant_cuda(x0, x1, scale_ub=None, valid_token_count=None):
+    return silu_mul_quant(x0, x1, scale_ub, valid_token_count)
 
 
 # Kernel Implementations
diff --git a/fbgemm_gpu/experimental/gen_ai/gen_ai/moe/gather_scatter.py b/fbgemm_gpu/experimental/gen_ai/gen_ai/moe/gather_scatter.py
@@ -362,7 +362,7 @@ def gather_scale_quant_dense_tokens_cuda(
 
 torch.library.define(
     "fbgemm::scatter_add_dense_tokens",
-    "(Tensor out_tokens, Tensor in_tokens, Tensor token_indices) -> None",
+    "(Tensor out_tokens, Tensor in_tokens, Tensor token_indices, Tensor? valid_token_count=None) -> None",
 )
 
 

Original file line number	Diff line number	Diff line change
`@@ -362,7 +362,7 @@ def gather_scale_quant_dense_tokens_cuda(`
`362`	`362`
`363`	`363`	`torch.library.define(`
`364`	`364`	`"fbgemm::scatter_add_dense_tokens",`
`365`		`- "(Tensor out_tokens, Tensor in_tokens, Tensor token_indices) -> None",`
	`365`	`+ "(Tensor out_tokens, Tensor in_tokens, Tensor token_indices, Tensor? valid_token_count=None) -> None",`
`366`	`366`	`)`
`367`	`367`
`368`	`368`