Mf/world size check (#1586)

michaelfeil · web-flow · commit 5bcb3269ba7b · 2025-04-11T18:04:34.000-07:00
* add world size check

* add world size check, bump version
diff --git a/pyproject.toml b/pyproject.toml
@@ -1,6 +1,6 @@
 [tool.poetry]
 name = "truss"
-version = "0.9.81rc001"
+version = "0.9.81rc003"
 description = "A seamless bridge from model development to model delivery"
 license = "MIT"
 readme = "README.md"
diff --git a/truss/base/trt_llm_config.py b/truss/base/trt_llm_config.py
@@ -600,11 +600,20 @@ def trt_llm_validation(config: "TrussConfig") -> "TrussConfig":
                 "FP8 quantization is only supported on L4, H100, H200 "
                 "accelerators or newer (CUDA_COMPUTE>=89)"
             )
-        tensor_parallel_count = config.trt_llm.build.tensor_parallel_count
+        world_size = (
+            config.trt_llm.build.tensor_parallel_count
+            * config.trt_llm.build.pipeline_parallel_count
+            * config.trt_llm.build.sequence_parallel_count
+        )
 
-        if tensor_parallel_count != config.resources.accelerator.count:
+        if world_size != config.resources.accelerator.count:
             raise ValueError(
                 "Tensor parallelism and GPU count must be the same for TRT-LLM"
+                f"You have set tensor_parallel_count={config.trt_llm.build.tensor_parallel_count}, "
+                f"pipeline_parallel_count={config.trt_llm.build.pipeline_parallel_count}, "
+                f"sequence_parallel_count={config.trt_llm.build.sequence_parallel_count} "
+                f"== world_size->{world_size} "
+                f"and accelerator.count={config.resources.accelerator.count}. "
             )
 
     return config