fix bug in compute moe load

qmkakaxi · qmkakaxi · commit edb38e427184 · 2025-06-22T17:27:47.000+08:00
diff --git a/vllm_ascend/eplb/eplb_updator.py b/vllm_ascend/eplb/eplb_updator.py
@@ -131,7 +131,7 @@ def forward_before(self):
         self.eplb_loader.asyn_expert_weight_transfer(self.reqs)
 
     def forward_end(self, dummy_run=False):
-        self.adaptor.get_rank_expert_workload(self.num_moe_layers)
+        self.adaptor.get_rank_expert_workload(self.num_moe_layers,dummy_run)
         if not self.update_in_flight and self.get_update_iteration():
             moe_load = self.compute_and_set_moe_load(dummy_run)
             self.wakeup_eplb_worker()
@@ -144,8 +144,8 @@ def forward_end(self, dummy_run=False):
 
         self.eplb_loader.update_expert_map_and_weight(self.reqs, self.redundant_enable)
 
-    def compute_and_set_moe_load(self):
-        local_load = self.adaptor.get_rank_expert_workload(self.num_moe_layers)
+    def compute_and_set_moe_load(self,dummy_run=False):
+        local_load = self.adaptor.get_rank_expert_workload(self.num_moe_layers,dummy_run)
         self._gather_buffer = None
         if dist.is_initialized():
             self.world_size = dist.get_world_size()