vllm-project · simon-mo · Jul 19, 2025 · Jul 19, 2025 · gemini-code-assist · Jul 19, 2025
@@ -2042,7 +2042,7 @@ def _dummy_run(
                     block_table_tensor=self.input_batch.block_table[
                         kv_cache_group_id].get_device_tensor()[:num_reqs],
                     slot_mapping=self.input_batch.
-                    block_table[kv_cache_group_id].slot_mapping[:num_reqs])
+                    block_table[kv_cache_group_id].slot_mapping[:num_tokens])
 
                 attn_metadata_i = self.attn_metadata_builders[
                     kv_cache_group_id].build_for_cudagraph_capture(