page_size -> num_element_per_page

tdoublep · tdoublep · commit aa51c7cd6e0e · 2025-07-01T20:15:41.000Z
Signed-off-by: Thomas Parnell &lt;tpa@zurich.ibm.com&gt;
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
@@ -2444,14 +2444,14 @@ def _reshape_kv_cache_tensors(
                 elif isinstance(kv_cache_spec, MambaSpec):
                     raw_tensor = kv_cache_raw_tensors[layer_name]
                     dtype = kv_cache_spec.dtype
-                    page_size = kv_cache_spec.page_size_bytes // get_dtype_size(
-                        dtype)
+                    num_element_per_page = (kv_cache_spec.page_size_bytes //
+                                            get_dtype_size(dtype))
                     state_tensors = []
                     storage_offset = 0
                     for shape in kv_cache_spec.shapes:
                         target_shape = (num_blocks, *shape)
                         stride = torch.empty(target_shape).stride()
-                        target_stride = (page_size, *stride[1:])
+                        target_stride = (num_element_per_page, *stride[1:])
                         tensor = torch.as_strided(
                             raw_tensor.view(dtype),
                             size=target_shape,