fix comment

yaochengji · yaochengji · commit d6275e70ea50 · 2025-06-06T19:07:12.000Z
Signed-off-by: Chengji Yao &lt;chengjiyao@google.com&gt;
diff --git a/vllm/v1/attention/backends/pallas.py b/vllm/v1/attention/backends/pallas.py
@@ -195,7 +195,10 @@ def forward(
             write_to_kv_cache(key, value, kv_cache, slot_mapping,
                               self.kv_cache_quantized_dtype,
                               layer._k_scale_float, layer._v_scale_float)
-
+        if self.kv_cache_quantized_dtype is not None and (
+                layer._k_scale_float == 0.0 or layer._v_scale_float == 0.0):
+            raise ValueError(
+                "k_scale_float and v_scale_float must be non-zero")
         output = torch.ops.xla.ragged_paged_attention(
             query,
             kv_cache,