Optimize code format

skylee-01 · skylee-01 · commit e7ad830c0322 · 2025-07-09T16:10:21.000+08:00
Signed-off-by: skylee-01 &lt;497627264@qq.com&gt;
diff --git a/vllm/v1/spec_decode/mlp_speculator.py b/vllm/v1/spec_decode/mlp_speculator.py
@@ -28,11 +28,10 @@ def __init__(
         self.vllm_config = vllm_config
         self.device = device
         self.max_num_seqs = vllm_config.scheduler_config.max_num_seqs
-        self.hidden_size = vllm_config.speculative_config.\
-            draft_model_config.get_hidden_size(
-        )
-        self.num_speculative_tokens = vllm_config.speculative_config.\
-            num_speculative_tokens
+        self.hidden_size = (vllm_config.speculative_config.
+            draft_model_config.get_hidden_size())
+        self.num_speculative_tokens = (vllm_config.speculative_config.
+            num_speculative_tokens)
         self.dtype = vllm_config.model_config.dtype
 
     def propose(
@@ -41,7 +40,7 @@ def propose(
         previous_hidden_states: torch.Tensor,
         num_predict_tokens: int,
         sampling_metadata: SamplingMetadata,
-    ) -> torch.Tensor:
+    ) -> list[list[int]]:
         # Generate blocks and compute logits
         draft_tokens = self.model.generate_proposals(input_ids, previous_hidden_states, num_predict_tokens,sampling_metadata)
         return list(map(lambda x: x[0], zip(*[i.sampled_token_ids.tolist() for i in draft_tokens])))