chore: lint code

jianzs · jianzs · commit eb2591c1c3bc · 2025-04-28T11:19:58.000+08:00
Signed-off-by: Jade Zheng &lt;zheng.shoujian@outlook.com&gt;
diff --git a/examples/disaggregated-prefill-v1/disagg_prefill_proxy_server.py b/examples/disaggregated-prefill-v1/disagg_prefill_proxy_server.py
@@ -4,7 +4,7 @@
 import os
 
 import aiohttp
-from quart import Quart, make_response, request
+from quart import Quart, make_response, request  # type: ignore
 
 AIOHTTP_TIMEOUT = aiohttp.ClientTimeout(total=6 * 60 * 60)
 
@@ -47,7 +47,7 @@ async def handle_request():
             },
         ):
             # Print the prefill result
-            print(f"===== Prefill result =====")
+            print("===== Prefill result =====")
             print(prefill_result.decode("utf-8"))
             print("==========================")
             response = json.loads(prefill_result.decode("utf-8"))
diff --git a/vllm_ascend/distributed/llmdatadist_connector_v1.py b/vllm_ascend/distributed/llmdatadist_connector_v1.py
@@ -4,12 +4,12 @@
 import struct
 import time
 from dataclasses import dataclass
-from typing import TYPE_CHECKING, Any, List, Tuple
+from typing import TYPE_CHECKING, Any, List, Optional, Tuple, Union
 
 import requests
 import torch
 import torch_npu
-import torchair
+import torchair  # type: ignore
 from vllm.distributed import get_tensor_model_parallel_rank, get_world_group
 from vllm.distributed.kv_transfer.kv_connector.v1.base import (
     KVConnectorBase_V1, KVConnectorMetadata, KVConnectorRole)
@@ -67,7 +67,8 @@ class ServerInfo:
     role: ServerRole
     devices: List[DeviceInfo]
 
-    def get_device(self, tp_rank: int, dp_rank: int) -> DeviceInfo:
+    def get_device(self, tp_rank: int,
+                   dp_rank: int) -> Union[DeviceInfo, None]:
         for device in self.devices:
             if device.tp_rank == tp_rank and device.dp_rank == dp_rank:
                 return device
@@ -162,7 +163,7 @@ def __init__(self, vllm_config: "VllmConfig") -> None:
             GLOBAL_RANKTABLE, self.prefill_tp, self.decode_tp)
 
     def get_device(self, server_id: str, dp_rank: int,
-                   tp_rank: int) -> DeviceInfo:
+                   tp_rank: int) -> Union[DeviceInfo, None]:
         for server in self._servers:
             if server.server_id != server_id:
                 continue
@@ -225,7 +226,7 @@ def _get_first_matching_value(self, config_dict: dict,
         return default
 
 
-_CLUSTER_INFO: "ClusterInfo" = None
+_CLUSTER_INFO: Optional["ClusterInfo"] = None
 
 
 def init_cluster_info(vllm_config: "VllmConfig") -> None:
@@ -272,7 +273,7 @@ def __init__(self, role: llm_datadist.LLMRole, local_rank: int,
         local_device_info = self.cluster_info.get_device(
             local_server_id, dp_rank, tp_rank)
         assert local_device_info is not None, \
-            f"Could not find local device from cluster info."
+            "Could not find local device from cluster info."
 
         self.cluster_id = local_device_info.cluster_id
         self.local_device_ip = local_device_info.device_ip
@@ -379,8 +380,8 @@ def __init__(self, vllm_config: "VllmConfig",
             self.kv_role = llm_datadist.LLMRole.DECODER
         else:
             raise ValueError(
-                f"The value of kv_role must be either `kv_producer` or `kv_consumer`, but received {kv_transfer_config.kv_role}."
-            )
+                "The value of kv_role must be either `kv_producer` or"
+                f" `kv_consumer`, but received {kv_transfer_config.kv_role}.")
 
         # Used by scheduler process
         self._requests_need_load: dict[str, Request] = {}
@@ -400,7 +401,7 @@ def __init__(self, vllm_config: "VllmConfig",
             "local_server_id", None)
         assert (
             self.local_server_id is not None
-        ), f"Cannot find `local_server_id` from `kv_transfer_config.kv_connector_extra_config`."
+        ), "Cannot find `local_server_id` from `kv_transfer_config.kv_connector_extra_config`."
 
         self.dp_rank = self._vllm_config.parallel_config.data_parallel_rank
         self.tp_size = self._vllm_config.parallel_config.tensor_parallel_size
@@ -474,7 +475,7 @@ def start_load_kv(self, forward_context: "ForwardContext",
         # this is the cause.
         if prefill_infos is None:
             logger.error(
-                f"[rank%d][D]: Failed to get prefill info, redo model forwarding.",
+                "[rank%d][D]: Failed to get prefill info, redo model forwarding.",
                 torch.distributed.get_rank())
             return None
 
@@ -853,8 +854,8 @@ def _create_cache_tensors(self,
             except LLMException as e:
                 if e.status_code == LLMStatusCode.LLM_DEVICE_OUT_OF_MEMORY:
                     logger.warning(
-                        f"allocate_cache failed due to insufficient space in the mbuf memory."
-                    )
+                        "allocate_cache failed due to insufficient space in the"
+                        " mbuf memory.")
                     time.sleep(0.03)  # wait for cache buf to be ready
                 else:
                     raise e