[Feature] Allow non-peft models in vLLMUpdater (#3037)

albertbou92 · web-flow · commit fda1b8c9d895 · 2025-07-07T10:14:27.000+01:00
diff --git a/torchrl/collectors/llm/weight_update/vllm.py b/torchrl/collectors/llm/weight_update/vllm.py
@@ -256,9 +256,12 @@ def _maybe_map_weights(
             # Extract weights from policy module using merge_and_unload for LLMs
             if not hasattr(server_weights, "model"):
                 raise ValueError("TensorDictModuleBase must have a 'model' attribute")
-            if not hasattr(server_weights.model, "merge_and_unload"):
-                raise ValueError("Model must have a 'merge_and_unload' method")
-            return TensorDict(server_weights.model.merge_and_unload().state_dict(), [])
+            # Check if it's a LoRA model
+            if hasattr(server_weights.model, "merge_and_unload"):
+                state_dict = server_weights.model.merge_and_unload().state_dict()
+            else:
+                state_dict = server_weights.model.state_dict()
+            return TensorDict(state_dict, [])
         elif isinstance(server_weights, TensorDictBase):
             return server_weights
         elif isinstance(server_weights, dict):
@@ -281,7 +284,11 @@ def get_model_metadata(
         Returns:
             dict[str, tuple[torch.dtype, torch.Size]]: The model metadata.
         """
-        sd = model.model.merge_and_unload().state_dict()
+        # Check if the model has a LoRA adapter
+        if hasattr(model.model, "merge_and_unload"):
+            sd = model.model.merge_and_unload().state_dict()
+        else:
+            sd = model.model.state_dict()
         model_metadata = {k: (v.dtype, v.shape) for k, v in sd.items()}
         return model_metadata