perform ops on cpu, move back to module device

kylesayrs · kylesayrs · commit ff3323b59b4f · 2025-05-08T10:16:38.000-04:00
Signed-off-by: Kyle Sayers &lt;kylesayrs@gmail.com&gt;
diff --git a/src/compressed_tensors/compressors/model_compressors/model_compressor.py b/src/compressed_tensors/compressors/model_compressors/model_compressor.py
@@ -47,6 +47,8 @@
     iter_named_leaf_modules,
 )
 from compressed_tensors.utils import (
+    align_module_device,
+    delete_offload_parameter,
     get_execution_device,
     get_safetensors_folder,
     has_offloaded_params,
@@ -386,7 +388,10 @@ def compress_model(self, model: Module):
 
         for prefix, module in tqdm(model.named_modules(), desc="Compressing model"):
             if prefix in module_to_scheme or prefix in sparse_compression_targets:
-                state_dict = module.state_dict(prefix=f"{prefix}.")
+                # in the future, support compression on same device
+                with align_module_device(module, execution_device="cpu"):
+                    state_dict = module.state_dict(prefix=f"{prefix}.")
+
                 # quantization first
                 if prefix in module_to_scheme:
                     state_dict = self.quantization_compressor.compress(
@@ -433,7 +438,10 @@ def decompress_model(self, model: Module):
 
         for prefix, module in tqdm(model.named_modules(), desc="Decompressing model"):
             if prefix in module_to_scheme or prefix in sparse_compression_targets:
-                state_dict = module.state_dict(prefix=f"{prefix}.")
+                # in the future, support decompression on same device
+                with align_module_device(module, execution_device="cpu"):
+                    state_dict = module.state_dict(prefix=f"{prefix}.")
+
                 # sparsity first
                 if prefix in sparse_compression_targets:
                     # sparse_compression_targets are automatically inferred by this fn
@@ -461,7 +469,7 @@ def decompress_model(self, model: Module):
                 # remove any existing parameters
                 device = get_execution_device(module)
                 for name, _ in list(module.named_parameters()):
-                    delattr(module, name)
+                    delete_offload_parameter(module, name)
 
                 # replace with decompressed parameters
                 for name, value in state_dict.items():