Accelerate Utilities: Throw warning when updating with different shapes (#231)

kylesayrs · web-flow · commit 890608dfc689 · 2025-01-29T18:14:09.000-05:00
* replace not copy

Signed-off-by: Kyle Sayers &lt;kylesayrs@gmail.com&gt;

* Add warning when update shapes are different

Signed-off-by: Kyle Sayers &lt;kylesayrs@gmail.com&gt;

---------

Signed-off-by: Kyle Sayers &lt;kylesayrs@gmail.com&gt;
diff --git a/src/compressed_tensors/utils/offload.py b/src/compressed_tensors/utils/offload.py
@@ -26,6 +26,7 @@
 """
 
 import contextlib
+import warnings
 from functools import wraps
 from typing import Any, Callable, Dict, Literal, Optional, Union
 
@@ -200,9 +201,14 @@ def update_offload_parameter(
     """
     param = getattr(module, name)
     data = data.to(param.dtype)
+    if param.data.shape != data.shape:
+        warnings.warn(
+            f"Shape of parameter being updated {param.data.shape} does not match shape "
+            f"of update data {data.shape}"
+        )
 
     # copy data into onloaded parameter if applicable
-    if param.device != "meta":
+    if param.device != torch.device("meta"):
         param.data.copy_(data)
 
     # update offload dict
diff --git a/tests/test_utils/test_offload.py b/tests/test_utils/test_offload.py
@@ -100,31 +100,37 @@ def test_update_offload_parameter():
     from accelerate.hooks import attach_align_device_hook
 
     module = ExampleModule()
-    param_a = torch.nn.Parameter(torch.tensor(1.0))
-    param_b = torch.nn.Parameter(torch.tensor(2.0))
+    tensor_a = torch.tensor(1.0)
+    tensor_b = torch.tensor(2.0)
 
     # can update modules which are not offloaded
-    update_offload_parameter(module, "a", param_a)
-    assert module.a == param_a
+    update_offload_parameter(module, "a", tensor_a)
+    assert module.a == tensor_a
 
     # can update modules which are offloaded
     attach_align_device_hook(module, offload=True, weights_map=module.state_dict())
-    update_offload_parameter(module, "b", param_b)
+    update_offload_parameter(module, "b", tensor_b)
     assert module.b.device == torch.device("meta")
-    assert module._hf_hook.weights_map["b"] == param_b.data
+    assert module._hf_hook.weights_map["b"] == tensor_b
 
     # data persists across onloading
     with align_module_device(module, execution_device="cpu"):
-        assert module.a == param_a
-        assert module.b == param_b
-        assert module._hf_hook.weights_map["a"] == param_a.data
-        assert module._hf_hook.weights_map["b"] == param_b.data
+        assert module.a.data == tensor_a
+        assert module.b.data == tensor_b
+        assert module._hf_hook.weights_map["a"] == tensor_a
+        assert module._hf_hook.weights_map["b"] == tensor_b
 
     # data persists across offloading
     assert module.a.device == torch.device("meta")
     assert module.b.device == torch.device("meta")
-    assert module._hf_hook.weights_map["a"] == param_a.data
-    assert module._hf_hook.weights_map["b"] == param_b.data
+    assert module._hf_hook.weights_map["a"] == tensor_a
+    assert module._hf_hook.weights_map["b"] == tensor_b
+
+    # can update with differnt shape with warning
+    with pytest.warns():
+        new_data = torch.tensor([3.0])
+        update_offload_parameter(module, "a", new_data)
+    assert module._hf_hook.weights_map["a"] == new_data
 
 
 @requires_accelerate()