Remove compression_ratio calculation (#293)

dsikka · web-flow · commit 7eb461ef29d5 · 2025-04-07T20:46:46.000-04:00
* src/compressed_tensors/quantization/quant_config.py

* fix tests
diff --git a/src/compressed_tensors/quantization/quant_config.py b/src/compressed_tensors/quantization/quant_config.py
@@ -230,10 +230,6 @@ def from_pretrained(
             group_name = "group_" + str(idx)
             config_groups[group_name] = scheme
 
-        # TODO: this is incorrect in compressed mode, since we are overwriting the
-        # original weight we lose the uncompressed bit_depth indo
-        compression_ratio = calculate_compression_ratio(model)
-
         if format is None:
             if quantization_status == QuantizationStatus.COMPRESSED:
                 format = CompressionFormat.int_quantized.value
@@ -244,7 +240,7 @@ def from_pretrained(
             config_groups=config_groups,
             quantization_status=quantization_status,
             kv_cache_scheme=kv_cache_scheme,
-            global_compression_ratio=compression_ratio,
+            global_compression_ratio=None,
             format=format,
             ignore=consolidated_ignore,
         )
diff --git a/tests/test_quantization/lifecycle/test_apply.py b/tests/test_quantization/lifecycle/test_apply.py
@@ -184,8 +184,9 @@ def test_serialize_config_tinyllama():
     assert serialized_config.format == CompressionFormat.dense.value
     assert serialized_config.quant_method == DEFAULT_QUANTIZATION_METHOD
     assert serialized_config.ignore == ["model.layers.1.mlp.down_proj"]
-    assert serialized_config.global_compression_ratio > 1.0
-    assert serialized_config.global_compression_ratio < 8.0
+    if serialized_config.global_compression_ratio is not None:
+        assert serialized_config.global_compression_ratio > 1.0
+        assert serialized_config.global_compression_ratio < 8.0
 
 
 def _test_layer_quantization_status(