Refactor imatrix api, fix build shared libs

stduhpf · stduhpf · commit c6d2a57bc8cb · 2025-07-18T12:43:51.000+02:00
diff --git a/examples/cli/main.cpp b/examples/cli/main.cpp
@@ -24,10 +24,6 @@
 #define STB_IMAGE_RESIZE_STATIC
 #include "stb_image_resize.h"
 
-#define IMATRIX_IMPL
-#include "imatrix.hpp"
-static IMatrixCollector g_collector;
-
 #define SAFE_STR(s) ((s) ? (s) : "")
 #define BOOL_STR(b) ((b) ? "true" : "false")
 
@@ -770,10 +766,6 @@ void sd_log_cb(enum sd_log_level_t level, const char* log, void* data) {
     fflush(out_stream);
 }
 
-static bool collect_imatrix(struct ggml_tensor* t, bool ask, void* user_data) {
-    return g_collector.collect_imatrix(t, ask, user_data);
-}
-
 int main(int argc, const char* argv[]) {
     SDParams params;
 
@@ -799,13 +791,12 @@ int main(int argc, const char* argv[]) {
     }
 
     if (params.imatrix_out != "") {
-        sd_set_backend_eval_callback((sd_graph_eval_callback_t)collect_imatrix, &params);
+        enableImatrixCollection();
     }
     if (params.imatrix_out != "" || params.mode == CONVERT || params.wtype != SD_TYPE_COUNT) {
-        setConvertImatrixCollector((void*)&g_collector);
         for (const auto& in_file : params.imatrix_in) {
             printf("loading imatrix from '%s'\n", in_file.c_str());
-            if (!g_collector.load_imatrix(in_file.c_str())) {
+            if (!loadImatrix(in_file.c_str())) {
                 printf("Failed to load %s\n", in_file.c_str());
             }
         }
@@ -1120,7 +1111,7 @@ int main(int argc, const char* argv[]) {
         results[i].data = NULL;
     }
     if (params.imatrix_out != "") {
-        g_collector.save_imatrix(params.imatrix_out);
+        saveImatrix(params.imatrix_out.c_str());
     }
     free(results);
     free_sd_ctx(sd_ctx);
diff --git a/model.cpp b/model.cpp
@@ -33,7 +33,7 @@
 
 #define ST_HEADER_SIZE_LEN 8
 
-static IMatrixCollector* imatrix_collector = NULL;
+static IMatrixCollector imatrix_collector;
 
 uint64_t read_u64(uint8_t* buffer) {
     // little endian
@@ -1984,7 +1984,7 @@ bool ModelLoader::load_tensors(on_new_tensor_cb_t on_new_tensor_cb, ggml_backend
 
                     auto processed_name = convert_tensor_name(tensor_storage.name);
                     // LOG_DEBUG("%s",processed_name.c_str());
-                    std::vector<float> imatrix = imatrix_collector ? imatrix_collector->get_values(processed_name) : std::vector<float>{};
+                    std::vector<float> imatrix = imatrix_collector.get_values(processed_name);
 
                     convert_tensor((void*)read_buffer.data(), tensor_storage.type, dst_tensor->data,
                                    dst_tensor->type, (int)tensor_storage.nelements() / (int)tensor_storage.ne[0], (int)tensor_storage.ne[0], imatrix);
@@ -2011,7 +2011,7 @@ bool ModelLoader::load_tensors(on_new_tensor_cb_t on_new_tensor_cb, ggml_backend
                     // convert first, then copy to device memory
                     auto processed_name = convert_tensor_name(tensor_storage.name);
                     // LOG_DEBUG("%s",processed_name.c_str());
-                    std::vector<float> imatrix = imatrix_collector ? imatrix_collector->get_values(processed_name) : std::vector<float>{};
+                    std::vector<float> imatrix = imatrix_collector.get_values(processed_name);
 
                     convert_buffer.resize(ggml_nbytes(dst_tensor));
                     convert_tensor((void*)read_buffer.data(), tensor_storage.type,
@@ -2263,10 +2263,6 @@ int64_t ModelLoader::get_params_mem_size(ggml_backend_t backend, ggml_type type)
     return mem_size;
 }
 
-void setConvertImatrixCollector(void* collector) {
-    imatrix_collector = ((IMatrixCollector*)collector);
-}
-
 bool convert(const char* model_path, const char* clip_l_path, const char* clip_g_path, const char* t5xxl_path, const char* diffusion_model_path, const char* vae_path, const char* output_path, sd_type_t output_type, const char* tensor_type_rules) {
     ModelLoader model_loader;
 
@@ -2314,3 +2310,19 @@ bool convert(const char* model_path, const char* clip_l_path, const char* clip_g
     bool success = model_loader.save_to_gguf_file(output_path, (ggml_type)output_type, tensor_type_rules);
     return success;
 }
+
+bool loadImatrix(const char* imatrix_path) {
+    return imatrix_collector.load_imatrix(imatrix_path);
+}
+void saveImatrix(const char* imatrix_path) {
+    imatrix_collector.save_imatrix(imatrix_path);
+}
+static bool collect_imatrix(struct ggml_tensor* t, bool ask, void* user_data) {
+    return imatrix_collector.collect_imatrix(t, ask, user_data);
+}
+void enableImatrixCollection() {
+    sd_set_backend_eval_callback((sd_graph_eval_callback_t)collect_imatrix, NULL);
+}
+void disableImatrixCollection() {
+    sd_set_backend_eval_callback(NULL, NULL);
+}
diff --git a/stable-diffusion.h b/stable-diffusion.h
@@ -243,7 +243,6 @@ SD_API void free_upscaler_ctx(upscaler_ctx_t* upscaler_ctx);
 
 SD_API sd_image_t upscale(upscaler_ctx_t* upscaler_ctx, sd_image_t input_image, uint32_t upscale_factor);
 
-SD_API void setConvertImatrixCollector(void * collector);
 SD_API bool convert(const char* model_path, const char* clip_l_path, const char* clip_g_path, const char* t5xxl_path, const char* diffusion_model_path,
                     const char* vae_path,
                     const char* output_path,
@@ -259,6 +258,11 @@ SD_API uint8_t* preprocess_canny(uint8_t* img,
                                  float strong,
                                  bool inverse);
 
+SD_API bool loadImatrix(const char * imatrix_path);
+SD_API void saveImatrix(const char * imatrix_path);
+SD_API void enableImatrixCollection();
+SD_API void disableImatrixCollection();
+
 #ifdef __cplusplus
 }
 #endif

Original file line number	Diff line number	Diff line change
`@@ -24,10 +24,6 @@`
`24`	`24`	`#define STB_IMAGE_RESIZE_STATIC`
`25`	`25`	`#include "stb_image_resize.h"`
`26`	`26`
`27`		`-#define IMATRIX_IMPL`
`28`		`-#include "imatrix.hpp"`
`29`		`-static IMatrixCollector g_collector;`
`30`		`-`
`31`	`27`	`#define SAFE_STR(s) ((s) ? (s) : "")`
`32`	`28`	`#define BOOL_STR(b) ((b) ? "true" : "false")`
`33`	`29`
`@@ -770,10 +766,6 @@ void sd_log_cb(enum sd_log_level_t level, const char* log, void* data) {`
`770`	`766`	`fflush(out_stream);`
`771`	`767`	`}`
`772`	`768`
`773`		`-static bool collect_imatrix(struct ggml_tensor* t, bool ask, void* user_data) {`
`774`		`- return g_collector.collect_imatrix(t, ask, user_data);`
`775`		`-}`
`776`		`-`
`777`	`769`	`int main(int argc, const char* argv[]) {`
`778`	`770`	`SDParams params;`
`779`	`771`
`@@ -799,13 +791,12 @@ int main(int argc, const char* argv[]) {`
`799`	`791`	`}`
`800`	`792`
`801`	`793`	`if (params.imatrix_out != "") {`
`802`		`- sd_set_backend_eval_callback((sd_graph_eval_callback_t)collect_imatrix, &params);`
	`794`	`+ enableImatrixCollection();`
`803`	`795`	`}`
`804`	`796`	`if (params.imatrix_out != "" \|\| params.mode == CONVERT \|\| params.wtype != SD_TYPE_COUNT) {`
`805`		`- setConvertImatrixCollector((void*)&g_collector);`
`806`	`797`	`for (const auto& in_file : params.imatrix_in) {`
`807`	`798`	`printf("loading imatrix from '%s'\n", in_file.c_str());`
`808`		`- if (!g_collector.load_imatrix(in_file.c_str())) {`
	`799`	`+ if (!loadImatrix(in_file.c_str())) {`
`809`	`800`	`printf("Failed to load %s\n", in_file.c_str());`
`810`	`801`	`}`
`811`	`802`	`}`
`@@ -1120,7 +1111,7 @@ int main(int argc, const char* argv[]) {`
`1120`	`1111`	`results[i].data = NULL;`
`1121`	`1112`	`}`
`1122`	`1113`	`if (params.imatrix_out != "") {`
`1123`		`- g_collector.save_imatrix(params.imatrix_out);`
	`1114`	`+ saveImatrix(params.imatrix_out.c_str());`
`1124`	`1115`	`}`
`1125`	`1116`	`free(results);`
`1126`	`1117`	`free_sd_ctx(sd_ctx);`