ggml : fix Q5_0 qh -> uint32_t

ggerganov · ggerganov · commit 2576c16f00b5 · 2023-04-26T20:15:53.000+03:00
diff --git a/ggml-cuda.cu b/ggml-cuda.cu
@@ -41,10 +41,10 @@ static_assert(sizeof(block_q4_3) == 2 * sizeof(ggml_fp16_t) + QK4_3 / 2, "wrong
 typedef struct {
     __half d;               // delta
     __half m;               // min
-    int32_t qh;             // 5-th bit of quants
+    uint32_t qh;            // 5-th bit of quants
     uint8_t qs[QK5_0 / 2];  // nibbles / quants
 } block_q5_0;
-static_assert(sizeof(block_q5_0) == 2 * sizeof(ggml_fp16_t) + sizeof(int32_t) + QK5_0 / 2, "wrong q5_0 block size/padding");
+static_assert(sizeof(block_q5_0) == 2 * sizeof(ggml_fp16_t) + sizeof(uint32_t) + QK5_0 / 2, "wrong q5_0 block size/padding");
 
 #define QK8_0 32
 typedef struct {
diff --git a/ggml.c b/ggml.c
@@ -677,10 +677,10 @@ static_assert(sizeof(block_q4_3) == 2 * sizeof(ggml_fp16_t) + QK4_3 / 2, "wrong
 typedef struct {
     ggml_fp16_t d;         // delta
     ggml_fp16_t m;         // min
-    int32_t qh;            // 5-th bit of quants
+    uint32_t qh;           // 5-th bit of quants
     uint8_t qs[QK5_0 / 2]; // nibbles / quants
 } block_q5_0;
-static_assert(sizeof(block_q5_0) == 2 * sizeof(ggml_fp16_t) + sizeof(int32_t) + QK5_0 / 2, "wrong q5_0 block size/padding");
+static_assert(sizeof(block_q5_0) == 2 * sizeof(ggml_fp16_t) + sizeof(uint32_t) + QK5_0 / 2, "wrong q5_0 block size/padding");
 
 #define QK8_0 32
 typedef struct {