ggml-org
diff --git a/‎ggml/src/ggml-cuda/ggml-cuda.cu
Lines changed: 4 additions & 0 deletions b/‎ggml/src/ggml-cuda/ggml-cuda.cu
Lines changed: 4 additions & 0 deletions
@@ -3237,6 +3237,10 @@ static bool ggml_backend_cuda_device_supports_op(ggml_backend_dev_t dev, const g
             if (op->src[0]->ne[0] == 192) {
                 return false;
             }
+            if (op->src[0]->ne[0] == 576) {
+                // DeepSeek MLA
+                return false;
+            }
             if (op->src[0]->ne[3] != 1) {
                 return false;
             }
Original file line number	Diff line number	Diff line change
`@@ -3237,6 +3237,10 @@ static bool ggml_backend_cuda_device_supports_op(ggml_backend_dev_t dev, const g`
`3237`	`3237`	`if (op->src[0]->ne[0] == 192) {`
`3238`	`3238`	`return false;`
`3239`	`3239`	`}`
	`3240`	`+ if (op->src[0]->ne[0] == 576) {`
	`3241`	`+ // DeepSeek MLA`
	`3242`	`+ return false;`
	`3243`	`+ }`
`3240`	`3244`	`if (op->src[0]->ne[3] != 1) {`
`3241`	`3245`	`return false;`
`3242`	`3246`	`}`