Update weight type handling in configureQuantizedMatrixVectorFinalWeight

mikepapadim · mikepapadim · commit 833e9ea27b3c · 2025-05-29T11:48:02.000+03:00
Refactor the logic to include `F16` weight type alongside `Q8_0`. Simplifies task configuration by removing redundant break statements for better readability and maintainability.
diff --git a/src/main/java/com/example/tornadovm/TornadoVMLayerPlanner.java b/src/main/java/com/example/tornadovm/TornadoVMLayerPlanner.java
@@ -184,11 +184,8 @@ public Tuple2<List<ImmutableTaskGraph>, GridScheduler> setupTornadoForwardPlanLa
         // @formatter:on
         private TaskGraph configureQuantizedMatrixVectorFinalWeight(TaskGraph logits) {
             switch (weights.weightType) {
+                case F16:
                 case Q8_0:
-                    logits.task("projection", TransformerComputeKernelsLayered::matrixVectorGeneric,  //
-                            context, state.wrapX, state.wrapLogits, weights.wclsHalfFloat, //
-                            config.dim, config.vocabularySize, LOCAL_WORK_GROUP_SIZE_ALLOC * THREAD_SCALE_FOR_LOGITS); //
-                    break;
                 case Q4_0:
                     logits.task("projection", TransformerComputeKernelsLayered::matrixVectorGeneric,  //
                             context, state.wrapX, state.wrapLogits, weights.wclsHalfFloat, //