Llama-3.1-8B-Instruct add accuracy/server-rocm.

dtrifiro · dtrifiro · commit cfe6ba5bccf6 · 2025-05-09T14:39:18.000+02:00
diff --git a/meta-llama/Llama-3.1-8B-Instruct/accuracy/server-rocm.yml b/meta-llama/Llama-3.1-8B-Instruct/accuracy/server-rocm.yml
@@ -0,0 +1,4 @@
+trust-remote-code: true
+tensor-parallel-size: 1
+max-model-len: 16384
+gpu_memory_utilization: 0.8