Closed
Description
Overview
我需要测试 #2663 中量化后的性能,从源码下载了https://github.com/davidpissarra/mlc-llm/tree/kv-cache-quantization 这个分支中制定的tvm版本
f5f048b版本,但是在编译mlc-llm时报错,应该是tvm的版本不匹配导致的。请问我应该怎样解决?
Action Items
- [ ]
Links to Related Issues and PRs
https://github.com/davidpissarra/mlc-llm/tree/kv-cache-quantization
Metadata
Metadata
Assignees
Type
Projects
Status