感谢您的工作! 在尝试复现您论文效果时发现,eval的推理速度偏慢,且显存占用过大(3090上batchsize只能设置到12左右) 检查代码发现,推理时似乎遗漏了: with torch.no_grad(): 导致不必要的梯度计算以及显存占用 祝好!