你好,目前的inference脚本中只有单图或者多图concat的模板,请问有没有视频专属的模板(prefix)。另外,我注意到inference中的预处理形式和internvl一致,那么能否直接沿用internvl的模板呢