NLP-insights Mindful insights from web 简单来说就是,FKL在传统任务好,是因为传统分类任务的输出空间小,mode比较少,也就是多峰的时候少,但是对于LLM来说,输出空间更复杂,mode更多。再使用FKL的话,q就会关注p的空区域,就会产生不好的样本。