"主动继承:利用合成数据引导大型语言模型生成理想文本"
摘要
本文探讨了合成数据对大型语言模型(LLMs)的影响,特别是如何通过精炼数据影响其他LLMs。研究系统地分析了合成数据源如何塑造模型的内部偏见、校准和生成文本的属性及偏好。研究发现,即使合成数据提示看似“中性”,模型对某些属性仍异常敏感,这引发了一个问题:是否可以利用数据生成过程在测试时明确引导模型向我们想要的属性发展?本文提出了“主动继承”这一概念,描述了如何根据非可微目标有意限制合成数据,以引导模型生成具有高词汇多样性或低毒性的文本。
Read more...








