探索大型语言模型的自我认知:一项开创性研究
摘要
本文探讨了大型语言模型(LLMs)中的自我认知现象,通过构建一系列自我认知指令提示和设计四个原则来量化LLMs的自我认知能力。研究发现,在Chatbot Arena上的48个模型中,有4个模型展现出一定程度的可检测自我认知。此外,研究还发现模型大小和训练数据质量与自我认知水平呈正相关。文章还探讨了LLMs在自我认知状态下的实用性和可信度,发现这种状态增强了创造性写作和夸张等特定任务的表现。研究认为,这项工作可以作为进一步研究LLMs自我认知的灵感来源。
Read more...








