探索大型语言模型在迭代文化传播中的行为与信息扭曲

When LLMs Play the Telephone Game: Cumulative Changes and Attractors in Iterated Cultural Transmissions

摘要

本文探讨了大型语言模型(LLMs)在迭代文化传播中的行为和信息扭曲问题。研究采用了一种类似于人类文化进化研究的传递链设计,通过LLM代理迭代接收、生成和传输文本,从而观察文本属性如毒性、积极性、难度和长度的变化。研究发现,即使在单个输出中微不足道的偏差,在迭代交互中也可能被放大,导致内容向吸引子状态演变。此外,研究还发现不同模型和任务对吸引子的位置和强度有显著影响,例如,更开放的任务会导致更强的吸引效应。这些发现强调了考虑多步骤传输动态的重要性,并为理解LLM文化动态提供了初步步骤。

原理

研究通过构建一个传递链实验设计,模拟LLM代理之间的迭代文本生成和传输过程。每个LLM代理接收前一个代理生成的文本和任务指令,然后生成新的文本传递给下一个代理。通过跟踪文本属性在传递链中的变化,研究揭示了文本属性如何随着迭代次数的增加而演变,以及这些变化如何受到初始文本、指令、语言模型和模型大小的影响。特别地,研究引入了统计方法来评估多轮交互对文本属性的额外影响,并估计潜在文化吸引子的存在、位置和强度。这些方法通过线性回归分析,预测了文本属性在传递链末端的值,并据此定义了吸引子的位置和强度。

流程

研究的工作流程包括以下几个关键步骤:

  1. 选择初始文本:从不同数据库中选择科学摘要、新闻文章和社交媒体评论作为初始输入文本。
  2. 定义任务:为LLM代理定义三种不同的任务——重述、获取灵感、继续故事。
  3. 模型选择:使用五种不同的大型语言模型进行实验,包括GPT-3.5、Llama3-8B、Mistral-7B、Llama3-70B和Mixtral-8x7B。
  4. 文本生成:每个LLM代理根据接收到的文本和任务指令生成新的文本,并传递给下一个代理。
  5. 属性测量:在每个传递步骤中,记录文本的毒性、积极性、难度和长度等属性。
  6. 数据分析:通过统计方法分析文本属性的变化,评估多轮交互的影响,并确定吸引子的位置和强度。

应用

这项研究不仅对理解LLM在文化传播中的作用具有重要意义,而且其引入的评估方法和实验设计也可应用于人类文化进化的研究。此外,研究结果对于开发更高效、更少偏见的LLM模型具有指导意义,有助于提升AI在内容生成、教育和媒体等领域的应用质量。