探索大型语言模型在工程设计中的应用:如何通过检索增强生成提升技术内容的准确性
摘要
本文探讨了如何使用大型语言模型(LLM)生成与SAPPhIRE因果模型相关的技术内容。由于LLM未明确训练于SAPPhIRE本体定义,且存在幻觉问题,本文提出了一种使用检索增强生成(RAG)方法来抑制幻觉,从而生成基于科学信息的技术内容。研究结果表明,选择合适的参考知识作为LLM生成内容的上下文至关重要。该研究为构建生成特定技术系统SAPPhIRE模型的软件支持工具提供了基础。
原理
本文的核心在于利用检索增强生成(RAG)方法来优化大型语言模型(LLM)在生成与SAPPhIRE模型相关技术内容时的准确性。RAG通过整合外部知识源,为LLM提供了一个“上下文”,确保生成的信息基于参考知识。这种方法允许LLM访问超出其训练数据的信息,从而减少幻觉现象,提高生成内容的准确性和相关性。
流程
研究通过三个数值实验来验证参考知识选择对LLM生成内容的影响。每个实验都涉及特定的科学现象,如蒸发和塞贝克效应产生的电磁场。实验中,LLM根据提供的不同上下文生成技术内容,并通过计算LLM响应与假设的“真实”知识之间的余弦相似度来评估响应的准确性。实验结果显示,使用特定上下文(如Context-1)生成的内容与真实知识的相似度显著高于无上下文或不同上下文(如Context-2)生成的内容。
应用
该研究不仅限于理论探讨,还旨在开发一个软件工具,用于生成与SAPPhIRE模型相关的技术内容。这一工具的应用前景广泛,特别是在工程设计和系统分析领域,能够帮助设计师和工程师更准确地理解和模拟复杂系统的因果关系。此外,该方法还可扩展到其他领域,如生物医学工程和环境科学,以支持基于因果模型的创新设计和技术开发。
