"创新AI工具:自动化生成SAPPhIRE模型,提升设计效率与准确性"

Development and Evaluation of a Retrieval-Augmented Generation Tool for Creating SAPPhIRE Models of Artificial Systems

摘要

本文由Anubhab Majumder等人撰写,介绍了如何利用大型语言模型(LLMs)开发和评估一种增强检索生成工具,用于创建人工系统的SAPPhIRE因果模型。SAPPhIRE模型在支持设计类比(DbA)方面被发现非常有用,但创建人工或生物系统的SAPPhIRE模型是一个劳动密集型过程,需要专家从多个技术文档中获取系统工作原理的知识。本文提出的检索增强生成(RAG)工具旨在生成与人工系统的SAPPhIRE构造相关的信息,并初步评估了该工具的成功性,重点关注事实准确性和结果的可靠性。

原理

本文提出的RAG工具的工作原理基于四个主要步骤:知识源嵌入、假设文档嵌入、上下文检索和生成响应。首先,工具使用Wikipedia API检索与用户输入系统相关的知识源文档。然后,通过RecursiveCharacterTextSplitter将这些文档分割成多个文本块,并使用OpenAIEmbeddings模型将这些文本块映射到高维向量表示,存储在ChromaDB中。接下来,工具使用预定义的查询列表(涉及SAPPhIRE模型的七个抽象层次)来检索相关的文本块。为了提高检索效率,工具采用了假设文档嵌入(HyDE)方法,通过LLM生成假设文档,然后使用这些假设文档来优化查询。最后,工具使用另一个LLM模型根据检索到的上下文生成修正的响应。

流程

本文的工作流程如图3所示。首先,工具接收系统名称作为输入,然后检索相关的Wikipedia文章。这些文章被分割成多个文本块并嵌入到向量数据库中。接着,工具使用预定义的查询列表来检索相关的文本块,并使用假设文档嵌入方法来优化查询。最后,工具使用另一个LLM模型根据检索到的上下文生成修正的响应。例如,对于一个电磁阀系统,工具首先生成一个假设的SAPPhIRE模型,然后根据Wikipedia文章中的相关信息进行修正,生成最终的SAPPhIRE模型。

应用

本文提出的RAG工具在设计类比(DbA)领域具有广泛的应用前景。通过自动化生成SAPPhIRE模型,该工具可以大大减少专家在创建系统模型时的工作量,从而提高设计效率。此外,该工具还可以用于教育和培训,帮助学生和工程师更好地理解和应用SAPPhIRE模型。未来,该工具还可以扩展到其他领域,如生物系统建模和复杂系统分析。