"无需微调，大型语言模型如何通过提示工程实现工具调用功能？"

Posted on 2024-07-06 in CS.AI • 8 words • 1 minute read

Last updated on 2024-07-10

摘要

本文探讨了在大型语言模型（LLMs）中实现工具调用功能的新方法，该方法无需进行微调，仅通过提示工程和巧妙的代码设计即可实现。当前，大多数本地部署的开源LLMs和部分商业模型接口不支持稳定的工具调用功能，而现有的解决方案涉及对LLMs进行微调，这会消耗大量时间和计算资源。本文提出的方法在多个缺乏工具调用功能的LLMs上进行了实验，成功率达到了100%，显著提高了效率和实用性。

原理

本文提出的方法主要通过两个步骤实现工具调用功能：提示注入和工具结果反馈。在提示注入阶段，通过将工具信息和使用工具的提示注入系统提示中，使LLMs能够理解和使用这些工具。工具结果反馈阶段则通过解析工具调用的输出，并将工具返回的内容嵌入回LLMs中，从而实现信息的有效传递和利用。这种方法的关键在于通过动态调整提示，使LLMs能够适应不同的工具库，而无需进行复杂的微调过程。

流程

工作流程包括以下几个步骤：首先，通过提示注入将工具信息和使用指南注入到LLMs的系统提示中；其次，当LLMs接收到用户请求时，根据提示选择合适的工具进行调用；然后，工具调用的结果通过工具结果反馈机制返回给LLMs；最后，LLMs根据返回的结果生成响应。例如，在实验中，LLMs能够成功调用如查询实时天气、执行Python代码等工具，并根据工具返回的结果生成准确的响应。

应用

这种方法的应用前景广泛，特别是在需要快速部署和适应新工具的场景中。例如，在智能客服、自动化任务处理、数据分析等领域，LLMs可以无需微调即可调用各种工具，大大提高了灵活性和效率。此外，这种方法也为开源LLMs的实际应用提供了新的可能性，使得更多的开发者和企业能够利用这些模型进行创新和开发。