革新生物医学问答:利用生成语言模型提升答案的准确性与可靠性
摘要
本文介绍了一种生物医学领域的检索增强生成(RAG)系统,旨在提高在线用户问题答案的准确性和可靠性。该系统通过微调的大型语言模型(LLM)进行参考问题回答,其中从PubMed检索的相关摘要作为输入传递给LLM的上下文。系统的输出是基于PubMed摘要的答案,每个陈述都相应地引用了来源,允许用户验证答案。与PubMed搜索引擎相比,该检索系统实现了23%的绝对改进。基于小样本的手动评估,我们的微调LLM组件在引用相关摘要方面与GPT-4 Turbo取得了可比的结果。我们公开了用于微调模型的数据集以及基于Mistral-7B-instruct-v0.1和v0.2的微调模型。
Read more...








