探索LLMs在人力资源支持中的应用:优化检索增强问答聊天机器人
摘要
本文探讨了利用大型语言模型(LLMs)和人在回路(Human-in-the-Loop)方法优化和评估增强检索的问答聊天机器人的过程。通过与SAP SE的领域专家合作,开发了一个用于处理员工查询的高效人力资源支持聊天机器人。研究重点包括数据集收集、提示优化和生成输出的评估,通过增强LLM驱动的聊天机器人的响应质量和探索替代检索方法,创建了一个高效、可扩展和灵活的工具。实验和评估结果表明,GPT-4在性能上优于其他模型,并能通过内部推理能力克服数据不一致性。此外,通过专家分析,发现无参考评估指标如GEval和Prometheus与人类评估的可靠性高度一致。
Read more...








