探索GPT-4在公共卫生中的应用:如何帮助检测戒烟意图?
摘要
本文探讨了使用OpenAI的最新大型语言模型GPT-4来检测Reddit用户戒烟意图的可行性。随着电子烟在美国青少年中的流行,了解用户的戒烟意图对于公共卫生至关重要。研究通过从Reddit的r/QuitVaping子社区提取数据,利用GPT-4进行句子级别的戒烟意图检测,并与普通人和临床专家的标注结果进行比较。研究采用不同的提示策略,如零样本、单样本、少样本和思维链提示,以评估GPT-4在社交媒体数据分析中的潜力,特别是在识别用户微妙意图方面的能力。
原理
GPT-4是一种先进的生成预训练转换器模型,它通过深度学习从大量文本数据中学习语言模式。在本次研究中,GPT-4被训练来识别和标注表达戒烟意图的句子。模型通过分析句子的语义和上下文,结合预设的提示策略,如零样本、单样本、少样本和思维链提示,来判断用户是否表达了戒烟的意图。GPT-4的先进性在于其能够处理复杂的自然语言理解任务,即使在缺乏大量标注数据的情况下也能有效工作。
流程
研究首先从Reddit的r/QuitVaping子社区收集并清洗数据,然后由普通标注者、临床专家和GPT-4模型进行标注。通过比较不同标注者的结果,特别是使用临床专家的标注作为基准,评估GPT-4的性能。研究中使用了8种不同的提示策略,包括不同程度的详细信息和示例数量,以探索最有效的提示方法。例如,高细节提示(P5-P8)在准确性和F1分数上表现更好,而低细节提示(P1-P4)在召回率上表现更佳。
应用
GPT-4在检测戒烟意图方面的应用前景广阔,特别是在公共卫生领域,可以帮助识别和干预有戒烟需求的用户。此外,该技术还可扩展到其他健康相关的社交媒体分析,如药物滥用、饮食习惯等,为公共卫生政策制定和干预提供数据支持。
