ChatGPT在社会计算数据标注中的应用与挑战:GPT-Rater工具的前瞻性探索
摘要
本文探讨了大型语言模型(LLM)如ChatGPT在社会计算任务中作为数据标注工具的潜力,旨在减少网络研究的复杂性和成本。研究通过重新标注七个涵盖COVID-19错误信息、社交机器人欺骗、网络欺凌、点击诱饵新闻和俄乌战争等紧迫社会问题的数据集,评估了ChatGPT的标注能力。结果显示,ChatGPT在数据标注任务中表现出色,平均标注F1分数达到72.00%,尤其在点击诱饵新闻标注中正确率高达89.66%。然而,不同标签间的性能存在显著差异。为此,研究提出了GPT-Rater工具,用于预测ChatGPT在特定标注任务中的表现,该工具在点击诱饵新闻数据集上的平均F1分数达到95.00%,显示出其在辅助研究人员评估ChatGPT标注适用性方面的潜力。
Read more...








