创新集成学习与数据增强:提升阿拉伯语推特仇恨言论检测的新方法

Ensemble of pre-trained language models and data augmentation for hate speech detection from Arabic tweets

摘要

本文介绍了一种利用预训练语言模型和数据增强技术进行阿拉伯语推特仇恨言论检测的新方法。该研究针对阿拉伯语推特中的仇恨言论分类问题,提出了基于集成学习和半监督学习的解决方案,有效解决了性能限制和数据不平衡两大挑战。实验结果表明,该方法在仇恨言论检测任务中表现优异,显著提升了检测准确率。

原理

本文提出的方法主要基于集成学习,利用多个预训练的阿拉伯语BERT模型进行微调,以构建基线分类器。通过集成学习,结合多个模型的预测结果,提高了分类的准确性和鲁棒性。此外,采用半监督学习方法,利用已有标签数据进行数据增强,进一步优化了模型性能。这种方法的核心在于通过集成多个高性能的预训练模型,结合数据增强技术,有效提升了仇恨言论检测的准确率。

流程

该方法的工作流程包括四个主要步骤:数据增强、推特预处理、迁移学习和集成学习。首先,通过半监督学习方法对数据进行增强,以解决数据不平衡问题。接着,对推特内容进行预处理,包括去除噪声和标准化文本。然后,利用预训练的语言模型(如AraBert-Large, AraBert-Base, 和MarBert)进行迁移学习。最后,通过集成学习方法(如多数投票和平均投票)结合多个模型的预测结果,得出最终分类结果。例如,在实验中,通过十折交叉验证方法评估模型性能,确保了模型的泛化能力。

应用

该方法在阿拉伯语推特的仇恨言论检测领域具有广泛的应用前景。随着社交媒体的普及,仇恨言论的自动检测成为重要的研究方向,该方法的高准确率和鲁棒性使其在实际应用中具有显著优势。未来,该技术可进一步扩展到其他语言和平台,为社交媒体的内容监管提供技术支持。