探索前沿:条件半监督数据增强在垃圾短信检测中的应用与突破
摘要
本文由Ulin Nuha和Chih-Hsueh Lin共同撰写,探讨了在数据稀缺情况下通过条件半监督数据增强(CSSDA)进行垃圾短信检测的问题。传统的垃圾短信检测方法通常依赖于大量标记数据,而现有的数据增强技术在有效性和鲁棒性方面存在局限。CSSDA模型通过利用未标记数据进行数据增强,扩展了训练数据集,显著提高了垃圾短信检测的性能。实验结果表明,CSSDA在处理不同数量的未标记数据时,都能保持约85%的平衡准确率,显示出其优越的性能和鲁棒性。
Read more...








