创新集成学习与数据增强:提升阿拉伯语推特仇恨言论检测的新方法

Ensemble of pre-trained language models and data augmentation for hate speech detection from Arabic tweets

摘要

本文介绍了一种利用预训练语言模型和数据增强技术进行阿拉伯语推特仇恨言论检测的新方法。该研究针对阿拉伯语推特中的仇恨言论分类问题,提出了基于集成学习和半监督学习的解决方案,有效解决了性能限制和数据不平衡两大挑战。实验结果表明,该方法在仇恨言论检测任务中表现优异,显著提升了检测准确率。

Read more...

利用大型语言模型和医学知识增强放射学文本表示:一种创新的两阶段框架

Extracting and Encoding: Leveraging Large Language Models and Medical Knowledge to Enhance Radiological Text Representation

摘要

本文介绍了一种新颖的两阶段框架,旨在从自由文本的放射学报告中提取高质量的事实陈述,以改进文本编码器的表示,并提高其在各种下游任务中的性能。第一阶段使用大型语言模型(LLMs)从精心策划的领域特定数据集中识别事实陈述。第二阶段引入了一个基于BERT模型的Fact Encoder(CXRFE),该模型通过使用提取的事实数据改进其表示。此外,该框架还包括一个新的基于嵌入的度量标准(CXRFEScore),用于评估胸部X射线文本生成系统。广泛的评估显示,我们的事实提取器和编码器在句子排序、自然语言推理和从放射学报告中提取标签等任务中优于当前最先进的方法。此外,我们的度量标准被证明比放射学报告生成文献中常用的现有度量标准更健壮和有效。

Read more...

地下停车场自主驾驶技术的新突破:占用网格网络的应用与前景

Research on Reliable and Safe Occupancy Grid Prediction in Underground Parking Lots

摘要

本文针对地下停车场这一特定场景,探讨了自主驾驶技术中的可靠性和安全性问题。通过使用CARLA模拟平台创建真实的停车模型,利用占用网格网络处理数据,预测车辆路径和障碍物,从而增强系统在复杂室内环境中的感知能力。该研究填补了室内停车环境在自主驾驶研究中的空白,为实现更广泛的自主驾驶场景提供了参考。

Read more...

实时监控驾驶安全:基于改进YOLOv8的分心驾驶行为检测技术

Research on target detection method of distracted driving behavior based on improved YOLOv8

摘要

本文针对分心驾驶行为检测的高精度需求,提出了一种基于改进YOLOv8的目标检测方法。该方法通过集成BoTNet模块、GAM注意力机制和EIoU损失函数,优化了特征提取和多尺度特征融合策略,显著提高了检测的准确性和效率。实验结果表明,改进后的模型在检测速度和准确性上表现优异,准确率达到99.4%,模型体积更小,易于部署,能够实时识别和分类分心驾驶行为,及时发出警告,增强驾驶安全。

Read more...

工业智能新纪元:自动化知识图谱学习框架的革命性应用

Automated Knowledge Graph Learning in Industrial Processes

摘要

本文介绍了一种用于工业过程中自动化知识图谱学习的新框架,该框架能够从时间序列数据中提取有意义的关系和洞察。工业过程产生大量时间序列数据,但从中提取有意义的关系和洞察仍然是一个挑战。本文提出的框架通过将原始数据转换为知识图谱(KGs),改善了决策制定、过程优化和知识发现。此外,该框架采用Granger因果关系来识别关键属性,这些属性可以用于设计预测模型。通过一个实际的工业用例,本文展示了该框架在实际工业场景中的应用和效益。

Read more...

开源小规模GLMs在自动文本评分中的应用与挑战

Automated Text Scoring in the Age of Generative AI for the GPU-poor

摘要

本文由Christopher Ormerod和Alexander Kwako共同撰写,探讨了在资源有限的条件下,使用开源的小规模生成语言模型(GLMs)进行自动文本评分(ATS)的性能和效率。研究结果表明,通过微调,这些GLMs能够达到虽非最先进但足够的表现水平。此外,研究还尝试通过提示GLMs解释其评分,分析模型生成反馈的能力,显示出一定的潜力,但需要更严格的评估,特别是在特定使用案例中。

Read more...

强化学习与机器伦理:系统性回顾及其未来展望

Reinforcement Learning and Machine ethics:a systematic review

摘要

本文《Reinforcement Learning and Machine ethics: a systematic review》由Ajay Vishwanath, Louise A. Dennis和Marija Slavkovik共同撰写,系统地回顾了强化学习(RL)在机器伦理中的应用。文章指出,尽管机器伦理领域已有一些系统性回顾,但它们往往未涵盖使用强化学习代理作为实现伦理行为实体的研究。本文旨在填补这一空白,通过分析62篇相关论文,探讨了伦理规范、强化学习组件和框架以及用于实现伦理行为的环境。文章强调了强化学习在机器伦理中的趋势,并提出了未来研究的方向,以确保这一新兴研究领域的负责任和可持续发展。

Read more...

探索AI分类器中的数据隐私问题:数据混淆技术的应用与前景

Footprints of Data in a Classifier Model: The Privacy Issues and Their Mitigation through Data Obfuscation

摘要

本文探讨了在分类器模型中数据足迹的隐私问题及其通过数据混淆的缓解措施。随着AI的广泛部署,其安全性与隐私问题日益凸显。根据GDPR的第17条,数据主体有权要求控制者无不当延迟地删除与其相关的个人数据。然而,现有研究主要集中在消除敏感数据属性上,而对数据在预测模型中的被动妥协方式尚未得到充分认识和解决。本文通过实证研究,分析了不同分类器的脆弱性,并提出通过数据混淆技术来减少这些脆弱性,同时探讨了隐私与性能之间的权衡,以评估数据混淆技术的实用性。

Read more...

探索DreamDiffusion:将脑电波转换为图像的新方法,为脑损伤患者带来希望

A Novel Approach to Image EEG Sleep Data for Improving Quality of Life in Patients Suffering From Brain Injuries Using DreamDiffusion

摘要

本文介绍了一种名为DreamDiffusion的创新方法,旨在通过将脑电图(EEG)信号转换为图像,以改善遭受脑损伤患者的生命质量。传统的EEG信号只能转换为文本,而DreamDiffusion利用开源模型,直接将脑波转换为图像,从而更深入地理解昏迷患者的思维。该方法通过提取EEG信号的特征,并使用StableDiffusion生成图像,进一步改进了StableDiffusion在波到媒体转换中的技术领先地位。此外,研究还简化了模型的设置过程,使其更易于研究人员使用,并提供了原始训练数据文件,以便用户无需购买必要的计算能力来训练模型。

Read more...

探索ECAT:一种创新的跨域推荐系统框架,引领推荐技术新潮流

ECAT: A Entire space Continual and Adaptive Transfer Learning Framework for Cross-Domain Recommendation

摘要

本文介绍了一种名为ECAT(Entire space Continual and Adaptive Transfer Learning Framework)的跨域推荐系统框架。该框架主要解决工业推荐系统中,由于用户兴趣和需求多样性导致的样本空间仅为整个空间的一小部分,从而难以训练高效模型的问题。ECAT通过两个核心组件——样本转移和自适应知识蒸馏,实现了对整个空间样本和表示的充分利用,同时避免了负迁移。实验结果显示,ECAT在淘宝的实际工业数据集上显著提升了推荐性能,为淘宝的一个著名小程序带来了+13.6%的转化率和+8.6%的订单量。

Read more...
Previous Page 95 of 156 Next Page