地下停车场自主驾驶技术的新突破:占用网格网络的应用与前景

Research on Reliable and Safe Occupancy Grid Prediction in Underground Parking Lots

摘要

本文针对地下停车场这一特定场景,探讨了自主驾驶技术中的可靠性和安全性问题。通过使用CARLA模拟平台创建真实的停车模型,利用占用网格网络处理数据,预测车辆路径和障碍物,从而增强系统在复杂室内环境中的感知能力。该研究填补了室内停车环境在自主驾驶研究中的空白,为实现更广泛的自主驾驶场景提供了参考。

Read more...

实时监控驾驶安全:基于改进YOLOv8的分心驾驶行为检测技术

Research on target detection method of distracted driving behavior based on improved YOLOv8

摘要

本文针对分心驾驶行为检测的高精度需求,提出了一种基于改进YOLOv8的目标检测方法。该方法通过集成BoTNet模块、GAM注意力机制和EIoU损失函数,优化了特征提取和多尺度特征融合策略,显著提高了检测的准确性和效率。实验结果表明,改进后的模型在检测速度和准确性上表现优异,准确率达到99.4%,模型体积更小,易于部署,能够实时识别和分类分心驾驶行为,及时发出警告,增强驾驶安全。

Read more...

工业智能新纪元:自动化知识图谱学习框架的革命性应用

Automated Knowledge Graph Learning in Industrial Processes

摘要

本文介绍了一种用于工业过程中自动化知识图谱学习的新框架,该框架能够从时间序列数据中提取有意义的关系和洞察。工业过程产生大量时间序列数据,但从中提取有意义的关系和洞察仍然是一个挑战。本文提出的框架通过将原始数据转换为知识图谱(KGs),改善了决策制定、过程优化和知识发现。此外,该框架采用Granger因果关系来识别关键属性,这些属性可以用于设计预测模型。通过一个实际的工业用例,本文展示了该框架在实际工业场景中的应用和效益。

Read more...

开源小规模GLMs在自动文本评分中的应用与挑战

Automated Text Scoring in the Age of Generative AI for the GPU-poor

摘要

本文由Christopher Ormerod和Alexander Kwako共同撰写,探讨了在资源有限的条件下,使用开源的小规模生成语言模型(GLMs)进行自动文本评分(ATS)的性能和效率。研究结果表明,通过微调,这些GLMs能够达到虽非最先进但足够的表现水平。此外,研究还尝试通过提示GLMs解释其评分,分析模型生成反馈的能力,显示出一定的潜力,但需要更严格的评估,特别是在特定使用案例中。

Read more...

强化学习与机器伦理:系统性回顾及其未来展望

Reinforcement Learning and Machine ethics:a systematic review

摘要

本文《Reinforcement Learning and Machine ethics: a systematic review》由Ajay Vishwanath, Louise A. Dennis和Marija Slavkovik共同撰写,系统地回顾了强化学习(RL)在机器伦理中的应用。文章指出,尽管机器伦理领域已有一些系统性回顾,但它们往往未涵盖使用强化学习代理作为实现伦理行为实体的研究。本文旨在填补这一空白,通过分析62篇相关论文,探讨了伦理规范、强化学习组件和框架以及用于实现伦理行为的环境。文章强调了强化学习在机器伦理中的趋势,并提出了未来研究的方向,以确保这一新兴研究领域的负责任和可持续发展。

Read more...

探索AI分类器中的数据隐私问题:数据混淆技术的应用与前景

Footprints of Data in a Classifier Model: The Privacy Issues and Their Mitigation through Data Obfuscation

摘要

本文探讨了在分类器模型中数据足迹的隐私问题及其通过数据混淆的缓解措施。随着AI的广泛部署,其安全性与隐私问题日益凸显。根据GDPR的第17条,数据主体有权要求控制者无不当延迟地删除与其相关的个人数据。然而,现有研究主要集中在消除敏感数据属性上,而对数据在预测模型中的被动妥协方式尚未得到充分认识和解决。本文通过实证研究,分析了不同分类器的脆弱性,并提出通过数据混淆技术来减少这些脆弱性,同时探讨了隐私与性能之间的权衡,以评估数据混淆技术的实用性。

Read more...

探索DreamDiffusion:将脑电波转换为图像的新方法,为脑损伤患者带来希望

A Novel Approach to Image EEG Sleep Data for Improving Quality of Life in Patients Suffering From Brain Injuries Using DreamDiffusion

摘要

本文介绍了一种名为DreamDiffusion的创新方法,旨在通过将脑电图(EEG)信号转换为图像,以改善遭受脑损伤患者的生命质量。传统的EEG信号只能转换为文本,而DreamDiffusion利用开源模型,直接将脑波转换为图像,从而更深入地理解昏迷患者的思维。该方法通过提取EEG信号的特征,并使用StableDiffusion生成图像,进一步改进了StableDiffusion在波到媒体转换中的技术领先地位。此外,研究还简化了模型的设置过程,使其更易于研究人员使用,并提供了原始训练数据文件,以便用户无需购买必要的计算能力来训练模型。

Read more...

探索ECAT:一种创新的跨域推荐系统框架,引领推荐技术新潮流

ECAT: A Entire space Continual and Adaptive Transfer Learning Framework for Cross-Domain Recommendation

摘要

本文介绍了一种名为ECAT(Entire space Continual and Adaptive Transfer Learning Framework)的跨域推荐系统框架。该框架主要解决工业推荐系统中,由于用户兴趣和需求多样性导致的样本空间仅为整个空间的一小部分,从而难以训练高效模型的问题。ECAT通过两个核心组件——样本转移和自适应知识蒸馏,实现了对整个空间样本和表示的充分利用,同时避免了负迁移。实验结果显示,ECAT在淘宝的实际工业数据集上显著提升了推荐性能,为淘宝的一个著名小程序带来了+13.6%的转化率和+8.6%的订单量。

Read more...

探索Meta 3D Gen:革命性的文本到3D生成技术

Meta 3D Gen

摘要

Meta 3D Gen(3DGen)是一项尖端技术,旨在通过文本描述快速生成高质量的3D资产。该技术解决了从文本到3D内容生成的问题,这在视频游戏、增强现实和虚拟现实应用以及电影特效设计中是一个耗时且具有挑战性的过程。3DGen通过集成Meta 3D AssetGen和Meta 3D TextureGen两个关键组件,实现了在不到一分钟内生成具有高提示保真度和高质量形状及纹理的3D资产。此外,3DGen支持物理基础渲染(PBR),这对于真实世界应用中的3D资产重新照明至关重要。该技术的前景在于其能够支持个性化、用户生成的3D内容创建,以及在虚拟现实和增强现实中的广泛应用。

Read more...

探索Nollywood电影中的语音识别与毒性检测:一项前沿研究

Nollywood: Let"s Go to the Movies!

摘要

本文探讨了尼日利亚英语电影(Nollywood)中的语音识别(ASR)和毒性检测(TX)问题。由于尼日利亚英语的方言特性,这些电影对许多英语母语者来说难以理解。论文提出了一个先进的语音识别模型,旨在将尼日利亚英语翻译成美国英语,并使用最新的毒性检测技术来评估电影中的语言毒性。研究旨在提高对这些视频中经常被忽视的文本的理解,因为许多尼日利亚人在家中使用豪萨语等本土语言。

Read more...
Previous Page 95 of 156 Next Page