HLTP++:仿人认知驱动的自动驾驶轨迹预测模型

Less is More: Efficient Brain-Inspired Learning for Autonomous Driving Trajectory Prediction

摘要

本文介绍了一种名为HLTP++的仿人轨迹预测模型,该模型专为自动驾驶车辆设计,旨在提高对周围车辆轨迹预测的准确性和安全性。HLTP++模型通过模拟人类驾驶员的认知过程,采用了一种新颖的师生知识蒸馏框架,其中“教师”模型通过自适应视觉扇区模拟人类驾驶员的动态注意力分配,而“学生”模型则专注于实时交互和人类决策过程。此外,通过引入一种新的傅里叶自适应尖峰神经网络(FA-SNN),该模型能够在减少参数的同时实现更快更精确的预测。在NGSIM、HighD和MoCAD等基准测试中,HLTP++模型表现优于现有模型,显著降低了预测轨迹误差,并展示了在数据缺失环境下的强大适应性。这标志着向完全自动驾驶系统迈进的重要一步。

Read more...

iASiS项目:引领个性化医学的大数据分析革命

iASiS: Towards Heterogeneous Big Data Analysis for Personalized Medicine

摘要

本文介绍的iASiS项目旨在通过整合来自不同来源的生物医学大数据,包括基因组学、电子健康记录和文献,应用先进的分析方法来发现有用的模式,从而为决策者提供可操作的知识。该项目的目标是将大量可用数据转化为可操作的信息,以支持公共卫生活动的规划和政策制定。通过整合和分析这些异构信息源,iASiS项目能够为每个个体提供个性化的诊断和治疗决策。

Read more...

LECODU:人机协作分类中的学习互补与延迟决策新方法

Learning to Complement and to Defer to Multiple Users

摘要

本文介绍了一种名为“Learning to Complement and to Defer to Multiple Users (LECODU)”的新型人工智能方法,旨在解决在分类任务中人机协作的复杂决策问题。LECODU结合了学习互补和学习延迟两种策略,不仅优化了分类准确性,还最小化了用户参与的协作成本。该方法通过在真实世界和合成数据集上的广泛评估,展示了其相对于现有最先进的人机协作分类方法的优越性能,尤其是在用户标注噪声较高的情况下。

Read more...

LETS-C:利用语言嵌入实现高效时间序列分类的新方法

LETS-C: Leveraging Language Embedding for Time Series Classification

摘要

本文介绍了一种名为LETS-C的新型时间序列分类方法,该方法利用语言嵌入模型来处理时间序列数据。传统的基于大型语言模型(LLM)的方法由于模型规模庞大,训练参数数量众多,导致计算成本高昂。LETS-C通过使用语言嵌入模型将时间序列数据嵌入到向量空间中,并结合卷积神经网络(CNN)和多层感知器(MLP)进行分类,显著减少了训练参数的数量,同时保持了高分类准确性。实验结果表明,LETS-C在多个标准时间序列分类基准数据集上达到了最先进的性能,且模型更为轻量级,适用于资源受限的环境。

Read more...

LuSNAR数据集:推动月球探测自主性的新基准

LuSNAR:A Lunar Segmentation, Navigation and Reconstruction Dataset based on Muti-sensor for Autonomous Exploration

摘要

本文介绍了一种名为LuSNAR的新型月球分割、导航和重建数据集,该数据集基于多传感器用于自主探索。随着月球探索任务的复杂性增加,月球探测器需要更高水平的自主性。环境感知和导航算法是实现月球探测器自主探索的基础。为了解决现有月球数据集单一任务、缺乏多样场景和高精度地面真实标签的问题,本文提出了一个多任务、多场景、多标签的月球基准数据集LuSNAR。该数据集可以用于综合评估自主感知和导航系统,包括高分辨率立体图像对、全景语义标签、密集深度图、LiDAR点云和探测器位置。为了提供更丰富的场景数据,本文基于Unreal Engine构建了9个月球模拟场景。每个场景根据地形起伏和物体密度进行划分。为了验证数据集的可用性,本文评估和分析了语义分割、3D重建和自主导航算法。实验结果证明,本文提出的数据集可以用于自主环境感知和导航任务的地面验证,并提供了一个测试算法指标可达性的月球基准数据集。

Read more...

Metron:革新LLM推理系统性能评估的全面框架

Metron: Holistic Performance Evaluation Framework for LLM Inference Systems

摘要

本文介绍了一种名为Metron的全面性能评估框架,用于评估大型语言模型(LLM)推理系统的用户面向性能。当前的评估指标如TTFT、TBT、归一化延迟和TPOT未能充分捕捉LLM推理的复杂性,导致对实时应用如聊天和翻译的用户体验评估不全面。Metron框架引入了新颖的流动性指数(fluidity-index)和流动性令牌生成率(fluid token generation rate),旨在更精确地反映LLM推理过程中的实时用户体验。此外,Metron还对现有的开源和专有LLM推理系统进行了广泛的性能评估,揭示了它们的优缺点。

Read more...

MToMnet:一种新型神经网络用于预测人类信念及其动态变化

Explicit Modelling of Theory of Mind for Belief Prediction in Nonverbal Social Interactions

摘要

本文介绍了一种名为MToMnet的新型神经网络,专门用于从多模态输入中预测人类社交互动中的信念及其动态变化。MToMnet的核心是理论心灵(ToM)模型,这对于有效的非言语人类沟通和协作至关重要。现有的信念建模方法通常未包含显式的ToM建模,或者仅限于一两种模态。MToMnet通过为每个人分别使用一个MindNet来编码上下文线索(如场景视频和物体位置)和个人特定线索(如人类注视和身体语言),从而实现了对信念和信念动态的预测。本文提出的三种MToMnet变体在两个具有挑战性的真实世界数据集上进行了评估,结果显示MToMnet在性能上显著超越了现有方法,同时参数数量大幅减少。这一方法为未来能够从非言语行为中稳健预测人类信念的人工智能系统开辟了新的研究方向,从而更有效地与人类协作。

Read more...

PEER框架:解决特定领域任务的三重困境

PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods

摘要

本文介绍了一种名为PEER的多代理框架,旨在解决特定领域应用中性能、成本和数据隐私的三重困境。PEER框架通过精确的问题分解、高级信息检索、综合总结和严格自我评估,系统化地处理特定领域任务。此外,研究还开发了利用在线数据和用户反馈进行有效模型调优的工业实践,以平衡成本、安全性和性能。实验表明,该方法在金融问答领域达到了GPT-4性能的95.0%,同时有效管理成本并确保数据隐私。

Read more...

PEER框架:解决特定领域任务的三重困境

PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods

摘要

本文介绍了一种名为PEER的多代理框架,旨在解决特定领域应用中性能、成本和数据隐私的三重困境。PEER框架通过精确的问题分解、高级信息检索、全面总结和严格自我评估,系统化地处理特定领域任务。此外,论文还提出了一种定制代理调优策略,通过利用在线数据和用户反馈进行有效模型调优,实现了与GPT-4相媲美的性能,同时有效管理成本和确保数据隐私。

Read more...

ProtoSAM:一次性医学图像分割的新前沿 - 结合原型网络与SAM模型的创新框架

ProtoSAM - One Shot Medical Image Segmentation With Foundational Models

摘要

本文介绍了一种名为ProtoSAM的新框架,用于一次性医学图像分割。该框架结合了原型网络(Prototypical Networks)和Segment Anything Model (SAM),后者是一种自然图像基础模型。ProtoSAM通过使用ALPNet原型网络和DINOv2编码器生成初始粗分割掩码,然后提取提示(如点和边界框)输入到SAM中,以实现高精度的自动分割。该方法在多个医学图像数据集上展示了最先进的结果,且无需对基础模型进行微调。

Read more...
Previous Page 37 of 156 Next Page