LECODU:人机协作分类中的学习互补与延迟决策新方法

Learning to Complement and to Defer to Multiple Users

摘要

本文介绍了一种名为“Learning to Complement and to Defer to Multiple Users (LECODU)”的新型人工智能方法,旨在解决在分类任务中人机协作的复杂决策问题。LECODU结合了学习互补和学习延迟两种策略,不仅优化了分类准确性,还最小化了用户参与的协作成本。该方法通过在真实世界和合成数据集上的广泛评估,展示了其相对于现有最先进的人机协作分类方法的优越性能,尤其是在用户标注噪声较高的情况下。

Read more...

LETS-C:利用语言嵌入实现高效时间序列分类的新方法

LETS-C: Leveraging Language Embedding for Time Series Classification

摘要

本文介绍了一种名为LETS-C的新型时间序列分类方法,该方法利用语言嵌入模型来处理时间序列数据。传统的基于大型语言模型(LLM)的方法由于模型规模庞大,训练参数数量众多,导致计算成本高昂。LETS-C通过使用语言嵌入模型将时间序列数据嵌入到向量空间中,并结合卷积神经网络(CNN)和多层感知器(MLP)进行分类,显著减少了训练参数的数量,同时保持了高分类准确性。实验结果表明,LETS-C在多个标准时间序列分类基准数据集上达到了最先进的性能,且模型更为轻量级,适用于资源受限的环境。

Read more...

LuSNAR数据集:推动月球探测自主性的新基准

LuSNAR:A Lunar Segmentation, Navigation and Reconstruction Dataset based on Muti-sensor for Autonomous Exploration

摘要

本文介绍了一种名为LuSNAR的新型月球分割、导航和重建数据集,该数据集基于多传感器用于自主探索。随着月球探索任务的复杂性增加,月球探测器需要更高水平的自主性。环境感知和导航算法是实现月球探测器自主探索的基础。为了解决现有月球数据集单一任务、缺乏多样场景和高精度地面真实标签的问题,本文提出了一个多任务、多场景、多标签的月球基准数据集LuSNAR。该数据集可以用于综合评估自主感知和导航系统,包括高分辨率立体图像对、全景语义标签、密集深度图、LiDAR点云和探测器位置。为了提供更丰富的场景数据,本文基于Unreal Engine构建了9个月球模拟场景。每个场景根据地形起伏和物体密度进行划分。为了验证数据集的可用性,本文评估和分析了语义分割、3D重建和自主导航算法。实验结果证明,本文提出的数据集可以用于自主环境感知和导航任务的地面验证,并提供了一个测试算法指标可达性的月球基准数据集。

Read more...

Metron:革新LLM推理系统性能评估的全面框架

Metron: Holistic Performance Evaluation Framework for LLM Inference Systems

摘要

本文介绍了一种名为Metron的全面性能评估框架,用于评估大型语言模型(LLM)推理系统的用户面向性能。当前的评估指标如TTFT、TBT、归一化延迟和TPOT未能充分捕捉LLM推理的复杂性,导致对实时应用如聊天和翻译的用户体验评估不全面。Metron框架引入了新颖的流动性指数(fluidity-index)和流动性令牌生成率(fluid token generation rate),旨在更精确地反映LLM推理过程中的实时用户体验。此外,Metron还对现有的开源和专有LLM推理系统进行了广泛的性能评估,揭示了它们的优缺点。

Read more...

MToMnet:一种新型神经网络用于预测人类信念及其动态变化

Explicit Modelling of Theory of Mind for Belief Prediction in Nonverbal Social Interactions

摘要

本文介绍了一种名为MToMnet的新型神经网络,专门用于从多模态输入中预测人类社交互动中的信念及其动态变化。MToMnet的核心是理论心灵(ToM)模型,这对于有效的非言语人类沟通和协作至关重要。现有的信念建模方法通常未包含显式的ToM建模,或者仅限于一两种模态。MToMnet通过为每个人分别使用一个MindNet来编码上下文线索(如场景视频和物体位置)和个人特定线索(如人类注视和身体语言),从而实现了对信念和信念动态的预测。本文提出的三种MToMnet变体在两个具有挑战性的真实世界数据集上进行了评估,结果显示MToMnet在性能上显著超越了现有方法,同时参数数量大幅减少。这一方法为未来能够从非言语行为中稳健预测人类信念的人工智能系统开辟了新的研究方向,从而更有效地与人类协作。

Read more...

PEER框架:解决特定领域任务的三重困境

PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods

摘要

本文介绍了一种名为PEER的多代理框架,旨在解决特定领域应用中性能、成本和数据隐私的三重困境。PEER框架通过精确的问题分解、高级信息检索、综合总结和严格自我评估,系统化地处理特定领域任务。此外,研究还开发了利用在线数据和用户反馈进行有效模型调优的工业实践,以平衡成本、安全性和性能。实验表明,该方法在金融问答领域达到了GPT-4性能的95.0%,同时有效管理成本并确保数据隐私。

Read more...

PEER框架:解决特定领域任务的三重困境

PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods

摘要

本文介绍了一种名为PEER的多代理框架,旨在解决特定领域应用中性能、成本和数据隐私的三重困境。PEER框架通过精确的问题分解、高级信息检索、全面总结和严格自我评估,系统化地处理特定领域任务。此外,论文还提出了一种定制代理调优策略,通过利用在线数据和用户反馈进行有效模型调优,实现了与GPT-4相媲美的性能,同时有效管理成本和确保数据隐私。

Read more...

ProtoSAM:一次性医学图像分割的新前沿 - 结合原型网络与SAM模型的创新框架

ProtoSAM - One Shot Medical Image Segmentation With Foundational Models

摘要

本文介绍了一种名为ProtoSAM的新框架,用于一次性医学图像分割。该框架结合了原型网络(Prototypical Networks)和Segment Anything Model (SAM),后者是一种自然图像基础模型。ProtoSAM通过使用ALPNet原型网络和DINOv2编码器生成初始粗分割掩码,然后提取提示(如点和边界框)输入到SAM中,以实现高精度的自动分割。该方法在多个医学图像数据集上展示了最先进的结果,且无需对基础模型进行微调。

Read more...

SoftDedup:革新大型语言模型预训练的高效数据重加权方法

SoftDedup: an Efficient Data Reweighting Method for Speeding Up Language Model Pre-training

摘要

本文介绍了一种名为SoftDedup的高效数据重加权方法,旨在加速大型语言模型(LLMs)的预训练过程。该方法通过引入“数据共同性”这一概念,量化数据样本的重复程度,从而在保持数据集完整性的同时,减少高重复度数据的采样权重。实验结果显示,该方法显著提高了训练效率,减少了至少26%的训练步骤,同时提升了下游任务的准确性。此外,该方法在已经严格去重的数据集上也能持续提升性能,表明其具有补充现有去重方法并成为LLMs预训练标准流程的潜力。

Read more...

TCKIN模型:革命性的脓毒症死亡风险预测工具

TCKIN: A Novel Integrated Network Model for Predicting Mortality Risk in Sepsis Patients

摘要

本文介绍了一种名为TCKIN的新型集成网络模型,用于预测脓毒症患者的死亡风险。脓毒症是全球性的健康威胁,每年导致数百万人死亡和巨大的经济成本。准确的死亡风险预测有助于更有效地分配医疗资源,从而提高患者的生存率和生命质量。当前的方法通常只使用一种类型的数据,如常量数据、时间序列数据或ICD代码。本研究通过整合电子健康记录中的时间序列数据和常量数据以及ICD代码,提出了TCKIN模型,该模型在MIMIC-III和MIMIC-IV数据集上的验证结果显示,其预测准确性、敏感性和特异性均优于现有的机器学习和深度学习方法。TCKIN模型通过集成多种数据源和处理技术,实现了在各种评估指标上的卓越性能,为临床决策提供了更可靠的支持。

Read more...
Previous Page 37 of 156 Next Page