BeamAggR:革新知识密集型多跳问答的推理框架

BeamAggR: Beam Aggregation Reasoning over Multi-source Knowledge for Multi-hop Question Answering

摘要

本文介绍了一种名为Beam Aggregation Reasoning (BeamAggR)的推理框架,用于解决知识密集型多跳问答任务中的挑战。该框架通过将复杂问题分解为树状结构,并采用自底向上的推理方法,有效地整合多源知识,探索并优先考虑每个推理步骤中有前景的答案。BeamAggR在四个开放域多跳推理数据集上进行了广泛实验,显著优于现有最先进的方法,平均提升了8.5%的性能,显示出其在知识协作和答案聚合方面的优越性。

Read more...

BMW Agents:多智能体协作框架引领任务自动化新纪元

BMW Agents – A Framework For Task Automation Through Multi-Agent Collaboration

摘要

本文介绍了一种名为BMW Agents的框架,该框架通过多智能体协作实现任务自动化。随着大型语言模型(LLMs)驱动的自主智能体在解决复杂任务、与外部系统交互以增强知识、触发行动等方面的潜力日益显现,多智能体方法在从复杂知识检索系统到下一代机器人流程自动化等众多工业应用中展现出巨大潜力。本文详细阐述了设计一个灵活的智能体工程框架的原则,该框架注重规划和执行,能够处理跨领域的复杂用例应用,并提供了可靠性、可扩展性、灵活性和协作性的技术保证。

Read more...

CANDY基准框架:动态数据摄取下的AKNN算法性能评估与优化

CANDY: A Benchmark for Continuous Approximate Nearest Neighbor Search with Dynamic Data Ingestion

摘要

本文介绍了一项关于连续近似最近邻搜索(AKNN)算法在动态数据摄取环境下的性能评估研究。传统的AKNN算法和基准测试主要关注静态数据集上的检索效果,而忽视了数据更新效率,这在处理持续数据流入时至关重要。为了解决这一问题,研究者引入了CANDY基准框架,该框架综合评估了多种AKNN算法,并集成了机器学习驱动的推理和改进的距离计算方法等高级优化技术。实验结果表明,简单的AKNN基线算法在召回率和延迟方面往往优于更复杂的算法,挑战了算法复杂度对于高性能的必要性的传统观念。此外,研究还强调了现有挑战并揭示了未来的研究机会。CANDY基准框架的代码和数据集已在GitHub上公开,以便于学术和工业界的进一步研究和应用。

Read more...

Cupid:用重新匹配系统提升 MOBA 游戏公平性和位置满意度的创新框架

CUPID: Improving Battle Fairness and Position Satisfaction in Online MOBA Games with a Re-matchmaking System

摘要

本文提出了一种名为 Cupid 的新型框架,通过引入“重新匹配”过程来优化团队和位置分配,以提高公平性和玩家满意度。该框架包括预过滤和预匹配胜率预测模型两个关键步骤,通过同时考虑玩家的位置满意度和游戏公平性,为玩家提供更好的匹配体验。实验结果表明,Cupid 在离线和在线评估中均表现出色,显著提高了位置满意度和游戏公平性。

Read more...

DeepMapper:革命性的人工智能技术推动OpenStreetMap自动更新

ML Updates for OpenStreetMap: Analysis of Research Gaps and Future Directions

摘要

本文探讨了在动态城市景观中维护准确、最新地图的重要性,这些地图支持城市规划、导航和应急响应等多个现代社会方面。传统(主要是手动)的地图制作和众包地图方法难以跟上建筑环境的快速变化。手动地图工作流程耗时且容易出错,导致地图过早过时或需要大量审计。OpenStreetMap(OSM)的当前地图更新过程就是一个例子,它依赖于在线地图更新工作流程中的许多手动步骤。为了解决这个问题,需要探索自动化整个端到端地图更新过程。科技巨头如Google和Microsoft已经开始研究机器学习(ML)技术来解决这个当代地图问题。本文分析了这些ML方法,特别是它们在更新OpenStreetMap中的应用。通过分析该领域的当前最先进技术,本研究确定了关键的研究差距,并介绍了DeepMapper作为一个实际解决方案,用于推进未来的自动在线地图更新过程。

Read more...

DISCO:高效扩散求解器在组合优化问题中的突破性应用

DISCO: Efficient Diffusion Solver for Large-Scale Combinatorial Optimization Problems

摘要

本文介绍了一种名为DISCO的高效扩散求解器,用于解决大规模组合优化问题(CO)。DISCO在解决方案质量和推理速度方面表现出色,通过一种可解析求解的形式实现快速去噪,从而大幅减少推理时间。此外,DISCO通过引入解决方案残差,将采样空间限制在一个更有意义、更受约束的域内,同时保持输出概率分布的固有多模态特性。DISCO在处理包含10000个节点的超大规模旅行商问题(TSP)和具有挑战性的最大独立集基准测试中取得了最先进的结果,其单实例去噪时间比现有方法快达44.8倍。通过进一步结合分治策略,DISCO能够直接解决任意规模的实例,甚至超越专门针对相应规模训练的模型。

Read more...

Edge-DIRECT:革新电动车辆路径优化的新方法

Edge-DIRECT: A Deep Reinforcement Learning-based Method for Solving Heterogeneous Electric Vehicle Routing Problem with Time Window Constraints

摘要

本文针对发达国家的碳中和政策背景下,物流公司面临的电动车辆路径优化问题,特别是异构电动车辆路径问题(HEVRPTW)进行了研究。HEVRPTW考虑了车辆的不同属性和客户对配送时间窗口的需求,是一个NP难优化问题。本文提出了一种基于深度强化学习(DRL)的方法——Edge-DIRECT,该方法通过增强的图表示和双注意力机制来解决这一问题,显著提高了路径规划的质量和执行效率。实验结果表明,Edge-DIRECT在解决HEVRPTW问题上优于现有的DRL方法和启发式方法。

Read more...

LLaRA:将视觉语言模型转化为强大的机器人动作策略

LLaRA: Supercharging Robot Learning Data for Vision-Language Policy

摘要

本文提出了一种名为 LLaRA 的框架,将机器人动作策略公式化为对话,并在使用辅助数据进行训练时提供改进的响应。通过将行为克隆数据集转换为指令数据集,并利用视觉语言模型进行微调,该框架能够处理多样化的视觉运动控制挑战。实验结果表明,该框架在多个模拟和真实世界环境中表现出了最先进的性能。

Read more...

MedGaze:革新放射学的人工智能系统,精准预测胸部X光扫描路径

Multimodal Learning and Cognitive Processes in Radiology: MedGaze for Chest X-ray Scanpath Prediction

摘要

本文介绍了一种名为MedGaze的人工智能系统,旨在模拟放射科医生的认知过程并预测胸部X光片(CXR)上的扫描路径。该系统通过分析放射科医生在解读CXR图像时的眼动数据,利用多模态学习方法生成类似人类的扫描路径和注视持续时间。MedGaze在多个公开数据集上表现优异,显著超越了现有技术水平,显示出在提高诊断准确性和效率方面的巨大潜力。

Read more...

MetaDesigner:AI驱动下的艺术字体合成革命

MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis

摘要

MetaDesigner是一项革命性的艺术字体合成框架,利用大型语言模型(LLMs)的优势,推动以用户为中心的设计范式。该框架的核心是一个多智能体系统,包括Pipeline、Glyph和Texture智能体,共同实现从语义增强到复杂纹理施加的定制化WordArt创作。MetaDesigner集成了全面的反馈机制,利用多模态模型和用户评估的洞察力,迭代地精炼和增强设计过程。通过这种反馈循环,系统能够巧妙地调整超参数,以符合用户定义的风格和主题偏好,生成不仅满足而且超越用户对视觉吸引力和上下文相关性期望的WordArt。实证验证强调了MetaDesigner有效服务于多样化WordArt应用的能力,持续产生美学上吸引人且上下文敏感的结果。

Read more...
Previous Page 122 of 156 Next Page