探索优先经验回放在强化学习中的效能与局限

Investigating the Interplay of Prioritized Replay and Generalization

摘要

本文探讨了在强化学习中广泛使用的经验回放技术,特别是优先经验回放(PER)的效能和适用性。通过一系列精心设计的实验,研究了PER在预测任务和控制任务中的表现,特别是在结合神经网络进行函数近似时的行为。研究发现,尽管PER在表格设置中能有效提升价值传播,但在与神经网络结合时,其性能通常不优于均匀回放。此外,本文还引入了基于梯度TD方法的预期PER算法,该算法在某些情况下表现更为稳定,但总体上仍未显示出对均匀回放的明显优势。

Read more...

探索新型超表达激活函数PEUAF:在工业与图像数据集中的应用与性能验证

Don"t Fear Peculiar Activation Functions: EUAF and Beyond

摘要

本文提出了一种名为参数化基本通用激活函数(PEUAF)的新型超表达激活函数,并通过在多个工业和图像数据集(包括CIFAR10、Tiny-ImageNet和ImageNet)上进行的系统性和综合性实验,展示了其有效性。此外,本文还显著扩展了超表达激活函数系列,证明了任何连续函数都可以通过具有特定超表达激活函数的固定大小网络以任意期望的精度进行近似。具体而言,本文解决了阻碍超表达激活函数发展的两个主要瓶颈:超表达函数的有限识别,这引发了对其广泛适用性的怀疑;以及它们通常奇特的形式,这导致了对其在实际应用中的可扩展性和实用性的怀疑。

Read more...

诊断与重学习:平衡多模态学习的新策略

Diagnosing and Re-learning for Balanced Multimodal Learning

摘要

本文由Yake Wei等人在中国人民大学高岭人工智能学院提出,针对多模态学习中的不平衡问题,即模型倾向于特定模态的训练,提出了一种名为“诊断与重学习”的方法。该方法通过评估每个模态的单模态表示空间的可分离性来估计学习状态,并据此软重初始化相应的单模态编码器,从而避免了对信息量少的模态的过度强调,同时增强了较差学习的模态的编码器,有效地平衡和增强了多模态学习。实验结果显示,该方法在多种模态和多模态框架中表现出色,源代码和数据集已公开。

Read more...

"AI驱动的新型仓库布局生成框架:提升效率与生产力的未来解决方案"

A Novel Framework for Automated Warehouse Layout Generation

摘要

本文介绍了一种新颖的自动化仓库布局生成框架,该框架由Alberta Machine Intelligence Institute(Amii)和Routeique Inc的研究人员共同开发。该框架采用约束束搜索算法,旨在优化仓库布局,以提高效率和生产力。通过考虑空间参数、功能需求和布局可行性,该框架能够生成符合多种仓库尺寸、形状和门位置的优化布局。此外,通过使用评分函数评估布局的存储位置数量、访问点和可达性成本,该框架能够帮助仓库设计师快速探索和确认选项,从而选择最适合其使用场景的布局。

Read more...

"ALISE:开创性的卫星图像时间序列编码器,推动地球监测技术的进步"

Paving the way toward foundation models for irregular and unaligned Satellite Image Time Series

摘要

本文介绍了一种名为ALISE的新型卫星图像时间序列(SITS)编码器,旨在解决实际应用中卫星遥感图像处理的主要挑战。ALISE通过利用SITS的空间、光谱和时间维度,生成对齐的潜在表示,这些表示在时间上是固定的,不需要进一步训练即可用于下游任务。与现有的自监督学习(SSL)模型不同,ALISE采用了一种灵活的查询机制,将SITS投影到一个共同的学习时间投影空间中。此外,通过多视图框架,ALISE结合了实例判别和掩码自编码任务,以探索SITS的集成。评估结果显示,使用对齐表示比以前的SSL方法在分割任务中更有效,并且ALISE表示也适用于变化检测。

Read more...

"Attritable MCTS:应对智能体频繁失败的分散式多智能体规划新算法"

United We Stand: Decentralized Multi-Agent Planning With Attrition

摘要

本文提出了一种名为Attritable MCTS (A-MCTS)的新型分散式多智能体规划算法,旨在解决在智能体频繁失败的真实大规模部署场景中,现有的分散式规划方法表现不佳的问题。A-MCTS通过使用全局奖励函数来估计每个智能体的局部贡献,并利用后悔匹配(Regret Matching, RM)进行协调,能够及时且高效地适应活动智能体集合的变化。本文通过在不同的信息收集问题场景中评估其有效性,展示了A-MCTS在智能体高失败率下仍能实现高效适应的理论和实验结果。结果表明,在频繁失败的情况下,我们的解决方案在全局效用和可扩展性方面显著优于现有最佳方法。

Read more...

"DenseFusion-1M:引领多模态感知新纪元"

DenseFusion-1M: Merging Vision Experts for Comprehensive Multimodal Perception

摘要

本文介绍了一种名为DenseFusion-1M的新型数据集,该数据集通过整合视觉专家的见解和采用低成本但高效的标题引擎,为图像生成全面且准确的描述。DenseFusion-1M数据集包含100万张高代表性的未筛选LAION数据集图像,通过Perceptual Fusion技术生成密集描述。实验验证表明,该数据集显著提升了现有MLLMs在多种视觉语言基准测试中的感知和认知能力,特别是在高分辨率图像输入方面。

Read more...

"Gradient Boosting Reinforcement Learning: 强化学习的新前沿"

Gradient Boosting Reinforcement Learning

摘要

本文介绍了一种名为Gradient Boosting Reinforcement Learning (GBRL)的新框架,该框架将梯度提升树(GBT)的优势扩展到强化学习(RL)领域。GBT在监督学习任务中因其解释性、对分类特征的支持以及适用于边缘设备的轻量级实现而广受欢迎。然而,GBT在在线学习场景中的应用,特别是在强化学习中,一直受到限制。GBRL框架通过实现多种actor-critic算法并与其神经网络(NN)对应算法进行性能比较,展示了GBT在RL中的可行性和潜力。此外,本文还引入了一种树共享方法,用于策略和价值函数,通过不同的学习率增强了学习效率。GBRL在具有结构化或分类特征的领域中表现出色,并提供了一个高性能的GPU加速实现,与广泛使用的RL库无缝集成。

Read more...

"LSM-adapter:城市内涝检测的新范式"

Urban Waterlogging Detection: A Challenging Benchmark and Large-Small Model Co-Adapter

摘要

本文针对城市内涝检测这一挑战性问题,提出了一种基于大型和小型模型协同适配的新方法。城市内涝不仅威胁公共安全,还对基础设施造成重大风险。传统方法依赖于水位传感器,但维护成本高且覆盖范围有限。近年来,利用监控摄像头图像和深度学习的方法虽然有所进展,但在数据稀缺和恶劣环境条件下仍面临挑战。为此,本文构建了一个包含7677张图像的Urban Waterlogging Benchmark (UW-Bench),并提出了一种名为Large-Small Model co-adapter (LSM-adapter)的新范式,该范式结合了大型模型的通用分割能力和小型模型的任务导向指导。具体来说,通过Triple-S Prompt Adapter模块和Dynamic Prompt Combiner生成并合并多个提示,以适应掩码解码器。同时,设计了一个Histogram Equalization Adapter模块,将图像特定信息注入图像编码器以进行适应。实验结果和分析显示了所开发基准和算法的挑战性和优越性。

Read more...

"RobustGANTT:突破传统,引领未来IoT网络调度新纪元"

Robust Generalization of Graph Neural Networks for Carrier Scheduling

摘要

本文介绍了一种名为RobustGANTT的新型图神经网络(GNN)调度器,用于增强使用反向散射技术的无电池传感器标签的物联网(IoT)网络。该调度器解决了在大型网络中协调传感器标签通信的NP-Hard优化问题,通过学习小型网络的最优调度,能够无需重新训练即可泛化到包含多达1000个节点的网络,显著提高了资源效率和网络响应速度。

Read more...
Previous Page 16 of 156 Next Page