探索高得分区域:基于扩散模型的离线模型基础优化新方法

Guided Trajectory Generation with Diffusion Models for Offline Model-based Optimization

摘要

本文介绍了一种新颖的条件生成建模方法,用于解决离线模型基础优化(MBO)问题,通过学习从数据集中构建的合成轨迹来改进解决方案。该方法首先构建朝向高得分区域的合成轨迹,并注入局部偏差以保持改进方向的一致性。随后,训练一个条件扩散模型,生成基于得分的轨迹。最后,通过引导采样从训练模型中采样多个轨迹,探索数据集外的高得分区域,并使用代理函数在生成的轨迹中选择高保真设计。实验结果表明,该方法在Design-Bench及其变体上优于竞争基线。

Read more...

森林收割机的革命:基于LSTM的随机分段方法优化木材生产

Stochastic stem bucking using mixture density neural networks

摘要

本文由Simon Schmiedel等人撰写,旨在通过一种新颖的随机分段方法改进森林收割机的分段决策。森林收割机的分段决策不佳会对从原木中产生的产品产生负面影响。正确的分段决策并非易事,因为收割机必须依赖于对尚未测量部分的树干轮廓的预测。该项目的目标是开发一种长短期记忆(LSTM)神经网络,该网络能够预测基于已知树干部分的正态分布参数,从而为未知的树干部分创建多个树干轮廓预测样本。然后,可以使用一种新颖的随机分段算法优化分段决策,该算法利用所有生成的树干轮廓来选择从树干中产生的原木。该随机分段算法与两个基准模型进行了比较:一个不能基于多个直径测量进行预测的多项式模型和一个确定性LSTM神经网络。所有模型都在加拿大东部常见的四种针叶树种的树干轮廓上进行了评估。总体而言,随机LSTM模型做出了最佳的分段决策,证明了该方法的有用性。

Read more...

深度强化学习在金融交易中的革命性应用:探索资产持有与交易的新策略

Deep Reinforcement Learning Strategies in Finance: Insights into Asset Holding, Trading Behavior, and Purchase Diversity

摘要

本文探讨了深度强化学习(DRL)算法在金融交易中的应用,特别是它们在资产持有、交易行为和购买多样性方面的表现。通过分析这些算法在不同交易场景下的决策过程,本文揭示了每种DRL算法的独特交易模式和策略。研究发现,A2C算法在累积奖励方面表现最佳,而PPO和SAC则倾向于进行大量交易但涉及的股票数量有限。此外,DRL算法在持有资产的时间长度上也表现出显著差异,如DDPG、A2C和TD3倾向于长期持有,而SAC和PPO则更频繁地买卖。

Read more...

深度频率导数学习:非平稳时间序列预测的新视角

Deep Frequency Derivative Learning for Non-stationary Time Series Forecasting

摘要

本文针对非平稳时间序列预测中的分布偏移问题,提出了一种深度频率导数学习框架(DERITS)。传统方法通过调整统计量(如均值和标准差)来校正时间序列分布,但这些操作在理论上可视为频谱中零频率分量的变换,无法揭示完整的分布信息,导致归一化过程中的信息利用瓶颈,从而影响预测性能。DERITS通过利用整个频率谱来转换时间序列,从频率角度充分利用数据分布,提出了一种新颖的可逆变换——频率导数变换(FDT),使信号在频率域中获得更平稳的频率表示。此外,DERITS还引入了顺序自适应傅里叶卷积网络(OFCN)进行自适应频率滤波和学习,并通过并行堆叠架构进行多阶导数和融合,以实现预测。实验结果表明,DERITS在多个数据集上均显示出优于现有方法的预测性能和偏移缓解能力。

Read more...

煤矿综合能源系统调度优化:多任务多约束进化算法的新突破

Multi-task multi-constraint differential evolution with elite-guided knowledge transfer for coal mine integrated energy system dispatching

摘要

本文由Canyun Dai等人提出,针对煤矿综合能源系统调度优化问题,该问题因高维度、强耦合约束和多目标特性而极具挑战性。现有约束多目标进化算法难以定位多个小而不规则的可行区域,因此不适用于此问题。为解决这一难题,作者开发了一种多任务进化算法框架,该框架结合了调度相关领域知识,有效处理强约束和多目标优化问题。文章详细探讨了基于复杂约束关系分析和处理的多任务构建策略,包括约束耦合空间分解、约束强度分类和约束处理技术,并在此框架内进一步发展了两种策略:精英引导的知识转移和基于自适应邻域技术的变异,以有效平衡每个优化任务的多样性和收敛性。通过与CPLEX求解器和七种最先进的约束多目标进化算法的比较,展示了所提算法在可行性、收敛性和多样性方面的性能。

Read more...

自动驾驶新突破:基于规则的行为规划器在城市环境中的应用

A Rule-Based Behaviour Planner for Autonomous Driving

摘要

本文介绍了一种基于规则的行为规划器,用于自动驾驶车辆。该论文的核心在于提出了一种双层规则引擎算法,用于从专家驾驶决策中学习并维护一个规则基础的行为规划系统。该系统通过两层规则处理,第一层确定一组可行的参数化行为,第二层则将这些参数协调成单一行为。论文通过在城市环境中对第三级自动驾驶车辆的实地测试,展示了其方法的实用性和有效性。

Read more...

预测、优化与修订:能源管理系统中的预测与政策稳定性研究

Predict. Optimize. Revise. On Forecast and Policy Stability in Energy Management Systems

摘要

本文研究了能源管理系统中预测与优化策略的稳定性问题,特别关注切换成本、预测准确性和稳定性的影响。研究提出了一种新颖的框架,用于分析带有切换成本的在线优化问题,并探讨了预测准确性、稳定性和切换成本之间的平衡如何影响政策性能。研究在电池调度应用中进行了实证评估和理论分析,发现切换成本显著影响预测准确性和稳定性的权衡,强调了集成系统在改善决策制定中的重要性。研究结果表明,长期坚持某一政策可能比频繁更新更有优势,并且预测稳定性与政策性能之间存在相关性,稳定的预测可以减轻切换成本的影响。该框架为能源部门决策者和预测实践者提供了宝贵的见解,特别是在设计能源管理系统的运营时。

Read more...

"CoRaX:革新放射学诊断的人工智能协作系统"

Enhancing Radiological Diagnosis: A Collaborative Approach Integrating AI and Human Expertise for Visual Miss Correction

摘要

本文介绍了一种名为Collaborative Radiology Expert (CoRaX)的创新型人工智能系统,旨在通过整合眼动追踪数据和放射学报告,提高胸部放射学诊断的准确性。该系统通过分析放射科医生与X光图像的交互,识别并纠正感知错误,从而提升决策过程。CoRaX系统的设计不仅提高了诊断效率,还具有教育潜力,可支持经验不足的放射科医生的培训。

Read more...

"FedDecomp: 创新个性化联邦学习方法,高效解耦通用与个性化知识"

Decoupling General and Personalized Knowledge in Federated Learning via Additive and Low-Rank Decomposition

摘要

本文提出了一种名为FedDecomp的新型个性化联邦学习(PFL)方法,旨在解决数据异质性问题。FedDecomp通过参数加性分解,将每个模型参数分解为共享参数和个性化参数,从而更彻底地解耦共享知识和个性化知识。此外,FedDecomp通过交替训练策略,优先训练低秩矩阵以吸收非独立同分布(non-IID)数据的影响,进一步提高了性能。实验结果表明,FedDecomp在多个数据集和不同程度的非IID数据分布下,性能优于现有方法。

Read more...
Previous Page 119 of 156 Next Page