"揭秘深度学习的黑匣子:集成特征分析引领模型解释新纪元"

Integrated feature analysis for deep learning interpretation and class activation maps

摘要

本文介绍了一种名为“集成特征分析”(Integrated Feature Analysis, IFA)的新方法,旨在提高深度学习(DL)模型的解释性和可接受性,特别是在风险敏感的应用领域,如安全系统、工业异常检测和医学影像。传统的类激活映射(CAM)方法虽然提供了模型决策的部分视图,但缺乏对数据集和模型中间特征的深入分析,限制了其解释能力。IFA通过特征分布分析和特征分解,提供了关于模型过拟合、数据集混淆因素、异常值、模型冗余和主要特征的详细信息,从而增强了CAM的解释性和一致性。该方法在八个不同领域的数据集上进行了验证,显著提高了CAM与模型输出的一致性,证明了其有效性和先进性。

Read more...

"揭秘表情包中的说服艺术:语言模型与释义增强的融合探索"

Analyzing Persuasive Strategies in Meme Texts: A Fusion of Language Models with Paraphrase Enrichment

摘要

本文由Kota Shamanth Ramanath Nayak和Leila Kosseim撰写,来自加拿大蒙特利尔康考迪亚大学的计算语言学实验室(CLaC)。论文主要探讨了在表情包文本中识别说服技巧的多标签分类问题。研究团队通过微调BERT、XLM-RoBERTa和mBERT等语言模型,并结合ChatGPT生成的释义数据增强,提出了一种基于平均聚合的集成模型。该研究不仅提高了模型在英语数据上的表现,还展示了其在多语言环境下的零样本学习能力。论文通过实验验证了数据增强和平衡训练集对模型性能的积极影响,同时也指出了不同分布释义引入的潜在噪声问题。

Read more...

"智能驾驶新突破:深度强化学习与混合A*规划的融合"

Let Hybrid A* Path Planner Obey Traffic Rules: A Deep Reinforcement Learning-Based Planning Framework

摘要

本文由Xibo Li, Shruti Patel和Christof Büskens共同撰写,提出了一种结合深度强化学习(DRL)和混合A路径规划算法的新型规划框架,旨在使自动驾驶系统在遵守交通规则的同时进行高效的路径规划。该框架通过DRL进行高层行为规划,如车道变更指令的生成,然后利用混合A规划器生成无碰撞的局部轨迹,由模型预测控制器(MPC)执行。此外,论文还引入了线性时序逻辑(LTL)来编码交通规则,并将其作为DRL的奖励函数,确保代理在决策时遵守交通规则。该方法在真实系统中得到了验证,展示了从模拟到实际硬件实施的可行性。

Read more...

"权重裁剪:深度学习和强化学习的新利器"

Weight Clipping for Deep Continual and Reinforcement Learning

摘要

本文针对深度持续学习和强化学习中权重幅值不断增加导致的学习失败问题,提出了一种简单的权重裁剪技术。该技术通过限制神经网络权重的范围,有效改善了模型的泛化能力,解决了学习过程中的可塑性丧失和策略崩溃问题,并促进了在大回放缓存比下的学习效率。实验结果表明,权重裁剪技术在监督学习和强化学习任务中均表现出显著的优势,且易于在现有学习系统中实施。

Read more...

"深度强化学习在乳品养殖电池管理中的创新应用:PPO算法的突破与前景"

A Deep Reinforcement Learning Approach to Battery Management in Dairy Farming via Proximal Policy Optimization

摘要

本文探讨了在乳品养殖业中应用近端策略优化(PPO)深度强化学习算法来管理电池存储,以提高能源效率和减少对电网电力的依赖。研究通过使用真实世界数据,展示了PPO算法在减少从电网进口电力方面优于Q学习算法1.62%的效果,显著提升了乳品养殖业的能源效率和可持续性。

Read more...

"突破深度视觉模型的效率瓶颈:空间注意力机制的引入与应用"

Addressing a fundamental limitation in deep vision models: lack of spatial attention

摘要

本文由Ali Borji撰写,主要探讨了当前深度学习视觉模型中存在的一个基本限制:缺乏空间注意力机制。与人类视觉系统能够高效地选择并处理关键视觉区域不同,现有的深度视觉模型处理整张图像,导致效率低下。本文提出了一种解决方案,通过在卷积和池化操作中选择性地应用于变化区域,并生成变化图传递给后续层,以提高模型的效率和能效。该方法不仅在推理阶段有效,而且为下一代更高效的视觉模型铺平了道路。

Read more...

"解耦退火后验采样:革新逆问题求解的新方法"

Improving Diffusion Inverse Problem Solving with Decoupled Noise Annealing

摘要

本文介绍了一种名为Decoupled Annealing Posterior Sampling (DAPS)的新方法,用于解决具有复杂非线性测量过程的贝叶斯逆问题,特别是在相位检索等应用中。DAPS通过在扩散采样轨迹中解耦连续步骤,允许它们在噪声水平降低时显著变化,从而探索更大的解空间,显著提高了样本质量和稳定性。该方法在多个图像恢复任务中展示了优越的性能,例如在FFHQ 256数据集上的相位检索任务中,PSNR提高了9.12dB。

Read more...

"重塑深度强化学习:NaP方法的创新与应用"

Normalization and effective learning rates in reinforcement learning

摘要

本文探讨了深度强化学习和持续学习中归一化层的复兴,以及它们在改善损失景观条件和对抗高估偏差方面的多样化益处。然而,归一化引入了一个微妙但重要的副作用:网络参数范数的增长与有效学习率的衰减之间的等价性。这在持续学习环境中变得成问题,因为由此产生的有效学习率调度可能会相对于学习问题的时标过快地衰减到接近零。本文提出了一种简单的重参数化方法,称为Normalize-and-Project(NaP),它将归一化层的插入与权重投影耦合,确保在整个训练过程中有效学习率保持恒定。这一技术不仅作为理解深度强化学习中学习率调度的强大分析工具,而且作为一种提高合成可塑性损失基准以及Arcade Learning Environment的单任务和顺序变体的鲁棒性的手段。本文还展示了该方法可以轻松应用于流行的架构,如ResNets和transformers,并在常见静态基准测试中恢复甚至略微提高基础模型的性能。

Read more...

"革新CSI反馈:AI驱动的信道建模数据增强方法"

Channel Modeling Aided Dataset Generation for AI-Enabled CSI Feedback: Advances, Challenges, and Solutions

摘要

本文由Yupeng Li等人撰写,发表于IEEE VOL. 14, NO. 8, AUGUST 2023,主要探讨了在频率分复用(FDD)多输入多输出(MIMO)系统中,利用AI驱动的自动编码器进行信道状态信息(CSI)反馈的问题。文章提出了一种基于有限现场信道数据的信道建模辅助数据增强方法,旨在优化数据收集和增强,减少数据收集开销并增强模型泛化能力。通过模拟验证,该策略相较于基准方法能显著提升性能。

Read more...

AdvGrid:开创性的红外行人检测器多视角黑盒物理攻击方法

Multi-View Black-Box Physical Attacks on Infrared Pedestrian Detectors Using Adversarial Infrared Grid

摘要

本文介绍了一种针对红外行人检测器的多视角黑盒物理攻击方法——对抗红外网格(AdvGrid)。在可见光谱中,物理对抗攻击的研究已广泛开展,但在红外光谱中的相关研究仍有限。红外物体检测器在现代技术应用中至关重要,但易受对抗攻击的影响,构成重大安全威胁。本文提出的AdvGrid方法通过在行人服装内部循环应用网格格式的扰动,利用遗传算法进行黑盒优化,实现了对红外行人检测器的多视角黑盒物理攻击。实验验证了该方法的有效性、隐蔽性和鲁棒性,其在数字环境和物理环境中的攻击成功率分别达到80.00%和91.86%,优于基线方法。此外,该方法对主流检测器的平均攻击成功率超过50%,显示出其鲁棒性。本文还进行了消融研究、转移攻击和对抗防御分析,确认了该方法的优越性。

Read more...
Previous Page 102 of 156 Next Page