探索语言模型优化器的新视角:性能与稳定性的平衡

Deconstructing What Makes a Good Optimizer for Language Models

摘要

本文探讨了在语言模型训练中,不同优化算法(如SGD、Adafactor、Adam、Lion和Signum)的性能和稳定性。研究发现,除了SGD之外,其他优化算法在性能和超参数稳定性方面表现相似。文章进一步分析了Adam优化器的简化版本,如Signum和Adalayer,发现这些简化版本能够恢复Adam的性能和稳定性。研究结果表明,优化器的选择可以基于实际考虑,如内存限制和实现简易性,而不是仅仅依赖于性能或超参数稳定性。

Read more...

揭秘视觉语言导航系统的脆弱性:对抗性攻击与防御策略

Malicious Path Manipulations via Exploitation of Representation Vulnerabilities of Vision-Language Navigation Systems

摘要

本文探讨了视觉语言导航系统(VLN)中存在的表示脆弱性问题,并提出了一种基于梯度优化的方法来利用这些脆弱性。通过微调图像,使得机器人根据修改后的图像执行完全不同的导航指令。此外,本文还开发了一种高效的算法来检测这些恶意修改,该算法基于对抗性修改图像对添加的高斯噪声的敏感性。研究不仅揭示了当前VLN模型的脆弱性,还为未来增强多模态领域AI系统的安全性和可靠性提供了方向。

Read more...

智能电网安全的挑战与机遇

A Comprehensive Survey on the Security of Smart Grid: Challenges, Mitigations, and Future Research Opportunities

摘要

本文对智能电网的安全问题进行了全面综述,包括系统架构、攻击方法、防御策略和未来研究方向。文章介绍了智能电网的结构和组件,以及通信协议,并对智能电网的新兴攻击进行了分类和分析。文章还探讨了检测和缓解智能电网攻击的创新方法,包括博弈论、图论、区块链和机器学习技术。最后,文章讨论了智能电网安全的未来研究方向,包括新兴技术的研究机会、大型语言模型和对抗机器学习的潜在作用。

Read more...

深度强化学习在顺序组合拍卖中的应用:优化收入与扩展性

Deep Reinforcement Learning for Sequential Combinatorial Auctions

摘要

本文介绍了一种针对顺序组合拍卖的深度强化学习框架,旨在设计收入最优的拍卖机制。传统的强化学习方法在处理大规模连续动作空间时面临计算需求和收敛问题,而本文提出的方法利用可微分过渡模型,通过一阶梯度方法优化拍卖机制。实验结果显示,该方法在收入上显著优于分析基准和标准强化学习算法,并能扩展到包含多达50个代理和50个物品的复杂实际拍卖场景。这一研究不仅推进了拍卖设计领域的计算工具,还促进了理论结果与实际应用之间的桥梁建设。

Read more...

灵巧操作的新篇章:基于强化学习的蔬菜剥皮机器人系统

Vegetable Peeling: A Case Study in Constrained Dexterous Manipulation

摘要

本文通过一个案例研究,探讨了在受限的灵巧操作中,如何利用强化学习训练的重新定位控制器来辅助后续的蔬菜剥皮任务。文章提出了一种简单的系统,用于学习一个能够在重新定位后牢固握住物体的控制器,以满足剥皮任务的特定需求。该研究不仅解决了物体重新定位的问题,还展示了其在实际应用中的潜力,特别是在自动化食品准备任务中的应用。

Read more...

疫情期间的高精度公平大学课程调度框架

High-Precision, Fair University Course Scheduling During a Pandemic

摘要

本文介绍了一种在疫情期间进行大学课程调度的新框架,该框架基于公平性、同时出席和高精度调度三个原则。文章提出的方法确保了在疫情期间,每个课程部分至少有一定比例(例如25%)的教学在教室中进行。这种方法不同于以往的研究,它不允许轮流出席,而是要求所有学生在同一时间在多个教室中同时出席,但频率低于正常学期。此外,该方法还创建了一个高精度的、非重复的学期计划,考虑到了学期中的每一天,而不是单一的重复周。文章通过一个实际案例研究展示了该方法的有效性,即使在教室容量减少75%的情况下,该方法仍能确保至少25%的教学在教室中进行,并且超过49%的整个校园教学可以在教室中进行。

Read more...

神经驾驶风格转移(NDST):个性化自动驾驶的未来

NDST: Neural Driving Style Transfer for Human-Like Vision-Based Autonomous Driving

摘要

本文介绍了一种名为神经驾驶风格转移(NDST)的新方法,旨在为基于视觉的自动驾驶车辆(AV)提供个性化的驾驶体验。NDST通过将用户的独特驾驶风格融入到传统的基准驾驶模型(BDM)中,同时遵守安全参数,从而提高自动驾驶车辆的接受度和用户体验。该方法的核心是通过个性化块(PB)实现驾驶风格的转移,PB能够自适应地学习并调整以适应个人的驾驶行为,而无需修改BDM。通过对比两种不同的驾驶风格(风格A和风格B),验证了NDST方法的有效性,展示了其在提供个性化和熟悉的驾驶体验方面的潜力。

Read more...

绿幕增强技术:解锁机器人操作的新场景泛化能力

Green Screen Augmentation Enables Scene Generalisation in Robotic Manipulation

摘要

本文探讨了在机器人操作中,如何将基于视觉的策略推广到新环境的问题。传统的做法是在一个位置收集数据,训练模仿学习或强化学习策略,并在同一位置部署策略。然而,这种方法缺乏可扩展性,因为每个任务都需要在多个位置收集数据。为此,本文提出了一种新颖的方法,即在主要使用绿幕的位置收集数据,并引入绿幕增强(GreenAug)技术,利用色度键算法将背景纹理叠加到绿幕上。通过大量的实际实验,GreenAug在性能上超越了无增强、标准计算机视觉增强和先前的生成增强方法。本文倡导未来研究中的真实世界演示应利用绿幕,并应用GreenAug,以解锁对视觉上不同的新位置的策略泛化,解决当前机器人学习中场景泛化的局限性。

Read more...

计算性构建语法学习:现状与未来展望——探索语言技术的创新前沿

The Computational Learning of Construction Grammars: State of the Art and Prospective Roadmap

摘要

本文《计算性构建语法学习:现状与展望路线图》由Jonas Doumen等人撰写,旨在综述计算性构建语法学习的当前状态,并提出未来研究的方向。文章整合了先前在不同研究领域中关于形式-意义配对计算学习的研究,目标是三重:一是综合迄今提出的各种方法及其取得的成果;二是识别已成功解决的挑战部分和需要进一步研究的部分;三是提供一个路线图,以促进和优化未来在大规模、基于使用的构建语法学习方面的研究努力。

Read more...

超球面原型学习几何的编码理论分析:优化与应用

A Coding-Theoretic Analysis of Hyperspherical Prototypical Learning Geometry

摘要

本文探讨了超球面原型学习(HPL)的几何结构,这是一种监督下的表示学习方法,旨在设计单位超球面上的类原型。HPL通过在已知的几何结构中实现尺度不变的类分离,解决了以往方法中的两个主要缺陷:(i)无原则的优化过程;(ii)仅限于单一潜在维度的理论健全性。本文通过引入一种有原则的优化过程和使用线性块码在广泛的维度中构建良好分离的原型,解决了这两个问题。此外,本文还提供了关于最优原型放置的可实现和逆向界限,证明了所提出的方法接近最优。

Read more...
Previous Page 33 of 156 Next Page