"保护儿童网络安全:多模态大型语言模型在应用成熟度评级中的创新应用"

Multimodal Chain-of-Thought Reasoning via ChatGPT to Protect Children from Age-Inappropriate Apps

摘要

本文探讨了如何利用多模态大型语言模型(MLLMs)通过ChatGPT进行链式思维(CoT)推理,以保护儿童免受不适龄应用的影响。文章首次系统研究了应用成熟度评级与MLLMs的结合,设计了CoT赋能的提示,指导MLLM遵循一系列逻辑步骤推导应用的成熟度级别。通过在App Store收集的数据集上进行广泛实验,结果显示所提出的方法在不同LLM模型和多模态融合策略中均表现出色。

Read more...

"创新的三维语义地图构建:提升移动机器人的材料识别与环境理解"

Object-Oriented Material Classification and 3D Clustering for Improved Semantic Perception and Mapping in Mobile Robots

摘要

本文介绍了一种面向对象的材料分类和三维聚类方法,旨在提高移动机器人在语义感知和地图构建方面的能力。该研究通过结合RGB-D数据和SLAM算法,提出了一种深度学习方法,用于在三维环境中进行材料分类和语义地图构建。实验结果表明,该方法在材料分类和三维聚类精度上显著优于现有技术,为机器人感知和交互提供了新的可能性。

Read more...

"增强自动驾驶安全:潜在状态扩散模型在端到端导航中的应用"

Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation

摘要

本文探讨了自动驾驶领域中的安全导航问题,特别是在复杂高维状态空间中的端到端规划方法。传统的端到端规划方法在安全性方面存在不足,因此本文提出了一种基于条件风险价值(CVaR)的软演员评论家(SAC)模型,结合增强拉格朗日方法和潜在扩散模型,以有效管理约束并优化策略。该方法引入了一个最坏情况演员来指导安全探索,确保即使在不可预测的场景中也能严格遵守安全要求。通过在模拟和真实环境中进行实验,证明了该方法在安全性、效率和决策能力方面优于现有方法。

Read more...

"增强自动驾驶安全:集成潜在状态扩散模型的端到端导航创新方法"

Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation

摘要

本文由Jianuo Huang和Zhenlong Fang等人提出,针对自动驾驶中的安全导航问题,提出了一种集成潜在状态扩散模型(Latent State Diffusion Model)的端到端导航方法。该研究解决了传统端到端规划方法在复杂高维状态空间中缺乏安全性的问题,通过引入条件风险价值(Conditional Value-at-Risk)和软行为批评家(Soft Actor-Critic)框架,结合增强拉格朗日方法和潜在扩散模型,有效管理约束并预测未来轨迹,从而在模拟和真实环境中显著提升了安全性和决策效率。

Read more...

"挑战自一致性:LLMs通过更长推理文本实现更准确预测"

When is the consistent prediction likely to be a correct prediction?

摘要

本文由Alex Nguyen等人撰写,针对自一致性(Self-consistency)方法在大型语言模型(LLMs)中的应用提出了一种修正。自一致性方法认为,通过LLMs生成的最一致答案更有可能是正确的。然而,本文通过实验观察到,通过更多计算(即更长的推理文本)得到的答案,而不是仅仅考虑所有输出中最一致的答案,更有可能是正确的。这是因为LLMs在生成更长响应时,能够自主产生链式思维(CoT)风格的推理,而不需要任何自定义提示。在零样本设置中,通过多次采样Mixtral-8x7B模型并考虑更长的响应,作者实现了在GSM8K和MultiArith数据集上达到86%的自一致性性能。此外,文章还强调了LLMs生成更长响应的概率较低,因此需要基于输出长度的解码策略。

Read more...

"提炼智慧:将复杂推理技术融入大型语言模型的新方法"

Distilling System 2 into System 1

摘要

本文探讨了将大型语言模型(LLMs)中的“系统2”推理技术提炼回“系统1”生成过程的方法。通过自监督学习,研究者展示了如何在不生成中间推理标记序列的情况下,将“系统2”技术的高质量输出提炼回LLMs中。这种方法不仅提高了原始“系统1”性能,而且在推理成本上低于“系统2”。文章指出,这种提炼技术将成为未来持续学习AI系统的重要特征,使它们能够专注于尚未能很好处理的推理任务。

Read more...

"结构泛化:利用MPNN和RL实现自主网络事件响应的新前沿"

Structural Generalization in Autonomous Cyber Incident Response with Message-Passing Neural Networks and Reinforcement Learning

摘要

本文探讨了在网络结构变化下,使用消息传递神经网络(MPNN)和强化学习(RL)实现自主网络事件响应的结构泛化问题。论文指出,计算机网络的动态性要求自动化事件响应代理能够处理网络结构的变化,而无需额外训练,即实现零样本泛化。论文通过将计算机网络状态表示为关系图,并使用MPNN进行编码,结合强化学习优化代理策略,评估了这一方法在网络事件模拟器CAGE 2中的应用。结果显示,使用关系信息的代理能够在网络变化的情况下找到解决方案,展示了在网络安全领域中,代理的泛化能力与专业化之间的权衡。

Read more...

"自动检测文本中的不公正:一种创新的人工智能框架"

Epistemological Bias As a Means for the Automated Detection of Injustices in Text

摘要

本文由Kenya Andrews和Lamogha Chiazor共同撰写,探讨了如何利用细调的BERT模型结合其他模型和词典方法,自动检测文本中的不公正现象,特别是新闻媒体中的歧视性叙述。文章通过实证定性研究,展示了该框架在大量数据中检测不公正现象的有效性。

Read more...

"节能高效:约束贝叶斯优化在机器学习中的应用"

Automated Computational Energy Minimization of ML Algorithms using Constrained Bayesian Optimization

摘要

本文探讨了在机器学习(ML)模型训练过程中,如何通过约束贝叶斯优化(CBO)来最小化能源消耗,同时确保模型的预测性能不低于预设阈值。随着ML模型规模的不断扩大,其训练过程中的能源成本已成为一个不容忽视的问题。本文提出的CBO方法在多个回归和分类任务中进行了评估,结果显示该方法能够在不牺牲预测性能的前提下显著降低能源消耗。

Read more...

"陌生环境下的安全导航:基于强化学习的社会机器人导航策略改进"

Stranger Danger! Identifying and Avoiding Unpredictable Pedestrians in RL-based Social Robot Navigation

摘要

本文探讨了基于强化学习(RL)的社会机器人导航方法在处理特别具有挑战性或不熟悉情况时的性能下降问题。为了确保人类的安全和舒适,算法需要适当处理罕见情况,但这些情况由于其低频和多样性,对数据驱动方法提出了重大挑战。为此,本文提出了一种改进的学习过程,旨在鼓励RL策略在陌生情况下保持额外警惕。具体来说,本文通过修改行人模型训练过程、更新价值网络以估计和利用行人不可预测性特征,以及实施奖励函数来学习对行人不可预测性的有效响应,从而改进了社会注意力强化学习(SARL)策略。与原始SARL策略相比,改进后的策略在保持相似导航时间和路径长度的同时,将碰撞次数减少了82%,并在最困难情况下将行人个人空间内的停留时间减少了高达19个百分点。此外,本文还描述了如何将这些修改应用于其他RL策略,并在物理机器人上展示了这些策略的有效性。

Read more...
Previous Page 45 of 156 Next Page