"REGAD:利用强化学习在噪声标签环境下提升图异常检测性能"

Graph Anomaly Detection with Noisy Labels by Reinforcement Learning

摘要

本文介绍了一种名为REGAD(REinforced Graph Anomaly Detector)的新型框架,用于在图异常检测(GAD)任务中处理带有噪声标签的问题。GAD在金融欺诈检测和社交网络机器人账户识别等领域有广泛应用。传统的GAD方法依赖高质量的标签数据,但在现实场景中,这些标签往往难以获取且可能包含噪声,导致性能严重下降。REGAD通过逐步剪除可疑节点的边来减轻噪声的影响,并设计了一个定制的动作和搜索空间来训练策略网络,以迭代优化策略。实验结果表明,REGAD在不同异常比例的三个数据集上均表现出优越的性能。

Read more...

"Video-STaR:革新视频理解的自训练方法"

Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision

摘要

本文介绍了一种名为Video Self-Training with augmented Reasoning (Video-STaR)的新方法,该方法允许使用任何标记的视频数据集进行视频指令调优。Video-STaR通过在指令生成和微调之间循环,提高了视频理解能力,并使大型视觉语言模型(LVLMs)能够适应新的下游任务。该方法在多个基准测试中展示了显著的性能提升,特别是在视频问答(VQA)和动作质量评估(AQA)任务中。

Read more...

"保护儿童网络安全:多模态大型语言模型在应用成熟度评级中的创新应用"

Multimodal Chain-of-Thought Reasoning via ChatGPT to Protect Children from Age-Inappropriate Apps

摘要

本文探讨了如何利用多模态大型语言模型(MLLMs)通过ChatGPT进行链式思维(CoT)推理,以保护儿童免受不适龄应用的影响。文章首次系统研究了应用成熟度评级与MLLMs的结合,设计了CoT赋能的提示,指导MLLM遵循一系列逻辑步骤推导应用的成熟度级别。通过在App Store收集的数据集上进行广泛实验,结果显示所提出的方法在不同LLM模型和多模态融合策略中均表现出色。

Read more...

"创新的三维语义地图构建:提升移动机器人的材料识别与环境理解"

Object-Oriented Material Classification and 3D Clustering for Improved Semantic Perception and Mapping in Mobile Robots

摘要

本文介绍了一种面向对象的材料分类和三维聚类方法,旨在提高移动机器人在语义感知和地图构建方面的能力。该研究通过结合RGB-D数据和SLAM算法,提出了一种深度学习方法,用于在三维环境中进行材料分类和语义地图构建。实验结果表明,该方法在材料分类和三维聚类精度上显著优于现有技术,为机器人感知和交互提供了新的可能性。

Read more...

"增强自动驾驶安全:潜在状态扩散模型在端到端导航中的应用"

Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation

摘要

本文探讨了自动驾驶领域中的安全导航问题,特别是在复杂高维状态空间中的端到端规划方法。传统的端到端规划方法在安全性方面存在不足,因此本文提出了一种基于条件风险价值(CVaR)的软演员评论家(SAC)模型,结合增强拉格朗日方法和潜在扩散模型,以有效管理约束并优化策略。该方法引入了一个最坏情况演员来指导安全探索,确保即使在不可预测的场景中也能严格遵守安全要求。通过在模拟和真实环境中进行实验,证明了该方法在安全性、效率和决策能力方面优于现有方法。

Read more...

"增强自动驾驶安全:集成潜在状态扩散模型的端到端导航创新方法"

Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation

摘要

本文由Jianuo Huang和Zhenlong Fang等人提出,针对自动驾驶中的安全导航问题,提出了一种集成潜在状态扩散模型(Latent State Diffusion Model)的端到端导航方法。该研究解决了传统端到端规划方法在复杂高维状态空间中缺乏安全性的问题,通过引入条件风险价值(Conditional Value-at-Risk)和软行为批评家(Soft Actor-Critic)框架,结合增强拉格朗日方法和潜在扩散模型,有效管理约束并预测未来轨迹,从而在模拟和真实环境中显著提升了安全性和决策效率。

Read more...

"挑战自一致性:LLMs通过更长推理文本实现更准确预测"

When is the consistent prediction likely to be a correct prediction?

摘要

本文由Alex Nguyen等人撰写,针对自一致性(Self-consistency)方法在大型语言模型(LLMs)中的应用提出了一种修正。自一致性方法认为,通过LLMs生成的最一致答案更有可能是正确的。然而,本文通过实验观察到,通过更多计算(即更长的推理文本)得到的答案,而不是仅仅考虑所有输出中最一致的答案,更有可能是正确的。这是因为LLMs在生成更长响应时,能够自主产生链式思维(CoT)风格的推理,而不需要任何自定义提示。在零样本设置中,通过多次采样Mixtral-8x7B模型并考虑更长的响应,作者实现了在GSM8K和MultiArith数据集上达到86%的自一致性性能。此外,文章还强调了LLMs生成更长响应的概率较低,因此需要基于输出长度的解码策略。

Read more...

"提炼智慧:将复杂推理技术融入大型语言模型的新方法"

Distilling System 2 into System 1

摘要

本文探讨了将大型语言模型(LLMs)中的“系统2”推理技术提炼回“系统1”生成过程的方法。通过自监督学习,研究者展示了如何在不生成中间推理标记序列的情况下,将“系统2”技术的高质量输出提炼回LLMs中。这种方法不仅提高了原始“系统1”性能,而且在推理成本上低于“系统2”。文章指出,这种提炼技术将成为未来持续学习AI系统的重要特征,使它们能够专注于尚未能很好处理的推理任务。

Read more...

"结构泛化:利用MPNN和RL实现自主网络事件响应的新前沿"

Structural Generalization in Autonomous Cyber Incident Response with Message-Passing Neural Networks and Reinforcement Learning

摘要

本文探讨了在网络结构变化下,使用消息传递神经网络(MPNN)和强化学习(RL)实现自主网络事件响应的结构泛化问题。论文指出,计算机网络的动态性要求自动化事件响应代理能够处理网络结构的变化,而无需额外训练,即实现零样本泛化。论文通过将计算机网络状态表示为关系图,并使用MPNN进行编码,结合强化学习优化代理策略,评估了这一方法在网络事件模拟器CAGE 2中的应用。结果显示,使用关系信息的代理能够在网络变化的情况下找到解决方案,展示了在网络安全领域中,代理的泛化能力与专业化之间的权衡。

Read more...

"自动检测文本中的不公正:一种创新的人工智能框架"

Epistemological Bias As a Means for the Automated Detection of Injustices in Text

摘要

本文由Kenya Andrews和Lamogha Chiazor共同撰写,探讨了如何利用细调的BERT模型结合其他模型和词典方法,自动检测文本中的不公正现象,特别是新闻媒体中的歧视性叙述。文章通过实证定性研究,展示了该框架在大量数据中检测不公正现象的有效性。

Read more...
Previous Page 45 of 156 Next Page