探索文本到视频生成模型的安全性:T2VSafetyBench的全面评估与发现

T2VSafetyBench: Evaluating the Safety of Text-to-Video Generative Models

摘要

本文介绍了一种名为T2VSafetyBench的新型基准测试,用于评估文本到视频生成模型的安全性。随着文本到视频(T2V)生成技术的快速发展,生成的视频可能包含非法或不道德内容,这对其可靠性和实际部署构成了挑战。T2VSafetyBench通过定义12个关键的视频生成安全方面,并构建一个恶意提示数据集,来评估这些模型的安全性。研究发现,没有单一模型在所有方面都表现出色,且GPT-4评估与人工审查之间存在高度相关性。此外,文本到视频生成模型在可用性和安全性之间存在权衡。随着视频生成技术的迅速发展,安全风险也随之增加,因此迫切需要优先考虑视频安全问题。

Read more...

探索新型教学信号:“进度”在机器人学习中的应用与前景

How Much Progress Did I Make? An Unexplored Human Feedback Signal for Teaching Robots

摘要

本文由Hang Yu等人撰写,探讨了在机器人学习中利用一种新颖的人类反馈信号——“进度”(progress),以提高机器人从人类教学中的学习效率和用户体验。文章通过三个实验(两个在线研究和一个公共空间研究)验证了“进度”信号的有效性,并展示了其在评估任务完成度、识别无害但无效行为以及在非专家演示中的应用潜力。此外,文章还发布了一个包含40个非专家演示的数据集,强调了“进度”信号在机器人学习中的重要性和应用前景。

Read more...

探索未来:BEVWorld——自动驾驶的多模态世界模型

BEVWorld: A Multimodal World Model for Autonomous Driving via Unified BEV Latent Space

摘要

本文介绍了一种名为BEVWorld的创新方法,用于自动驾驶中的多模态世界模型构建。该方法通过将多模态传感器输入编码为一个统一的鸟瞰图(BEV)潜在空间,来模拟环境并预测未来场景。BEVWorld包括一个多模态标记器和一个潜在BEV序列扩散模型,能够有效地处理未标记的多模态传感器数据,并在自动驾驶任务中展示出其生成未来场景的能力,从而为感知和运动预测等下游任务提供支持。

Read more...

探索未来交通标志识别的新前沿:基于MLLM的跨域少样本学习方法

Cross-domain Few-shot In-context Learning for Enhancing Traffic Sign Recognition

摘要

本文提出了一种基于多模态大型语言模型(MLLM)的跨域少样本上下文学习方法,用于增强交通标志识别(TSR)。该方法通过构建基于Vision Transformer Adapter的交通标志检测网络和提取模块,从原始道路图像中提取交通标志。为了减少对训练数据的依赖并提高跨国家TSR的性能稳定性,引入了基于MLLM的跨域少样本上下文学习方法。通过生成包含交通标志形状、颜色和构成的关键信息的描述文本,该方法增强了MLLM对交通标志的细粒度识别能力。实验结果表明,该方法在多个数据集上显著提高了TSR性能。

Read more...

探索未来无线通信:ORAN-Bench-13K与ORANSight引领LLM在O-RAN中的应用革命

ORAN-Bench-13K: An Open Source Benchmark for Assessing LLMs in Open Radio Access Networks

摘要

本文由Pranshav Gajjar和Vijay K. Shah撰写,来自乔治梅森大学的NextG无线实验室,提出了一种名为ORAN-Bench-13K的新型开源基准,旨在评估大型语言模型(LLMs)在开放无线接入网络(O-RAN)中的性能。该基准包含13,952个精心设计的多项选择题,源自116份O-RAN规范文档。论文还介绍了ORANSight,一种基于检索增强生成(RAG)的管道,其在ORAN-Bench-13K上的表现优于其他封闭源模型。研究结果表明,当前流行的LLM模型在O-RAN领域并不擅长,强调了开发专用模型的必要性。

Read more...

探索未来视觉智能:动态网络架构的突破与应用

The Dynamic Net Architecture: Learning Robust and Holistic Visual Representations Through Self-Organizing Networks

摘要

本文介绍了一种名为“动态网络架构”(Dynamic Net Architecture, DNA)的新型智能系统架构,该架构依赖于循环稳定网络,并应用于视觉处理。DNA模型通过自组织机制和Hebbian可塑性,动态地整合局部和全局特征,从而生成高度鲁棒的视觉表示。与传统的人工神经网络(ANNs)不同,DNA通过动态横向连接过滤掉无关细节,提高了处理步骤的清晰度和决策的准确性。实验证明,DNA能够有效地组合线条片段,形成更长的线条,即使在高达59%的噪声干扰下,也能保持线条表示的鲁棒性。此外,DNA还能从部分遮挡的输入中重建预期特征,并能泛化到训练中未观察到的模式。本文还探讨了如何通过结合多个区域来实现未来的不变对象识别工作。

Read more...

探索核能与防御领域的知识工程创新:SARBACANES系统的构建与应用

Implementing a hybrid approach in a knowledge engineering process to manage technical advice relating to feedback from the operation of complex sensitive equipment

摘要

本文由S. Boblet等人撰写,探讨了在核能和防御领域中,如何有效地管理与操作经验反馈相关的技术意见。文章详细介绍了一个名为“TA KM”的知识工程方法,该方法符合ISO30401框架,并构建了一个名为“SARBACANES”的完整系统,以支持业务流程并在知识库中永久保存其专业知识和专长。文章不仅关注传统的知识转移,还展示了这种工程方法在多功能操作中的能力。此外,文章还介绍了使用Ardans Knowledge Maker®平台加速建模的过程。

Read more...

探索神经细胞自动机在多纹理合成中的创新应用

Multi-Texture Synthesis through Signal Responsive Neural Cellular Automata

摘要

本文介绍了一种基于信号响应神经元细胞自动机(NCA)的多纹理合成方法。传统的NCA在纹理生成领域表现出色,但每种纹理需要单独训练的NCA,限制了其应用范围。本文提出了一种新方法,通过在每个细胞状态中编码纹理信息,训练单个NCA生成多种纹理。这种方法不仅保持了NCA的自再生能力,还支持学习纹理之间的插值和嫁接技术,展示了编辑生成纹理的潜力,并探讨了基因信息和损失函数对NCA演化的影响。

Read more...

探索网络物理游戏:智能体在复杂环境中的策略与演变

Cyber Physical Games

摘要

本文由Warisa Sritriratanarak和Paulo Garcia撰写,探讨了多智能体在网络物理系统(CPS)中的协同或对抗游戏。文章指出,智能体与底层物理环境之间的通信媒介固有的不确定性导致了环境演变的概率函数,这些新兴属性被称为网络物理游戏(Cyber Physical Games)。论文通过概率有限状态自动机(Probabilistic Finite State Automata)近似网络物理游戏,并评估了其在迭代布尔游戏的协作和对抗版本中的应用,比较了理论结果与模拟结果。研究结果支持了所提出模型的有效性,并指出了进一步研究的方向,以继续发展我们对网络物理系统的理解,以及如何最好地设计在这些环境中运行的智能体。

Read more...

探索脉冲神经网络的新纪元:多比特信息传输机制的突破与应用

Multi-Bit Mechanism: A Novel Information Transmission Paradigm for Spiking Neural Networks

摘要

本文介绍了一种针对脉冲神经网络(SNNs)的新型信息传输范式——多比特机制。SNNs因其高性能、低功耗和增强的生物可解释性而受到认可,但其二进制脉冲特性导致显著的信息损失,最终影响性能。本文提出的多比特信息传输机制通过将脉冲神经元的输出从单比特扩展到多比特,增强了脉冲的表达能力,减少了前向过程中的信息损失,同时保持了SNNs的低能耗优势。此外,通过从上一层提取有效信号重新刺激神经元,促进了各比特级别的充分脉冲发射。实验结果显示,无论是直接训练方法还是ANN-SNN转换方法,该方法均能持续提升性能。

Read more...
Previous Page 52 of 156 Next Page