探索未来:能源高效的AI系统与物理储层计算的前沿应用

Classical and Quantum Physical Reservoir Computing for Onboard Artificial Intelligence Systems: A Perspective

摘要

本文探讨了用于自主系统(如无人机、机器人和自动驾驶汽车)的人工智能(AI)系统的能源效率问题。由于这些系统可能消耗高达50%的可用车载电力,限制了车辆的功能和行驶距离,因此需要开发新型能源高效的AI系统。文章提出了一种使用自然物理环境中的非线性动力学特性来模拟生物大脑操作的神经形态计算机,并讨论了量子神经形态处理器(QNPs)的应用,这些处理器在消耗极少电力的情况下,能够以标准计算机的效率进行计算。文章还介绍了物理储层计算的概念,这是一种利用物理系统中的非线性动力学特性进行计算的方法,具有广泛的应用前景。

Read more...

深度强化学习在机器人臂控制中的超参数优化:TPE的应用与突破

Optimizing Deep Reinforcement Learning for Adaptive Robotic Arm Control

摘要

本文探讨了在具有七个自由度(DOF)的机器人臂控制中,使用树结构Parzen估计器(TPE)优化软演员-评论家(SAC)和近端策略优化(PPO)算法的超参数。研究结果显示,TPE显著提高了算法性能,SAC的成功率提高了10.48个百分点,PPO提高了34.28个百分点。此外,TPE使PPO比无TPE时快76%达到最大奖励的95%,SAC则快80%。这强调了高级超参数优化对深度强化学习算法在复杂机器人任务中效率和成功的重要性。

Read more...

FoldToken2:开创性的蛋白质结构语言学习与生成方法

FoldToken2: Learning compact, invariant and generative protein structure language

摘要

本文介绍了一种名为FoldToken2的创新方法,旨在解决蛋白质结构表示学习、对齐和生成中的长期挑战。FoldToken2通过将等变结构转换为离散令牌,同时保持原始结构的恢复能力,创造了一种紧凑且不变的语言来等效表示蛋白质结构。该方法在蛋白质结构重建任务中表现出色,相较于前代FoldToken1,在TMScore和RMSD指标上分别提升了20%和81%。FoldToken2可能是首个在单链和多链蛋白质结构量化方面表现良好的方法,预计将推动蛋白质结构表示学习、结构对齐和结构生成任务的进一步改进。

Read more...

NeuroMoCo:开创脉冲神经网络自监督学习新纪元

NeuroMoCo: A Neuromorphic Momentum Contrast Learning Method for Spiking Neural Networks

摘要

本文介绍了一种名为NeuroMoCo的新型神经形态动量对比学习方法,用于提高脉冲神经网络(SNNs)在处理复杂神经形态数据集时的性能。这是首次将基于动量对比学习的自监督学习(SSL)应用于SNNs。此外,本文还设计了一种新的损失函数MixInfoNCE,专门针对神经形态数据集的时间特性,通过严格的消融实验验证了其有效性。实验结果表明,NeuroMoCo在DVS-CIFAR10、DVS128Gesture和N-Caltech101数据集上达到了新的最先进(SOTA)基准,分别为83.6%、98.62%和84.4%。

Read more...

实时动态视线跟踪与深度估计:革新透明显示器交互体验

Realtime Dynamic Gaze Target Tracking and Depth-Level Estimation

摘要

本文由Esmaeil Seraj等人撰写,针对透明显示器(如车辆中的抬头显示器HUD)中实时动态视线目标跟踪和深度级别估计的问题,提出了一种双模块的系统解决方案。该系统包括一个基于树的算法用于实时跟踪视线目标,以及一个多流自注意力架构用于从眼动追踪数据中估计视线深度级别。通过收集真实世界的眼动追踪数据集,论文展示了该系统在静态和动态环境中的可扩展性、精确性和实时可行性,为下一代用户与设备交互和体验设定了新的基准。

Read more...

探索未来设计:Text2VP——生成式AI在视觉编程与参数化建模中的创新应用

Text2VP: Generative AI for Visual Programming and Parametric Modeling

摘要

本文由Guangxi Feng和Wei Yan等人撰写,探讨了将生成式人工智能(AI)应用于视觉编程和参数化建模的创新方法。论文的核心在于开发了一种名为Text2VP的生成式AI模型,该模型基于GPT-4进行定制,旨在自动化生成图形化的视觉编程工作流程,特别是在建筑设计中的参数化建模。Text2VP通过AI生成的脚本,能够准确反映用户的设计意图,并允许用户交互式地改变参数值。该研究不仅展示了生成式AI在视觉编程和参数化建模中的潜力,还为未来处理更复杂建模任务奠定了基础。

Read more...

探索未来:机器学习与本体结合在机器人智能中的创新应用

Coupling Machine Learning with Ontology for Robotics Applications

摘要

本文由Osama F. Zaki提出,探讨了将机器学习(ML)算法与知识库(KB)本体形式相结合的实际方法,特别是在机器人应用中的风险意识自主系统。文章通过两个实验,分析了多种机器学习算法(如多层前馈反向传播、朴素贝叶斯和J48决策树)在不同数据集上的表现,验证了ML与KB耦合的计算有效性及其线性时间复杂度。文章强调了这种双层智能方法在提升机器人学习和知识共享过程中的重要性,并探讨了其在机器人系统可靠性及其他非机器人应用中的广泛前景。

Read more...

"深度与分割的融合:开启视觉-语言理解的新纪元"

Composition Vision-Language Understanding via Segment and Depth Anything Model

摘要

本文介绍了一种创新的统一库,该库利用深度任何模型(DAM)和分割任何模型(SAM)来增强语言-视觉模型在零样本理解中的神经理解能力。这一库通过在符号实例级别融合分割和深度分析,为语言模型提供细致的输入,显著推进了图像解释。经过在各种真实世界图像中的验证,我们的发现展示了通过神经-符号集成在视觉-语言模型中的进步。这种新颖的方法以一种前所未有的方式融合了视觉和语言分析。总体而言,我们的库为未来研究开辟了新方向,旨在通过先进的多模态技术解码现实世界的复杂性。

Read more...

集成方法在系统故障检测中的应用与前景

Ensemble Method for System Failure Detection Using Large-Scale Telemetry Data

摘要

本文由Intel Corporation的Priyanka Mudgal和Rita Wouhaybi共同撰写,探讨了利用大规模遥测数据进行系统故障检测的集成方法。随着个人电脑(PCs)的普及,系统可靠性成为提升用户体验的关键。本文提出了一种集成多种算法的方法,包括长短期记忆网络(LSTM)、隔离森林(Isolation Forest)、一类支持向量机(OCSVM)和局部异常因子(LOF),以有效识别系统故障。实验结果表明,该方法在系统故障检测方面表现出色,为提升计算环境中的用户体验提供了实用见解。

Read more...

"Nomic Embed Vision:开创视觉与语言统一潜在空间的新纪元"

Nomic Embed Vision: Expanding the Latent Space

摘要

本文介绍了一种名为Nomic Embed Vision的高性能图像嵌入模型,该模型与Nomic Embed Text共享相同的潜在空间。这一创新使得Nomic Embed Vision和Nomic Embed Text成为首个在视觉、语言和多模态任务中实现高表现的统一潜在空间模型。论文通过采用类似于Locked Image Tuning(LiT)的训练方法,冻结高性能文本嵌入器并从预训练的检查点训练视觉编码器,从而保持了Nomic Embed Text的性能,并解锁了新的多模态潜在空间能力。

Read more...
Previous Page 147 of 156 Next Page