探索蛋白质结构的新视角:PROTLOCA方法的突破与应用

Protein Representation Learning with Sequence Information Embedding: Does it Always Lead to a Better Performance?

摘要

本文由上海交通大学和密歇根大学的研究人员共同撰写,探讨了蛋白质表示学习中序列信息嵌入的必要性及其对性能的影响。论文通过结构对齐任务发现,在某些情况下,嵌入氨基酸类型可能不会帮助深度学习模型学习更好的表示。为此,研究团队提出了PROTLOCA,一种仅基于氨基酸结构表示的局部几何对齐方法。该方法在全局结构匹配任务中,通过使用CATH标签的独立测试数据集,证明了其比现有的基于序列和结构的表示学习方法更快更准确地匹配结构一致的蛋白质域。此外,在局部结构配对任务中,PROTLOCA首次提供了一种有效解决方案,突出显示具有不同整体结构但具有相同功能的蛋白质之间的共同局部结构。这为使用深度学习方法分析蛋白质结构以推断功能提供了新的可能性。

Read more...

探索语音信号分析的新前沿:自动化识别不当行为的突破性研究

A Novel Labeled Human Voice Signal Dataset for Misbehavior Detection

摘要

本文介绍了一项关于语音信号分类的研究,特别关注于通过分析语音模式和表达方式来识别不当行为。研究中,参与者被要求以两种不同的方式回答12个心理学问题:一种是严厉的声音,被归类为“不当行为”;另一种是礼貌的方式,被归类为“正常”。这些分类对于理解不同的语音行为如何影响语音信号的解释和分类至关重要。研究强调了语音语调和表达在自动化机器学习系统中对语音分析和识别的重要性,并通过对人类行为对语音信号感知和分类影响的阐释,促进了更准确和上下文感知的语音识别技术的发展。

Read more...

提升弱监督语义分割精度:ORANDNet集成方法的突破与应用前景

Precision matters: Precision-aware ensemble for weakly supervised semantic segmentation

摘要

本文由Junsung Park和Hyunjung Shim共同撰写,聚焦于弱监督语义分割(WSSS)领域,该领域通过使用图像级标签等弱监督信息来训练分割模型,以降低全监督语义分割的高标注成本。尽管近期WSSS方法取得了显著成就,但作者发现仅提高伪掩码的平均交并比(mIoU)并不总能保证最终模型的高性能。为此,文章提出了ORANDNet,一种针对WSSS的先进集成方法,通过结合来自两个不同分类器的类激活图(CAMs)来提升伪掩码(PMs)的精度,并采用课程学习策略进一步减少PMs中的小噪声。实验结果表明,ORANDNet不仅显著提升了分割性能,还展示了其作为WSSS模型最终附加模块的潜力。

Read more...

揭秘代码作者归属:AuthAttLyzer-V2引领新一代源代码分析技术

AuthAttLyzer-V2: Unveiling Code Authorship Attribution using Enhanced Ensemble Learning Models & Generating Benchmark Dataset

摘要

本文介绍了一种名为“AuthAttLyzer-V2”的新型源代码特征提取器,专注于源代码作者归属(SCAA)。该研究通过分析C++代码中的词汇、语义、句法和N-gram特征,探索了作者识别的可能性。研究涉及24,000个源代码样本,来自3,000位作者,采用集成学习模型(如随机森林、梯度提升和XGBoost)并结合SHAP(SHapley Additive exPlanations)以提高解释性。该方法在识别编程风格方面表现出色,为恶意软件分类提供了关键见解。

Read more...

揭秘双曲网络中的隐藏核心-边缘结构:理论与应用的新视角

Uncovering the hidden core-periphery structure in hyperbolic networks

摘要

本文由Imran Ansari, Pawanesh Yadav和Niteesh Sahni共同撰写,深入探讨了双曲网络模型中的核心-边缘结构。双曲网络模型展示了小世界性、无标度性、高聚类系数和社区结构等基本特征。本文通过研究流行度-相似度优化模型(PSO)和S1/H2模型,利用基于标准随机游走马尔可夫链模型的成熟方法,全面探索了这些模型中核心-边缘结构的存在。研究结果表明,在特定条件下,核心-边缘结构可以非常明显。此外,通过统计测试验证了网络几何中观察到的核心-边缘结构的显著性。这项研究扩展了网络科学,揭示了适用于多个领域的核心-边缘洞察,增强了交通和信息系统的网络性能和韧性。

Read more...

数据质量与机器学习:工具与方法的综述——探索AI时代的数据管理新前沿

A Survey on Data Quality Dimensions and Tools for Machine Learning

摘要

本文《数据质量维度与机器学习工具综述》由Yuhan Zhou等五位作者共同撰写,旨在探讨数据质量(DQ)对机器学习(ML)模型性能、公平性、鲁棒性、安全性和可扩展性的关键影响。文章回顾了过去五年中17种数据质量评估和改进工具,通过介绍数据质量维度、度量标准及其在这些工具中的主要功能,比较了它们的优缺点,并提出了开发开源数据质量工具的路线图。此外,文章还强调了大型语言模型(LLMs)和生成式AI在数据质量评估和改进中的潜在应用,认为这一全面综述可以增强对ML中数据质量的理解,并推动以数据为中心的AI的发展。

Read more...

模糊逻辑引导的强化学习程序测试预言机:解决复杂环境下的预言机问题

Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs

摘要

本文由Shiyu Zhang、Haoyang Song、Qixin Wang和Yu Pei等研究者提出,针对强化学习(RL)程序测试中的“预言机问题”,即定义RL程序正确性的难题,提出了一种利用模糊逻辑的自动化预言机方法。该预言机通过量化代理对奖励策略的行为合规性,并分析其在训练回合中的趋势,来判断RL程序是否存在缺陷。研究在不同复杂度的RL程序上进行了评估,并与人工预言机进行了比较,结果显示在复杂环境中,模糊预言机表现优于人工预言机,显示出在复杂情况下提高RL程序测试效率和可靠性的潜力。

Read more...

解锁多样视角:基于角色多代理框架的辩论驱动论点生成

Unlocking Varied Perspectives: A Persona-Based Multi-Agent Framework with Debate-Driven Text Planning for Argument Generation

摘要

本文介绍了一种基于角色(persona)的多代理框架,用于生成具有多样性和说服力的论点。该框架受人类辩论启发,通过为每个代理分配一个代表其高层信念的独特角色,并设计代理交互过程,使代理能够协作辩论和讨论,形成一个整体的论点写作计划。这种辩论过程使得想法能够流畅和非线性地发展。实验结果表明,该框架能够通过自动和人工评估生成更多样化和有说服力的论点。

Read more...

车辆社交网络中的高效安全数据调度:基于Q-learning的创新算法

Towards Secure and Efficient Data Scheduling for Vehicular Social Networks

摘要

本文针对车辆社交网络中的高效安全数据调度问题,提出了一种基于Q-learning的算法。该算法通过构建神经网络增强数据处理能力,并在数据传输阶段采用Q-learning范式优化信息交换,同时通过差分隐私保护通信过程中的隐私。实验对比表明,该算法在车辆社交网络环境中相较于现有最先进的调度算法具有更优越的性能。

Read more...

革命性进展:自适应权重方法大幅提升物理信息神经网络性能

Self-adaptive weights based on balanced residual decay rate for physics-informed neural networks and deep operator networks

摘要

本文介绍了一种基于平衡残差衰减率的自适应权重方法,用于物理信息神经网络(PINNs)和物理信息深度算子网络(PIDeepONets)。该方法解决了复杂问题中训练这些网络时遇到的精度不足和效率低下的挑战。传统的物理信息神经网络在训练过程中,不同训练点的残差收敛速度存在显著差异,导致整体解的收敛受最慢收敛速度的点主导。为了平衡不同训练点的残差衰减率,本文提出了一种点对点的自适应权重方法,并通过大量数值实验证明了该方法在提高预测精度、加快收敛速度、降低训练不确定性、减少计算成本和简化超参数调整方面的优势。

Read more...
Previous Page 127 of 156 Next Page