提升弱监督语义分割精度:ORANDNet集成方法的突破与应用前景

Precision matters: Precision-aware ensemble for weakly supervised semantic segmentation

摘要

本文由Junsung Park和Hyunjung Shim共同撰写,聚焦于弱监督语义分割(WSSS)领域,该领域通过使用图像级标签等弱监督信息来训练分割模型,以降低全监督语义分割的高标注成本。尽管近期WSSS方法取得了显著成就,但作者发现仅提高伪掩码的平均交并比(mIoU)并不总能保证最终模型的高性能。为此,文章提出了ORANDNet,一种针对WSSS的先进集成方法,通过结合来自两个不同分类器的类激活图(CAMs)来提升伪掩码(PMs)的精度,并采用课程学习策略进一步减少PMs中的小噪声。实验结果表明,ORANDNet不仅显著提升了分割性能,还展示了其作为WSSS模型最终附加模块的潜力。

Read more...

揭秘代码作者归属:AuthAttLyzer-V2引领新一代源代码分析技术

AuthAttLyzer-V2: Unveiling Code Authorship Attribution using Enhanced Ensemble Learning Models & Generating Benchmark Dataset

摘要

本文介绍了一种名为“AuthAttLyzer-V2”的新型源代码特征提取器,专注于源代码作者归属(SCAA)。该研究通过分析C++代码中的词汇、语义、句法和N-gram特征,探索了作者识别的可能性。研究涉及24,000个源代码样本,来自3,000位作者,采用集成学习模型(如随机森林、梯度提升和XGBoost)并结合SHAP(SHapley Additive exPlanations)以提高解释性。该方法在识别编程风格方面表现出色,为恶意软件分类提供了关键见解。

Read more...

揭秘双曲网络中的隐藏核心-边缘结构:理论与应用的新视角

Uncovering the hidden core-periphery structure in hyperbolic networks

摘要

本文由Imran Ansari, Pawanesh Yadav和Niteesh Sahni共同撰写,深入探讨了双曲网络模型中的核心-边缘结构。双曲网络模型展示了小世界性、无标度性、高聚类系数和社区结构等基本特征。本文通过研究流行度-相似度优化模型(PSO)和S1/H2模型,利用基于标准随机游走马尔可夫链模型的成熟方法,全面探索了这些模型中核心-边缘结构的存在。研究结果表明,在特定条件下,核心-边缘结构可以非常明显。此外,通过统计测试验证了网络几何中观察到的核心-边缘结构的显著性。这项研究扩展了网络科学,揭示了适用于多个领域的核心-边缘洞察,增强了交通和信息系统的网络性能和韧性。

Read more...

数据质量与机器学习:工具与方法的综述——探索AI时代的数据管理新前沿

A Survey on Data Quality Dimensions and Tools for Machine Learning

摘要

本文《数据质量维度与机器学习工具综述》由Yuhan Zhou等五位作者共同撰写,旨在探讨数据质量(DQ)对机器学习(ML)模型性能、公平性、鲁棒性、安全性和可扩展性的关键影响。文章回顾了过去五年中17种数据质量评估和改进工具,通过介绍数据质量维度、度量标准及其在这些工具中的主要功能,比较了它们的优缺点,并提出了开发开源数据质量工具的路线图。此外,文章还强调了大型语言模型(LLMs)和生成式AI在数据质量评估和改进中的潜在应用,认为这一全面综述可以增强对ML中数据质量的理解,并推动以数据为中心的AI的发展。

Read more...

模糊逻辑引导的强化学习程序测试预言机:解决复杂环境下的预言机问题

Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs

摘要

本文由Shiyu Zhang、Haoyang Song、Qixin Wang和Yu Pei等研究者提出,针对强化学习(RL)程序测试中的“预言机问题”,即定义RL程序正确性的难题,提出了一种利用模糊逻辑的自动化预言机方法。该预言机通过量化代理对奖励策略的行为合规性,并分析其在训练回合中的趋势,来判断RL程序是否存在缺陷。研究在不同复杂度的RL程序上进行了评估,并与人工预言机进行了比较,结果显示在复杂环境中,模糊预言机表现优于人工预言机,显示出在复杂情况下提高RL程序测试效率和可靠性的潜力。

Read more...

解锁多样视角:基于角色多代理框架的辩论驱动论点生成

Unlocking Varied Perspectives: A Persona-Based Multi-Agent Framework with Debate-Driven Text Planning for Argument Generation

摘要

本文介绍了一种基于角色(persona)的多代理框架,用于生成具有多样性和说服力的论点。该框架受人类辩论启发,通过为每个代理分配一个代表其高层信念的独特角色,并设计代理交互过程,使代理能够协作辩论和讨论,形成一个整体的论点写作计划。这种辩论过程使得想法能够流畅和非线性地发展。实验结果表明,该框架能够通过自动和人工评估生成更多样化和有说服力的论点。

Read more...

车辆社交网络中的高效安全数据调度:基于Q-learning的创新算法

Towards Secure and Efficient Data Scheduling for Vehicular Social Networks

摘要

本文针对车辆社交网络中的高效安全数据调度问题,提出了一种基于Q-learning的算法。该算法通过构建神经网络增强数据处理能力,并在数据传输阶段采用Q-learning范式优化信息交换,同时通过差分隐私保护通信过程中的隐私。实验对比表明,该算法在车辆社交网络环境中相较于现有最先进的调度算法具有更优越的性能。

Read more...

革命性进展:自适应权重方法大幅提升物理信息神经网络性能

Self-adaptive weights based on balanced residual decay rate for physics-informed neural networks and deep operator networks

摘要

本文介绍了一种基于平衡残差衰减率的自适应权重方法,用于物理信息神经网络(PINNs)和物理信息深度算子网络(PIDeepONets)。该方法解决了复杂问题中训练这些网络时遇到的精度不足和效率低下的挑战。传统的物理信息神经网络在训练过程中,不同训练点的残差收敛速度存在显著差异,导致整体解的收敛受最慢收敛速度的点主导。为了平衡不同训练点的残差衰减率,本文提出了一种点对点的自适应权重方法,并通过大量数值实验证明了该方法在提高预测精度、加快收敛速度、降低训练不确定性、减少计算成本和简化超参数调整方面的优势。

Read more...

预测急诊出院后的高住院风险:一种集成学习方法的应用

Predicting Elevated Risk of Hospitalization Following Emergency Department Discharges

摘要

本文由Dat Hong, Philip M. Polgreen和Alberto Maria Segre共同撰写,聚焦于预测急诊部门出院后短期内(3天、7天和14天)的住院风险。文章通过数据挖掘技术,利用大型医院数据集,构建了高准确度的预测模型。该模型结合了逻辑回归、朴素贝叶斯和关联规则分类器,旨在帮助医生在急诊部门环境中预测患者早期入院的风险,从而提高患者安全和医疗服务质量。

Read more...

"AE-APT:深度学习驱动的APT检测新工具,革新网络安全防御"

Hack Me If You Can: Aggregating AutoEncoders for Countering Persistent Access Threats Within Highly Imbalanced Data

摘要

本文介绍了一种名为AE-APT的深度学习工具,用于在高度不平衡的数据集中检测高级持续威胁(APTs)。AE-APT采用了一系列从基本到基于Transformer的AutoEncoder方法,并通过在DARPA透明计算程序生成的来源跟踪数据库上进行评估,展示了其相较于其他方法的显著更高的检测率。该工具能够跨多个操作系统(包括Android、Linux、BSD和Windows)检测和排序异常,显示出在识别APT类模式方面的优越性能。

Read more...
Previous Page 127 of 156 Next Page