深度学习中的特征复杂性:量化与理解

Understanding Visual Feature Reliance through the Lens of Complexity

摘要

本文探讨了深度学习模型中特征复杂性的量化问题,特别是模型如何倾向于学习简单特征而非复杂特征,这可能导致“捷径学习”现象。研究通过引入基于V-信息的特征复杂性度量,分析了从标准ImageNet训练的视觉模型中提取的10,000个特征的复杂性。研究发现,模型在训练初期主要学习简单特征,而复杂特征逐渐在后期出现。此外,研究还探讨了特征复杂性与模型决策重要性之间的关系,发现复杂特征往往重要性较低,而重要特征在训练过程中会变得更简单,类似于“沉积过程”。

Read more...

社交网络影响力最大化:新算法在营销策略中的应用与前景

Fractional Budget Allocation for Influence Maximization under General Marketing Strategies

摘要

本文探讨了在社交网络中通过部分折扣激励用户以最大化网络影响力的策略,即“分数预算分配下的影响力最大化问题”。文章提出了一种高效的算法,该算法能够在给定的总折扣约束下,通过分配初始折扣来最大化最终激活用户数量。该问题被证明是NP难问题,因此文章提出了一种(1 − 1/𝐴?)-近似算法,并通过在真实社交网络上的实验展示了其性能和可扩展性。

Read more...

计算阈值:人工智能治理的短视策略?

On the Limitations of Compute Thresholds as a Governance Strategy

摘要

本文探讨了以计算阈值作为治理策略的局限性。文章指出,计算阈值的选择缺乏科学依据,且未能考虑到计算与风险之间的复杂关系。作者认为,计算阈值作为目前实施的治理策略是短视的,可能无法有效降低风险。

Read more...

逆渲染技术引领手部重建革命:细粒度多视角手部模型的高保真度重建与渲染

Fine-Grained Multi-View Hand Reconstruction Using Inverse Rendering

摘要

本文介绍了一种基于逆渲染技术的细粒度多视角手部重建方法,旨在从多视角图像中恢复高保真度的手部模型及其精细纹理。该方法通过图卷积网络(GCN)预测参数化手部网格模型,并引入手部反照率和网格(HAM)优化模块,以保留网格拓扑结构并细化手部网格和纹理。此外,提出了一种基于网格的神经渲染方案,通过融合预训练的渲染网络与顶点特征,同时生成逼真的图像并优化网格几何。实验结果表明,该方法在重建精度和渲染质量方面优于现有技术。

Read more...

逻辑引导的溯因推理:高效生成地理空间轨迹的新方法

Geospatial Trajectory Generation via Efficient Abduction: Deployment for Independent Testing

摘要

本文介绍了一种基于逻辑程序引导的溯因推理方法,用于生成满足地理位置和时间约束的人工移动轨迹。该方法通过一种新颖的简约函数,即基于注释逻辑程序的聚合真值,来指导轨迹生成,从而在保护隐私的同时,支持分析人员对异常轨迹的可解释性。通过利用启发式(A*)搜索,该方法能够高效地生成移动轨迹,并在政府独立测试中展示了其准确性和可扩展性。此外,实验结果表明,生成的轨迹能够抵御专门设计的机器学习异常检测模型的检测。

Read more...

逻辑编程与集合攻击框架的等价性:新的视角和应用前景

On the Equivalence between Logic Programming and SETAF

摘要

这篇论文的标题是《On the Equivalence between Logic Programming and SETAF》,作者是来自巴西塞阿拉联邦大学的 João Alcântara、Renan Cordeiro 和 Samy Sá。该论文主要探讨了逻辑编程(Logic Programming)和集合攻击框架(SETAF)之间的等价关系。论文的主要内容是提供了从正常逻辑程序(NLP)到 SETAF 的翻译,反之亦然,从 SETAF 到 NLP 的翻译。作者证明了它们的语义之间存在对偶等价性,包括 L-稳定和半稳定语义之间的等价性。此外,对于一类称为无冗余原子逻辑程序(RFALP)的 NLP,还存在结构等价性,因为这些来回翻译是彼此的逆。然后,作者通过一系列文献中已知的程序转换,将任何 NLP 转换为等价的 RFALP,从而证明了 RFALP 与 NLP 具有相同的表达能力。作者还证明了这些程序转换是可合流的,这意味着每个 NLP 将被转换为唯一的 RFALP。

Read more...

革命性突破:分层扩散模型实现一次前向传递生成高分辨率图像

Layered Diffusion Model for One-Shot High Resolution Text-to-Image Synthesis

摘要

本文介绍了一种名为“分层扩散模型”的新型文本到图像生成技术,该技术能够在一次前向传递中从自然语言描述生成高分辨率图像。与传统的单一分辨率生成方法相比,该模型采用了一种分层的U-Net架构,能够在多个分辨率尺度上同时合成图像,显著提高了图像质量和生成效率。此外,该模型通过使用sinc插值公式来缩放噪声,并采用移位余弦调度策略,进一步优化了图像合成的过程。

Read more...

革命性进展:CBCT图像中牙齿自动识别与三维边界框提取技术

An efficient method to automate tooth identification and 3D bounding box extraction from Cone Beam CT Images

摘要

本文介绍了一种高效的方法,用于从锥形束计算机断层扫描(CBCT)图像中自动识别和提取牙齿的三维边界框。该方法对于分析牙科病理至关重要,特别是在处理填充物和其他修复体引入的伪影时。论文提出的解决方案通过将三维图像分割成轴向切片进行图像检测,使用单阶段对象检测器定位和标记牙齿,并随后绘制边界框以创建每个牙齿的三维表示。该方法已成功集成到牙科分析工具Dentomo中。

Read more...

革新情境偏好排序:基于InfoNCE损失的CLIP框架适应性研究

Contrastive Learning of Preferences with a Contextual InfoNCE Loss

摘要

本文由Timo Bertram等人撰写,针对在情境偏好排序中常见的问题——单一偏好动作与多个选择进行比较,导致复杂性增加和偏好分布偏斜,提出了一种解决方案。通过适应CLIP框架中的InfoNCE损失,作者在可收集卡牌游戏领域展示了其方法的有效性,旨在学习一个能够捕捉单张卡牌与整个卡池之间关联的嵌入空间,基于人类的选择。研究结果表明,未经修改的CLIP在这些问题上表现不佳,但通过适应性调整,模型性能超过了使用三元组损失训练的前期工作,并缓解了与挖掘三元组相关的问题。

Read more...
Previous Page 54 of 156 Next Page