探索非线性网络的线性近似:一种新颖的泛化边界方法

A Generalization Bound for Nearly-Linear Networks

摘要

本文探讨了非线性网络作为线性网络的扰动问题,并提出了一种新颖的泛化边界,该边界对于接近线性的网络变得非空洞。与先前提出非空洞泛化边界的工作相比,本文的边界具有先验性,即在实际训练之前就可以评估这些边界,而不需要依赖于尚未完全理解的隐式偏差现象。本文的主要贡献是一个泛化边界,适用于全连接网络、梯度下降(梯度流)以及使用均方误差损失的二分类问题。实验验证了该边界在降采样的MNIST数据集上的有效性。

Read more...

探索颜色聚类的未来:基于模糊颜色模型的新型聚类算法

Fuzzy color model and clustering algorithm for color clustering problem

摘要

本文由Dae-Won Kim和Kwang H. Lee撰写,聚焦于颜色聚类问题,提出了一种基于模糊颜色模型和聚类算法的新解决方案。该研究的核心在于如何有效地对任意颜色数据进行聚类,通过引入模糊颜色模型来处理颜色数据固有的不确定性和模糊性。论文详细介绍了模糊颜色模型的构建、颜色成员关系的计算方法以及基于此模型的新型模糊聚类算法。该算法通过迭代优化,能够将颜色数据集有效地划分为同质的颜色子集,这一技术在颜色图像分割等领域具有广泛的应用前景。

Read more...

推进手稿元数据:Jagiellonian大学的研究进展——探索文化遗产数字化的新标准

Advancing Manuscript Metadata: Work in Progress at the Jagiellonian University

摘要

本文由Jagiellonian大学的Luiz do Valle Miranda等人撰写,主要探讨了在数字化文化遗产文档的过程中,如何开发和完善手稿元数据模型。文章介绍了Jagiellonian大学博物馆、档案馆和图书馆的合作项目,旨在通过数字化、详细描述和整合这些描述到链接数据云中,来提升文化遗产文档的可用性和互操作性。文章详细比较了现有的两种主要标准——Europeana数据模型(EDM)和编码档案描述(EAD),并提出了一个结合这两种标准优点的新的元数据模型,以实现更高级别的集成和元数据丰富性。

Read more...

提升分布外检测:结合现有后验方法的新策略

Improving Out-of-Distribution Detection by Combining Existing Post-hoc Methods

摘要

本文探讨了如何通过结合现有的后验方法来改进深度学习模型中的分布外(Out-of-Distribution, OOD)检测。OOD检测是确保机器学习模型在安全关键应用中可靠性的关键步骤。尽管已有多种OOD检测方法,但每种方法在不同数据集上的表现不一,因此本文提出了一种新的策略,通过集成多种检测分数来构建一个统一的OOD检测器。本文提出了四种组合策略,包括多数投票、基于经验累积分布函数(CDF)和基于最优传输的多变量分位数等方法,并扩展了常用的OOD评估指标以适应多维OOD检测器。实验结果表明,这些组合策略在多个基准测试中显著提高了OOD检测的性能。此外,本文还提出了一系列指导原则,用于在没有已知OOD数据的情况下选择最佳的OOD检测器组合。

Read more...

提升推荐系统解释性:基于正未标记学习的创新方法

Positive-Unlabelled Learning for Improving Image-based Recommender System Explainability

摘要

本文探讨了基于用户上传物品图像的推荐系统(RS)解释性的改进方法。当前模型在定义训练数据时,假设所有用户上传的图像都可以作为负面训练示例,这种假设过于简单且不准确。本文提出了一种新的解释器训练流程,利用正未标记(PU)学习技术,通过一种新颖的用户个性化、两步相似性基础的PU学习算法,为每个用户选择可靠的负面示例子集。实验结果表明,这种基于PU的方法在六个流行的真实世界数据集中优于现有的非PU方法,证明了通过提高训练数据质量而非增加模型复杂度可以改善基于视觉的RS解释性。

Read more...

揭秘ChatGPT的保护机制:用户身份如何影响模型的决策?

ChatGPT Doesn"t Trust Chargers Fans: Guardrail Sensitivity in Context

摘要

本文探讨了大型语言模型(LLM)在生产中的偏见问题,特别是其保护机制(guardrails)的敏感性。研究发现,GPT-3.5在处理用户请求时,会根据用户的年龄、性别、种族和政治立场等因素,不同程度地拒绝执行某些请求。例如,年轻、女性和亚裔美国人的用户在请求被审查或非法信息时更容易触发拒绝机制。此外,模型还会根据用户可能的政治立场来调整其保护机制的行为,显示出一定的政治倾向性。研究还发现,即使是看似无害的信息,如体育迷的身份,也可能影响模型的保护机制。这些发现揭示了LLM在实际应用中的潜在偏见问题,对未来的模型设计和应用具有重要意义。

Read more...

揭秘ChatGPT的守卫机制:用户背景如何影响模型的拒绝行为?

ChatGPT Doesn"t Trust Chargers Fans: Guardrail Sensitivity in Context

摘要

本文探讨了大型语言模型(LLM)如GPT-3.5中的守卫机制(guardrails)对用户请求的拒绝行为,特别是在用户背景信息影响下的偏见问题。研究发现,年轻、女性和亚裔美国人的虚拟角色在请求被审查或非法信息时更容易触发拒绝机制。此外,守卫机制表现出谄媚行为,拒绝执行用户可能不同意的政治立场请求。研究还发现,某些身份群体和看似无害的信息,如体育迷身份,也能引发守卫机制的敏感变化。这些发现揭示了LLM在处理用户请求时的潜在偏见,特别是在敏感和不确定问题上的响应限制。

Read more...

时间序列数据的最小惊喜解释:一种新的推理框架

Reasoning about unpredicted change and explicit time

摘要

本文由Florence Dupin de Saint-Cyr和Jérôme Lang撰写,探讨了关于未预测变化和显式时间的推理问题。文章提出了一种解释时间戳观察结果的方法,通过“惊喜”(即流的状态值变化)来解释观察结果。文章定义了一个处理惊喜的框架,提供了最小惊喜集合及其发生的时间间隔,并从基于模型的诊断角度对其进行了特征化。此外,文章还提出了一种概率方法来最小化惊喜。

Read more...

深度强化学习在桥梁经济跨度选择中的应用与前景

Economic span selection of bridge based on deep reinforcement learning

摘要

本文由Leye Zhang等人提出,利用深度强化学习中的深度Q网络(DQN)算法来选择桥梁的经济跨度。桥梁跨度的选择对总成本有显著影响,合理的跨度选择可以降低工程成本。文章首先对桥梁经济跨度进行了理论分析,并推导了经济跨度的理论解公式。接着,详细描述了桥梁模拟环境的构建过程,包括观察空间、动作空间和奖励函数。通过构建代理,使用卷积神经网络近似Q函数,采用ε贪婪策略进行动作选择,并通过经验回放进行训练。实验验证了代理能够成功学习到最优策略,实现桥梁经济跨度的选择。这一研究为桥梁设计提供了一个潜在的决策工具。

Read more...

物理信息神经网络在滑坡预测中的创新应用

Towards physics-informed neural networks for landslide prediction

摘要

本文介绍了一种基于物理信息神经网络(PINN)的滑坡预测方法,由Ashok Dahal和Luigi Lombardo提出。该方法旨在解决区域尺度滑坡预测问题,通过结合标准数据驱动架构和物理约束,解决Newmark斜坡稳定性方法中典型的永久变形问题。论文的核心在于利用神经网络从常见的代理变量中显式地提取地质技术参数,并通过与可用地震滑坡清单的损失函数最小化来优化模型。研究结果显示,该模型不仅在标准易感性输出方面表现出优异的预测性能,而且在过程中还生成了区域尺度的预期地质技术属性图。此外,作者公开分享了数据和代码,以促进实验的可重复性和可再现性。

Read more...
Previous Page 42 of 156 Next Page