推进手稿元数据:Jagiellonian大学的研究进展——探索文化遗产数字化的新标准

Advancing Manuscript Metadata: Work in Progress at the Jagiellonian University

摘要

本文由Jagiellonian大学的Luiz do Valle Miranda等人撰写,主要探讨了在数字化文化遗产文档的过程中,如何开发和完善手稿元数据模型。文章介绍了Jagiellonian大学博物馆、档案馆和图书馆的合作项目,旨在通过数字化、详细描述和整合这些描述到链接数据云中,来提升文化遗产文档的可用性和互操作性。文章详细比较了现有的两种主要标准——Europeana数据模型(EDM)和编码档案描述(EAD),并提出了一个结合这两种标准优点的新的元数据模型,以实现更高级别的集成和元数据丰富性。

Read more...

提升分布外检测:结合现有后验方法的新策略

Improving Out-of-Distribution Detection by Combining Existing Post-hoc Methods

摘要

本文探讨了如何通过结合现有的后验方法来改进深度学习模型中的分布外(Out-of-Distribution, OOD)检测。OOD检测是确保机器学习模型在安全关键应用中可靠性的关键步骤。尽管已有多种OOD检测方法,但每种方法在不同数据集上的表现不一,因此本文提出了一种新的策略,通过集成多种检测分数来构建一个统一的OOD检测器。本文提出了四种组合策略,包括多数投票、基于经验累积分布函数(CDF)和基于最优传输的多变量分位数等方法,并扩展了常用的OOD评估指标以适应多维OOD检测器。实验结果表明,这些组合策略在多个基准测试中显著提高了OOD检测的性能。此外,本文还提出了一系列指导原则,用于在没有已知OOD数据的情况下选择最佳的OOD检测器组合。

Read more...

提升推荐系统解释性:基于正未标记学习的创新方法

Positive-Unlabelled Learning for Improving Image-based Recommender System Explainability

摘要

本文探讨了基于用户上传物品图像的推荐系统(RS)解释性的改进方法。当前模型在定义训练数据时,假设所有用户上传的图像都可以作为负面训练示例,这种假设过于简单且不准确。本文提出了一种新的解释器训练流程,利用正未标记(PU)学习技术,通过一种新颖的用户个性化、两步相似性基础的PU学习算法,为每个用户选择可靠的负面示例子集。实验结果表明,这种基于PU的方法在六个流行的真实世界数据集中优于现有的非PU方法,证明了通过提高训练数据质量而非增加模型复杂度可以改善基于视觉的RS解释性。

Read more...

揭秘ChatGPT的保护机制:用户身份如何影响模型的决策?

ChatGPT Doesn"t Trust Chargers Fans: Guardrail Sensitivity in Context

摘要

本文探讨了大型语言模型(LLM)在生产中的偏见问题,特别是其保护机制(guardrails)的敏感性。研究发现,GPT-3.5在处理用户请求时,会根据用户的年龄、性别、种族和政治立场等因素,不同程度地拒绝执行某些请求。例如,年轻、女性和亚裔美国人的用户在请求被审查或非法信息时更容易触发拒绝机制。此外,模型还会根据用户可能的政治立场来调整其保护机制的行为,显示出一定的政治倾向性。研究还发现,即使是看似无害的信息,如体育迷的身份,也可能影响模型的保护机制。这些发现揭示了LLM在实际应用中的潜在偏见问题,对未来的模型设计和应用具有重要意义。

Read more...

揭秘ChatGPT的守卫机制:用户背景如何影响模型的拒绝行为?

ChatGPT Doesn"t Trust Chargers Fans: Guardrail Sensitivity in Context

摘要

本文探讨了大型语言模型(LLM)如GPT-3.5中的守卫机制(guardrails)对用户请求的拒绝行为,特别是在用户背景信息影响下的偏见问题。研究发现,年轻、女性和亚裔美国人的虚拟角色在请求被审查或非法信息时更容易触发拒绝机制。此外,守卫机制表现出谄媚行为,拒绝执行用户可能不同意的政治立场请求。研究还发现,某些身份群体和看似无害的信息,如体育迷身份,也能引发守卫机制的敏感变化。这些发现揭示了LLM在处理用户请求时的潜在偏见,特别是在敏感和不确定问题上的响应限制。

Read more...

时间序列数据的最小惊喜解释:一种新的推理框架

Reasoning about unpredicted change and explicit time

摘要

本文由Florence Dupin de Saint-Cyr和Jérôme Lang撰写,探讨了关于未预测变化和显式时间的推理问题。文章提出了一种解释时间戳观察结果的方法,通过“惊喜”(即流的状态值变化)来解释观察结果。文章定义了一个处理惊喜的框架,提供了最小惊喜集合及其发生的时间间隔,并从基于模型的诊断角度对其进行了特征化。此外,文章还提出了一种概率方法来最小化惊喜。

Read more...

深度强化学习在桥梁经济跨度选择中的应用与前景

Economic span selection of bridge based on deep reinforcement learning

摘要

本文由Leye Zhang等人提出,利用深度强化学习中的深度Q网络(DQN)算法来选择桥梁的经济跨度。桥梁跨度的选择对总成本有显著影响,合理的跨度选择可以降低工程成本。文章首先对桥梁经济跨度进行了理论分析,并推导了经济跨度的理论解公式。接着,详细描述了桥梁模拟环境的构建过程,包括观察空间、动作空间和奖励函数。通过构建代理,使用卷积神经网络近似Q函数,采用ε贪婪策略进行动作选择,并通过经验回放进行训练。实验验证了代理能够成功学习到最优策略,实现桥梁经济跨度的选择。这一研究为桥梁设计提供了一个潜在的决策工具。

Read more...

物理信息神经网络在滑坡预测中的创新应用

Towards physics-informed neural networks for landslide prediction

摘要

本文介绍了一种基于物理信息神经网络(PINN)的滑坡预测方法,由Ashok Dahal和Luigi Lombardo提出。该方法旨在解决区域尺度滑坡预测问题,通过结合标准数据驱动架构和物理约束,解决Newmark斜坡稳定性方法中典型的永久变形问题。论文的核心在于利用神经网络从常见的代理变量中显式地提取地质技术参数,并通过与可用地震滑坡清单的损失函数最小化来优化模型。研究结果显示,该模型不仅在标准易感性输出方面表现出优异的预测性能,而且在过程中还生成了区域尺度的预期地质技术属性图。此外,作者公开分享了数据和代码,以促进实验的可重复性和可再现性。

Read more...

生成式方法控制复杂物理系统:DiffPhyCon 的创新与应用

A Generative Approach to Control Complex Physical Systems

摘要

本文介绍了一种名为 DiffPhyCon 的新方法,用于解决复杂物理系统的控制问题。该方法通过扩散模型联合优化生成能量和控制目标,能够生成控制序列和状态轨迹。此外,作者还提出了一种先验重加权技术,以在训练分布之外发现更好的控制序列。作者在 1D Burgers 方程和 2D 水母运动控制任务上进行了实验,结果表明该方法优于传统的、有监督的和强化学习方法。

Read more...

知识图谱与大型语言模型的融合:提升AI的智能与可信度

Combining Knowledge Graphs and Large Language Models

摘要

本文探讨了如何结合知识图谱(KGs)和大型语言模型(LLMs)以提升自然语言处理(NLP)任务的性能。论文指出,尽管LLMs在语言理解和生成方面表现出色,但它们仍存在幻觉和缺乏领域特定知识的问题。通过引入KGs,可以有效地解决这些问题,因为KGs以结构化格式组织信息,能够捕捉实体间的关系。此外,LLMs也能辅助KGs的构建和验证。论文通过分析28篇相关文献,系统地比较了KG增强的LLMs、LLM增强的KGs以及LLM-KG混合方法,为研究人员提供了深入的见解和指导。

Read more...
Previous Page 42 of 156 Next Page