探索知识图谱对齐与扩展的新方法:基于属性的KAE框架
摘要
本文提出了一种基于属性的知识图谱(KG)对齐与扩展方法(KAE),旨在解决语义异质性问题。传统方法主要依赖实体类型(etype)标签匹配,这在实际应用中表现不佳或不适用于某些情况。本文设计了一个基于机器学习的框架,包括一种新颖的基于属性的对齐方法,该方法允许根据定义实体类型的属性来对齐实体类型。实验结果显示,该方法在定量和定性上都有效,并且优于现有技术。
Read more...本文提出了一种基于属性的知识图谱(KG)对齐与扩展方法(KAE),旨在解决语义异质性问题。传统方法主要依赖实体类型(etype)标签匹配,这在实际应用中表现不佳或不适用于某些情况。本文设计了一个基于机器学习的框架,包括一种新颖的基于属性的对齐方法,该方法允许根据定义实体类型的属性来对齐实体类型。实验结果显示,该方法在定量和定性上都有效,并且优于现有技术。
Read more...本文介绍了一种基于机器翻译性能预测(MTPP)的方法来识别英语中两个词在特定上下文中的相似性。通过使用参照翻译机器(RTM),该方法能够在分级词相似性在上下文(GWSC)任务中取得顶尖结果。GWSC任务涉及在两个不同上下文(c1和c2)中对两个词的相似性进行连续尺度评分,并预测当上下文从c2变为c1时词对相似性(wps)的变化。本文通过无监督学习方法,利用RTM模型和堆叠机器学习模型,有效地预测了词对在不同上下文中的相似性及其变化,展示了在自然语言处理领域的应用潜力。
Read more...本文由Vishnu S. Pendyala和Madhulika Dutta共同撰写,探讨了在大型语言模型(LLMs)时代,如何通过光谱分析、可视化和可解释性分类来分析合成、虚假和真实信息的文本形式,以解答为何尽管经过多年研究和众多解决方案,错误信息问题仍未得到解决。文章通过多种嵌入技术在多个数据集上的应用,使用t-分布随机邻居嵌入(t-SNE)、主成分分析(PCA)和变分自编码器(VAEs)等多样化的光谱和非光谱方法,以及多种机器学习算法进行分类,并利用LIME、SHAP和集成梯度等解释性算法来解释分类结果。分析和解释结果显示,错误信息与真实信息紧密交织,机器学习算法在分离两者方面并不如文献中声称的那样有效。
Read more...本文介绍了一种新颖的神经网络模型,用于模拟平面弦乐器的声音和运动。该模型结合了模态合成和频谱建模,通过物理属性和基本频率作为输入,输出弦在时间和空间上的状态,从而解决非线性弦的偏微分方程。实验评估表明,该模型在弦运动模拟方面相较于现有基线架构具有更高的准确性。该模型的代码和演示已在线提供。
Read more...本文探讨了音乐时代识别的问题,这是一个在音乐分类和推荐系统中具有重要应用的任务。传统的音乐分类通常依赖于歌曲的发布年份,但在许多情况下,这一信息可能不可用。为此,论文提出了一种基于监督对比学习和艺术家信息的新型音乐时代识别方法。该方法通过音频和艺术家信息的结合,提高了音乐时代分类的准确性,特别是在处理数据不平衡和细微的时代差异时表现出色。
Read more...本文由Mélina Verger等人提出,针对预测学生模型在教育环境中的应用,特别是其预测结果的公平性问题。文章介绍了一种基于Model Absolute Density Distance (MADD)指标的后处理方法,旨在提高预测模型的公平性同时保持其准确性。该方法通过实验验证,在模拟和真实教育数据中均显示出有效性,特别是在预测在线课程学生成功率的应用中。文章的核心在于通过MADD指标量化模型对不同学生群体的预测行为差异,从而实现公平性的提升。
Read more...本文探讨了联邦学习(FL)中梯度泄露攻击的脆弱性,特别是在梯度保护机制中使用扰动方法的问题。文章提出了一种新型的扰动抵抗梯度泄露攻击(PGLA),该方法利用梯度扰动保护的固有扩散特性,构建了一个基于扩散的去噪模型,能够在不访问原始模型结构或第三方数据的情况下,恢复经过扰动的梯度。通过广泛的实验,PGLA展示了在梯度去噪和数据恢复方面的最佳质量,揭示了FL训练过程中梯度泄露的威胁。
Read more...本文探讨了多语言大型语言模型(LLMs)在信息检索增强生成(RAG)系统中的信息差异问题。研究发现在多语言环境下,LLMs在信息检索和答案生成过程中存在系统性的语言偏好,倾向于使用与查询语言相同的语言文档,尤其是在查询语言为高资源语言时。这种偏好可能导致信息不平等,强化了语言特定的信息茧房,边缘化了低资源语言的观点。研究提出了新的多语言合成数据集,并通过实验验证了这些发现,强调了在多语言LLMs中实现信息平等的挑战。
Read more...本文比较了美国的《2022年算法责任法案》(US AAA)与欧盟的《人工智能法案》(EU AIA),探讨了两者在监管自动化决策系统(ADS)方面的异同及相互学习的可能性。文章指出,尽管两项法案在政治背景和立法传统上存在差异,但它们都旨在建立治理基础设施,以确保ADS的伦理、法律和安全使用。US AAA通过定义关键术语和规定ADS所有者必须满足的要求,采取了一种相对高层次的方法,而EU AIA则提供了一个详细的欧洲范围内的保证生态系统。文章强调,两项法案都需要进一步完善,特别是在确保所有ADS的一致性要求和提供中小企业针对性的支持方面。
Read more...本文由Jakob Mökander, Justin Curl, 和 Mihir Kshirsagar 等人撰写,针对生成式人工智能(Generative AI)系统广泛应用带来的伦理和社会挑战,提出了一种新颖的审计蓝图。文章指出,现有的审计程序未能充分解决生成式AI系统所展现的涌现能力和广泛适应性带来的治理挑战。为此,作者提出了一种三层审计方法,包括治理审计(针对设计和传播生成式AI系统的技术提供者)、模型审计(在预训练后但在发布前对生成式AI系统进行)和应用审计(针对基于生成式AI系统的应用),这些审计相互补充并相互通知。文章还讨论了这种审计方法的局限性,并强调了审计在确保生成式AI系统合法、伦理和技术稳健性方面的重要性。
Read more...