探索认知架构的未来:Companion的知识管理革命
摘要
本文介绍了Companion认知架构中的知识管理问题,强调了知识表示、访问和管理的重要性。论文提出了一系列解决方案,包括知识表示的语言CycL、知识访问的模块PlanB以及知识管理的工具如Provenance Cache和Archivist。这些工具和方法旨在使Companion能够更好地自主学习和推理,从而推动其从处理简单问题向更复杂的认知任务迈进。
Read more...本文介绍了Companion认知架构中的知识管理问题,强调了知识表示、访问和管理的重要性。论文提出了一系列解决方案,包括知识表示的语言CycL、知识访问的模块PlanB以及知识管理的工具如Provenance Cache和Archivist。这些工具和方法旨在使Companion能够更好地自主学习和推理,从而推动其从处理简单问题向更复杂的认知任务迈进。
Read more...本文介绍了一种名为“语法掩蔽”的方法,用于指导大型语言模型(LLM)生成符合给定上下文无关语法(CFG)的语法正确模型。传统的提示工程方法如少样本学习或引导虽然可以提高LLM生成正确语法模型的概率,但随着语法复杂性的增加,这些方法变得耗时且效果不佳。本文提出的方法通过约束解码确保输出遵循有效的语法结构,使用多个基于MontiCore构建的DSL和多个LLM进行测试,并通过相应的解析器验证每个模型的语法正确性。结果显示,语法掩蔽可以显著提高多个LLM的建模能力,减少对精细提示的需求,同时增加生成正确模型的机会。
Read more...本文由Y. Cordero等人撰写,探讨了量子机器学习(QML)在手绘草图矢量图像分类中的应用。文章介绍了混合经典-量子架构,该架构利用量子计算的特性来处理图像数据,特别是在当前量子硬件尚未成熟的情况下,通过经典模拟量子电路来实现。论文的核心在于展示了如何将矢量化的草图作为QML模型的测试平台,并报告了初步的积极结果。这一研究为计算机视觉领域提供了一种新的计算方式,并鼓励了量子机器学习在处理抽象概念数据方面的探索。
Read more...本文介绍了一种名为MEEG的新型多模态音乐诱发电位(EEG)数据集,以及一种名为AT-DGNN的新框架,用于基于EEG的情感识别。MEEG数据集通过捕捉广泛的音乐诱发的情感反应,为深入分析音乐情境下的脑波模式提供了可能。AT-DGNN框架结合了基于注意力的时序学习器和动态图神经网络(DGNN),能够准确地模拟EEG数据在不同脑网络拓扑结构中的局部和全局图动态。评估结果显示,AT-DGNN在唤醒度和效价方面的准确率(ACC)分别达到了83.06%和85.31%,超过了现有最先进(SOTA)方法。此外,与传统的DEAP数据集相比,本文的方法突出了音乐作为情感诱导媒介的潜力,并强调了图学习在情感识别技术中的应用前景。
Read more...本文介绍了一种名为“变分最佳N对齐”(Variational Best-of-N Alignment, vBoN)的新算法,旨在提高语言模型与人类偏好之间的对齐效率。传统最佳N(BoN)算法在推理时需要从语言模型中抽取N个样本,并选择奖励模型评分最高的样本作为输出,这种方法虽然有效但计算成本高。vBoN通过微调语言模型以最小化与BoN分布的反向KL散度,从而在不牺牲性能的前提下显著降低推理成本。实验结果表明,vBoN在保持与BoN相近性能的同时,大幅提升了推理效率。
Read more...本研究由Raluca Alexandra Fulgu和Valerio Capraro进行,旨在探讨大型语言模型(如GPT)中的性别偏见。通过七项实验,研究揭示了GPT在生成文本和处理道德困境时表现出明显的性别不对称性。例如,GPT更倾向于将典型的男性特征归因于女性,而在道德决策中,GPT认为对男性施加暴力以防止灾难比对女性施加暴力更为合适。这些发现强调了在管理包容性努力时需要谨慎,以避免无意中的歧视。
Read more...本文探讨了大型语言模型(LLMs)在使用人类偏好数据进行对齐时面临的隐私风险,特别是针对成员推理攻击(MIAs)的脆弱性。文章介绍了针对偏好数据的MIAs的新型参考框架PREMIA,并提供了实证证据表明,与PPO模型相比,DPO模型更容易受到MIAs的影响。研究强调了当前LLM对齐过程中隐私保护实践的不足,并提出了改进的方向。
Read more...本文由Hongbo Zhu等人在《无噪声解释用于驾驶行为预测》一文中提出,主要针对基于Transformer架构的人工智能模型中注意力机制的解释性问题。尽管注意力机制在多个AI领域取得了显著进展,但其内部工作原理仍需深入探索。现有的解释方法多侧重于分析注意力机制或基于梯度的归因,忽略了输入特征值的大小或跳跃连接模块的影响,且往往产生与模型决策无关的噪声像素归因,阻碍了人们对模型可视化结果的信任。为此,作者提出了一种易于实现且有效的解决方案——平滑噪声范数注意力(SNNA),通过权衡注意力与变换值向量的范数,并利用注意力梯度引导标签特定信号,随机采样输入扰动并平均相应梯度以生成无噪声归因。与以往在二分类或多分类任务中评估解释方法不同,本文探索了更复杂的多标签分类场景,即驾驶行为预测任务,并专门为此训练了一个模型。定性和定量评估结果均显示,SNNA在生成更清晰的视觉解释图和排序输入像素重要性方面优于其他最先进的基于注意力的解释方法。
Read more...本文探讨了人工智能机器是否能够学习到真实的客观概率。作者在论文中证明了在一些基本假设下,机器能够学习到真实客观概率的条件,即概率必须是直接可观测的。这一结论对于理解人工智能的学习能力和局限性具有重要意义。
Read more...本文探讨了深度学习模型中特征复杂性的量化问题,特别是模型如何倾向于学习简单特征而非复杂特征,这可能导致“捷径学习”现象。研究通过引入基于V-信息的特征复杂性度量,分析了从标准ImageNet训练的视觉模型中提取的10,000个特征的复杂性。研究发现,模型在训练初期主要学习简单特征,而复杂特征逐渐在后期出现。此外,研究还探讨了特征复杂性与模型决策重要性之间的关系,发现复杂特征往往重要性较低,而重要特征在训练过程中会变得更简单,类似于“沉积过程”。
Read more...