"AI革新集换式卡牌游戏:广义卡牌表示在魔法:集会中的应用与前景"

Learning With Generalised Card Representations for “Magic: The Gathering”

摘要

本文探讨了在“魔法:集会”(Magic: The Gathering, MTG)游戏中,如何通过学习广义的卡牌表示来改进AI在卡组构建(deck building)过程中的应用。卡组构建是集换式卡牌游戏(CCG)中的关键环节,但由于卡牌种类繁多、语义复杂以及新卡牌的不断推出,这一过程对玩家和模型都极具挑战性。传统的游戏AI方法在处理卡组构建时通常局限于固定的卡牌集合,这在实际应用中大大限制了其效用。本文提出了一种新的方法,通过研究基于数值、名义和文本特征的卡牌表示,以及卡牌图像和第三方服务的元信息,来泛化到未见过的卡牌,从而显著提高了AI在实际游戏中的实用性。实验结果表明,尽管特定选择的广义输入表示对预测已知卡牌的人类选择影响不大,但在处理新、未见过的卡牌时,性能可以得到显著提升。广义模型能够预测55%的人类选择在完全未见过的卡牌上,显示出对卡牌质量和策略的深刻理解。

Read more...

"DebUnc: 通过不确定性度量提升大型语言模型在多代理辩论中的置信度"

DebUnc: Mitigating Hallucinations in Large Language Model Agent Communication with Uncertainty Estimations

摘要

本文介绍了一种名为DebUnc的新型多代理辩论框架,旨在通过不确定性度量来评估代理的置信水平,从而增强大型语言模型(LLM)的能力。在多代理辩论中,多个LLM通过多轮辩论讨论问题的解决方案。然而,LLM经常产生看似自信但实际上错误的响应,这可能会误导其他代理。DebUnc通过在辩论中引入不确定性度量来解决这一问题,调整LLM的注意力机制以基于置信水平调整令牌权重,并探索使用文本提示来传达置信度。评估结果显示,基于注意力的方法特别有效,并且随着不确定性度量的发展,性能将继续提高。

Read more...

"FairPFN:利用Transformer实现反事实公平性的突破"

FairPFN: Transformers Can do Counterfactual Fairness

摘要

本文介绍了一种名为FairPFN的新型人工智能模型,该模型利用Transformer架构来实现反事实公平性。在机器学习系统广泛应用于医疗、法律执行和金融等领域的同时,这些系统往往基于可能带有偏见的历史数据进行训练。反事实公平性提供了一种直观的定义公平性的方法,与法律标准紧密对齐。尽管其在理论上有诸多优势,但在实践中,反事实公平性面临诸多挑战,主要与依赖领域知识和近似因果发现技术构建因果模型有关。FairPFN通过预训练使用合成公平数据来直接从观测数据中消除受保护属性的因果效应,从而在实际应用中无需访问正确的因果模型。实验结果表明,FairPFN在消除受保护属性的因果影响方面表现出色,为因果和反事实公平性的研究开辟了新的前景。

Read more...

"FastKGE:创新的知识图谱嵌入框架,实现高效持续学习和更新"

Fast and Continual Knowledge Graph Embedding via Incremental LoRA

摘要

本文介绍了一种名为FastKGE的快速持续知识图谱嵌入框架,该框架通过增量低秩适配器(IncLoRA)机制,有效地学习新知识同时保留旧知识。在实际应用中,知识图谱(KGs)不断增长,传统的知识图谱嵌入(KGE)方法在更新嵌入时需要重新训练整个图谱,导致训练成本高昂。FastKGE通过隔离新知识到特定层并使用IncLoRA机制,减少了训练参数,加速了微调过程,同时保持了链接预测性能。实验结果显示,FastKGE在多个公共数据集上减少了34%-49%的训练时间,并在新构建的数据集上节省了51%-68%的训练时间,同时提高了链接预测性能。

Read more...

"iLLM-TSC:融合强化学习与大型语言模型的智能交通信号控制革新"

iLLM-TSC: Integration reinforcement learning and large language model for traffic signal control policy improvement

摘要

本文介绍了一种名为iLLM-TSC的创新框架,该框架结合了强化学习(RL)和大型语言模型(LLM),旨在改善交通信号控制(TSC)策略。面对城市拥堵这一严峻挑战,传统的RL-based TSC系统往往忽视了由于通信降级(如数据包丢失、延迟和噪声)导致的不完美观察,以及奖励函数中未考虑的罕见现实事件(如紧急车辆)。iLLM-TSC框架通过利用LLM的泛化能力和逻辑推理能力,有效地管理了这些被忽视的元素和状态信息缺口,从而提升了RL代理的策略。该框架能够无缝集成到现有的RL-based TSC系统中,无需进行修改。实验证实,在通信降级条件下,iLLM-TSC相比传统RL方法平均减少了17.5%的等待时间,显示出其在智能交通系统中实际应用的巨大潜力。

Read more...

"LA-CMFER:跨多领域面部表情识别的新里程碑"

Learning with Alignments: Tackling the Inter- and Intra-domain Shifts for Cross-multidomain Facial Expression Recognition

摘要

本文针对跨多领域面部表情识别(CMFER)中的域间和域内偏移问题,提出了一种名为LA-CMFER的新型学习对齐框架。该框架通过全局和局部分支提取特征,并采用双层域间对齐方法优先处理难以对齐的样本,同时在聚类层面利用类别属性生成良好的特征空间,从而缩小域间偏移。为解决域内偏移,引入了多视角域内对齐方法,通过多视角聚类一致性约束和预测相似矩阵追求全局和局部视角间的一致性,优化伪标签并消除潜在噪声。实验结果表明,LA-CMFER在六个基准数据集上的表现优于现有方法。

Read more...

"mllm-NPU:革命性的移动设备上LLM推理系统,实现千倍速度提升"

Empowering 1000 tokens/second on-device LLM prefilling with mllm-NPU

摘要

本文介绍了一种名为mllm-NPU的新型LLM推理系统,该系统通过有效利用移动设备上的神经处理单元(NPU)来减少大型语言模型(LLM)的预填充延迟和能耗。mllm-NPU通过算法-系统协同设计,解决了LLM架构与现代NPU设计之间的几个语义鸿沟,实现了在设备上的高效LLM推理。该系统通过重新构建提示和模型,在提示级别、张量级别和块级别上进行了优化,显著提高了预填充速度和能效,为实际应用中的设备上LLM推理铺平了道路。

Read more...

"MobilePortrait: 开创移动设备上的实时神经头盔生成新纪元"

MobilePortrait: Real-Time One-Shot Neural Head Avatars on Mobile Devices

摘要

本文介绍了一种名为MobilePortrait的创新技术,旨在实现移动设备上的实时一次性神经头盔生成。该技术通过集成外部知识到运动建模和图像合成中,显著降低了学习复杂性,使得在移动设备上进行实时推理成为可能。MobilePortrait采用混合表示的显式和隐式关键点进行精确的运动建模,并预计算视觉特征以增强前景和背景合成。通过这些关键设计,结合简单的U-Net作为骨干网络,该方法在保持计算需求不到现有方法十分之一的同时,实现了最先进的性能。

Read more...

"REGAD:利用强化学习在噪声标签环境下提升图异常检测性能"

Graph Anomaly Detection with Noisy Labels by Reinforcement Learning

摘要

本文介绍了一种名为REGAD(REinforced Graph Anomaly Detector)的新型框架,用于在图异常检测(GAD)任务中处理带有噪声标签的问题。GAD在金融欺诈检测和社交网络机器人账户识别等领域有广泛应用。传统的GAD方法依赖高质量的标签数据,但在现实场景中,这些标签往往难以获取且可能包含噪声,导致性能严重下降。REGAD通过逐步剪除可疑节点的边来减轻噪声的影响,并设计了一个定制的动作和搜索空间来训练策略网络,以迭代优化策略。实验结果表明,REGAD在不同异常比例的三个数据集上均表现出优越的性能。

Read more...

"Video-STaR:革新视频理解的自训练方法"

Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision

摘要

本文介绍了一种名为Video Self-Training with augmented Reasoning (Video-STaR)的新方法,该方法允许使用任何标记的视频数据集进行视频指令调优。Video-STaR通过在指令生成和微调之间循环,提高了视频理解能力,并使大型视觉语言模型(LVLMs)能够适应新的下游任务。该方法在多个基准测试中展示了显著的性能提升,特别是在视频问答(VQA)和动作质量评估(AQA)任务中。

Read more...
Previous Page 44 of 156 Next Page