探索未知:增强型MCTS在通用视频游戏中的革命性应用

Enhancements for Real-Time Monte-Carlo Tree Search in General Video Game Playing

摘要

本文讨论了在通用视频游戏玩(GVGP)领域中,如何通过八种增强技术改进实时蒙特卡洛树搜索(MCTS)的性能。这些增强技术包括渐进历史、N-Gram选择技术、树重用、广度优先树初始化、损失避免、新颖性基础剪枝、知识基础评估和确定性游戏检测。这些技术旨在提高MCTS在处理未知游戏时的适应性和效率,特别是在GVGP框架中,通过这些增强技术,MCTS的平均胜率从31.0%提升到了48.4%,接近2015年GVG-AI竞赛中最佳代理的水平。

Read more...

探索视觉动态预测的新前沿:DisFormer模型的解耦表示学习

Learning Disentangled Representation in Object-Centric Models for Visual Dynamics Prediction via Transformers

摘要

本文介绍了一种在对象中心模型中学习解耦表示以提高视觉动态预测准确性的方法。该研究由印度IIT Delhi的研究团队领导,提出了一种新的架构DisFormer,通过使用变换器在视频中无监督地发现对象掩码,并学习密集的对象中心表示,从而预测未来的视觉动态。实验表明,该方法不仅能够发现语义上有意义的块,还能在动态预测的准确性上超越现有最先进(SOTA)的对象中心模型,特别是在未见过的属性组合(OOD)设置中表现出色。

Read more...

提升医疗数据预测准确性:基于过程挖掘的预处理新方法

Effect of a Process Mining based Pre-processing Step in Prediction of the Critical Health Outcomes

摘要

本文探讨了基于过程挖掘的预处理步骤在预测关键健康结果中的效果。研究背景在于医疗数据集的复杂性导致预测模型性能不佳,因此提出使用串联算法作为预处理步骤来提高数据质量。研究方法包括从MIMIC III和伊利诺伊大学医院数据库中提取16个医疗数据集,转换为事件日志,并应用串联算法和Split Miner算法生成过程模型。通过比较预测结果,发现串联算法显著提高了过程模型质量和关键健康结果的预测准确性。

Read more...

揭秘视觉-语言模型中的性别偏见:因果中介分析的新视角

Images Speak Louder than Words: Understanding and Mitigating Bias in Vision-Language Model from a Causal Mediation Perspective

摘要

本文探讨了视觉-语言模型(VLMs)在预训练过程中无意中学习到的偏见问题,特别是在性别信息与特定物体或场景相关联时。传统的偏见缓解方法主要集中在修改输入和监控模型输出概率分数的变化,但这些方法往往难以从模型组件的角度全面理解偏见。本文提出了一种结合因果中介分析的框架,用于测量和映射VLMs中偏见生成和传播的路径。研究结果表明,图像特征是偏见的主要贡献者,其影响远超文本特征。通过在图像编码器中模糊性别表示,可以有效减少偏见,同时保持模型性能和计算需求。

Read more...

深度学习加速MR热成像:提升非侵入性治疗的安全性与效率

Accelerated Proton Resonance Frequency-based Magnetic Resonance Thermometry by Optimized Deep Learning Method

摘要

本文介绍了一种基于深度学习的优化方法,用于加速基于质子共振频率(PRF)的磁共振(MR)热成像技术。该技术在聚焦超声(FUS)治疗中至关重要,特别是在需要快速且准确温度反馈的临床治疗中。论文提出了一种改进的深度学习方法,通过训练优化的神经网络模型,从欠采样的k空间数据中重建温度图,以提高动态MR温度图重建的时间分辨率。研究结果表明,该方法显著提高了MR热成像的准确性和效率,特别适用于临床上通过FUS进行的治疗,如子宫肌瘤、特发性震颤和前列腺癌的治疗。

Read more...

深度学习在漏洞检测中的现实挑战:Real-Vul数据集的启示

Revisiting the Performance of Deep Learning-Based Vulnerability Detection on Realistic Datasets

摘要

本文探讨了基于深度学习的软件漏洞检测模型在实际数据集上的性能表现。尽管这些模型在先前的评估中报告了高达99%的召回率和F1分数,但在实际应用场景中,特别是在评估整个代码库而非仅修复提交时,这些模型的表现显著下降。本文引入了一个名为Real-Vul的综合数据集,用于更准确地代表现实世界中漏洞检测模型的评估环境。通过评估DeepWukong、LineVul、ReVeal和IVDetect等漏洞检测方法,观察到性能大幅下降,精度下降高达95个百分点,F1分数下降高达91个百分点。进一步分析揭示了模型生成的嵌入在易受攻击和不确定样本之间存在显著重叠,这可能是导致大量误报的原因。此外,模型性能还受到漏洞特征(如类型和严重性)的影响。本文强调,在深度学习基础上的漏洞检测模型准备部署到实际环境中之前,仍需弥合显著的性能差距。

Read more...

牛津大学研究:多目标组合优化框架在合成人口生成中的应用

A multi-objective combinatorial optimisation framework for large scale hierarchical population synthesis

摘要

本文由Imran Mahmood等人撰写,提出了一种用于大规模分层人口合成的多目标组合优化框架。在基于代理的模拟中,合成人口常用于表示个体的结构、行为和交互。然而,生成一个准确反映真实人口统计数据的合成人口是一项挑战,尤其是在大规模操作时。本文介绍了一种多目标组合优化技术,用于大规模人口合成,并通过生成选定区域的合成人口并在真实人口数据的列联表上进行验证,展示了其有效性。该方法支持个体和家庭之间的复杂层次结构,可扩展到大规模人口,并实现了最小的列联表重建误差。因此,它为政策制定者和研究人员提供了一个有用的工具,用于模拟复杂人口的动态。

Read more...

突破数据稀缺:一种创新的合成表格数据生成方法

Artificial Inductive Bias for Synthetic Tabular Data Generation in Data-Scarce Scenarios

摘要

本文针对数据稀缺场景下的合成表格数据生成问题,提出了一种新颖的方法论。该方法利用深度生成模型(DGMs)通过迁移学习和元学习技术引入人工归纳偏差,以提高在有限真实数据环境中的合成数据质量和可靠性。研究通过比较四种不同的方法,展示了迁移学习策略(如预训练和模型平均)相对于元学习方法(如模型无关元学习MAML和领域随机化搜索DRS)的优越性。实验结果表明,该方法在多个基准数据集上显著提高了合成数据的质量,特别是在Jensen-Shannon散度指标上实现了高达50%的相对增益。该方法在医疗和金融等领域具有广泛的应用前景,这些领域通常面临数据稀缺的挑战。

Read more...

边缘设备上的统一异常检测:知识蒸馏与量化技术的融合

Unified Anomaly Detection methods on Edge Device using Knowledge Distillation and Quantization

摘要

本文介绍了一种在边缘设备上使用知识蒸馏和量化技术进行统一异常检测的方法。随着深度学习和智能制造在工业4.0中的快速发展,对高吞吐量、高性能和完全集成的视觉检测系统的需求日益增长。传统的异常检测方法通常需要为每个类别单独训练模型,而统一模型则通过单一模型处理多个类别,显著降低了成本和内存需求。本文通过实验证明了多类别模型在标准MVTec AD数据集上的性能与单类别模型相当,并探讨了在边缘设备上部署这些模型的量化技术,包括量化感知训练(QAT)和后训练量化(PTQ),以及不同精度宽度下的性能表现。

Read more...

连续治疗因果效应的共形预测:不确定性量化的新方法

Conformal Prediction for Causal Effects of Continuous Treatments

摘要

本文介绍了一种针对连续治疗因果效应的不确定性量化的新方法——连续治疗因果效应的共形预测(Conformal Prediction for Causal Effects of Continuous Treatments)。在个性化医疗等安全关键应用中,因果效应的不确定性量化至关重要。现有的共形预测方法主要针对二元或离散治疗,并假设倾向得分已知,这在实际应用中往往不成立。本文提出的方法能够为连续治疗的潜在结果提供有限样本预测区间,即使在倾向得分未知的情况下也能保证预测区间的有效性。该方法通过考虑倾向估计引入的额外不确定性,确保了预测区间的有效性。研究展示了该方法在合成数据集和真实世界数据集上的有效性,证明了其在实际应用中的潜力。

Read more...
Previous Page 87 of 156 Next Page