AI 推荐系统对人类行为的影响:方法、结果与未来方向

A survey on the impact of AI-based recommenders on human behaviours: methodologies, outcomes and future directions

摘要

这篇论文对基于人工智能的推荐系统对人类行为的影响进行了调查,分析了其在社交媒体、在线零售、城市地图和生成式人工智能等四个生态系统中的影响。论文旨在系统化一个快速发展的领域,其中用于分类方法和结果的术语是分散和不系统的。论文讨论了推荐系统的影响,包括集中、模型崩溃、多样性、回音室、过滤气泡、不平等、两极分化、激进、音量等方面,并对未来研究提出了建议。

Read more...

FANFOLD:开创性的图归一化流驱动的非对称网络,引领无监督图级异常检测新纪元

FANFOLD: Graph Normalizing Flows-driven Asymmetric Network for Unsupervised Graph-Level Anomaly Detection

摘要

本文介绍了一种名为FANFOLD的新型图归一化流驱动的非对称网络,用于无监督图级异常检测。该研究针对现有基于知识蒸馏的方法在图级异常检测中存在的对称性问题,提出了一种非对称网络结构,通过引入归一化流来学习样本的潜在分布,从而有效区分正常图和异常图。FANFOLD在训练阶段将正常图的原始分布转换为标准正态分布,在推理阶段利用源-目标损失计算异常分数,以区分正常和异常图。实验结果表明,FANFOLD在15个不同领域的数据集上优于9种基线方法,显示出其在无监督图级异常检测任务中的优越性。

Read more...

GraphArena:大型语言模型在图计算问题上的新挑战

GraphArena: Benchmarking Large Language Models on Graph Computational Problems

摘要

GraphArena是一项针对大型语言模型(LLMs)在图计算问题上的基准测试工具。该工具通过使用百万级规模的现实世界图数据,涵盖知识图谱、社交网络和分子结构等多种场景,评估LLMs在图计算任务上的推理能力。GraphArena包含10个计算任务,包括4个多项式时间问题和6个NP完全问题,通过严格的评估框架对LLMs的输出进行分类,如正确、次优或幻觉(格式正确但不可行)。评估结果显示,即使是顶尖的LLMs在处理更大、更复杂的图问题时也会遇到困难,并存在幻觉问题。GraphArena为现有的LLM基准提供了宝贵的补充,并已开源。

Read more...

H-STAR:融合SQL与文本推理的先进表格处理算法

H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables

摘要

本文介绍了一种名为H-STAR的新型算法,该算法针对表格推理任务,结合了符号(SQL逻辑)和语义(基于文本)两种推理方法。H-STAR通过表格提取和自适应推理两个步骤,有效地解决了传统单一推理方法在处理复杂表格数据时的局限性。实验结果表明,H-STAR在多个表格问答和事实验证数据集上显著优于现有最先进的方法,展现了其高效性和有效性。

Read more...

JSCDS:利用Jensen-Shannon Divergence优化龋齿图像分类的核心数据选择方法

JSCDS: A Core Data Selection Method with Jason-Shannon Divergence for Caries RGB Images-Efficient Learning

摘要

本文介绍了一种名为JSCDS的核心数据选择方法,该方法利用Jensen-Shannon Divergence(JSD)来提高牙科龋齿RGB图像的分类效率。在深度学习模型中,高质量的数据对于提升模型性能至关重要,但同时也需要大量的训练资源。JSCDS通过选择核心数据集,有效消除了低质量和混淆数据,从而在不显著影响模型性能的前提下提高了训练效率。该方法通过计算样本嵌入表示和聚类中心之间的互信息,捕捉高维数据间的非线性依赖关系,显著提升了预测性能和时间效率。实验结果表明,JSCDS在仅使用50%的核心数据时,其性能就超过了使用完整数据集的模型。

Read more...

MH-pFLGB:医疗图像分析中的模型异质性个性化联邦学习新突破

MH-pFLGB: Model Heterogeneous personalized Federated Learning via Global Bypass for Medical Image Analysis

摘要

本文介绍了一种名为MH-pFLGB的新型个性化联邦学习方法,专门用于处理医疗图像分析中的模型异质性问题。该方法通过引入全局旁路策略,有效减少了对外部公共数据集的依赖,并能够处理非独立同分布(non-IID)数据。MH-pFLGB通过集成一个全局旁路模型和特征融合模块,增强了传统联邦学习的效果,使其在多个医疗任务中展现出优越的性能。

Read more...

MMEVALPRO:革新多模态模型评估的新基准

MMEvalPro: Calibrating Multimodal Benchmarks Towards Trustworthy and Efficient Evaluation

摘要

MMEVALPRO是一项针对大型多模态模型(LMMs)评估的新基准,旨在解决现有评估基准中存在的系统性偏差问题。该基准通过引入感知和知识锚定问题,增强了原始的多项选择题(MCQs),并定义了真实准确性(Genuine Accuracy, GA)作为主要评估指标,以更严格地评估模型的多模态理解能力。MMEVALPRO包含2,138个问题三元组,总计6,414个独特问题,其中三分之二由人类专家手动标注,其余来自现有基准(MMMU, ScienceQA, MathVista)。实验结果表明,MMEVALPRO比现有基准更具挑战性和可信度,最先进的LMMs与人类表现之间存在显著差距。

Read more...

pFLFE:通过特征增强实现个性化联邦学习的医疗图像分割新框架

pFLFE: Cross-silo Personalized Federated Learning via Feature Enhancement on Medical Image Segmentation

摘要

本文介绍了一种名为pFLFE的新型个性化跨领域联邦学习框架,专门用于医疗图像分割。该框架旨在解决医疗数据稀缺和隐私保护的问题,通过在不同医疗机构间利用多样化数据进行训练,同时避免直接访问原始数据。pFLFE框架通过特征增强和监督学习两个主要阶段,有效减少了客户端漂移问题,提高了训练稳定性和分割质量。此外,该框架设计了一种替代训练方法,减少了通信轮次,即使在通信资源有限的情况下也能保持分割质量。实验结果表明,pFLFE在三个医疗分割任务中优于现有最先进的方法。

Read more...

PhyTracker:革新浮游植物监测的智能追踪框架

PhyTracker: An Online Tracker for Phytoplankton

摘要

本文介绍了一种名为PhyTracker的智能原位追踪框架,专门用于自动追踪浮游植物。浮游植物作为水生生态系统的重要组成部分,其监测对于理解海洋生态过程和环境条件至关重要。传统的非原位观察方法耗时且资源密集,无法及时分析。PhyTracker通过克服浮游植物监测中的独特挑战,如在水流中的有限移动性、不显眼的外观和杂质的存在,提供了一种高效的解决方案。该框架包含三个创新模块:纹理增强特征提取(TFE)模块、注意力增强的时间关联(ATA)模块和流无关运动细化(FMR)模块,这些模块分别增强了特征捕捉、区分浮游植物和杂质、以及细化运动特征。通过在PMOT数据集上的广泛实验,PhyTracker在浮游植物追踪中表现出色,并在MOT数据集上展示了其通用性和优越性。

Read more...

PUZZLES:强化学习算法推理能力的新基准

PUZZLES: A Benchmark for Neural Algorithmic Reasoning

摘要

本文介绍了一个名为 PUZZLES 的基准测试,旨在促进强化学习中算法和逻辑推理的发展。该基准测试基于 Simon Tatham 的便携式谜题集,包含 40 个不同的逻辑谜题,具有可调整的大小和复杂度。作者评估了各种强化学习算法在 PUZZLES 上的性能,并提供了基线比较和未来研究的潜力。

Read more...
Previous Page 115 of 156 Next Page