"知识感知简约学习:关系图学习的新视角"

Knowledge-Aware Parsimony Learning: A Perspective from Relational Graphs

摘要

本文探讨了在关系图学习中,传统的暴力扩展训练数据集和可学习参数的策略(即缩放法则)并不总是能产生更强大的模型,主要原因在于架构不兼容和表示瓶颈。为了解决这一挑战,作者提出了一种新颖的框架——知识感知简约学习(Knowledge-Aware Parsimony Learning),该框架从关系图中提取知识(如符号逻辑和物理定律),并通过组合泛化应用于具体任务,从而实现多功能、样本高效和可解释的学习。实验结果表明,该框架在多个任务上超越了传统缩放方法,强调了在开发下一代学习技术时整合知识的重要性。

Read more...

"突破性研究:专门构建的LLM系统如何革新临床决策支持"

Answering real-world clinical questions using large language model based systems

摘要

本文探讨了使用基于大型语言模型(LLM)的系统来回答现实世界临床问题的方法。文章指出,尽管通用LLM在处理医疗领域的自然语言查询方面表现出色,但它们在提供相关和基于证据的答案方面存在局限性。相比之下,采用检索增强生成(RAG)和代理型LLM系统在回答临床问题时表现出更高的相关性和证据基础性。特别是代理型ChatRWD系统,它能够回答新颖的问题,为临床决策提供了新的证据生成途径。文章强调,虽然通用LLM不应直接用于临床决策,但专门构建的文献检索系统和代理型系统相结合,可以显著提高相关证据的可获得性,从而支持证据基础的医疗实践。

Read more...

AI 推荐系统对人类行为的影响:方法、结果与未来方向

A survey on the impact of AI-based recommenders on human behaviours: methodologies, outcomes and future directions

摘要

这篇论文对基于人工智能的推荐系统对人类行为的影响进行了调查,分析了其在社交媒体、在线零售、城市地图和生成式人工智能等四个生态系统中的影响。论文旨在系统化一个快速发展的领域,其中用于分类方法和结果的术语是分散和不系统的。论文讨论了推荐系统的影响,包括集中、模型崩溃、多样性、回音室、过滤气泡、不平等、两极分化、激进、音量等方面,并对未来研究提出了建议。

Read more...

FANFOLD:开创性的图归一化流驱动的非对称网络,引领无监督图级异常检测新纪元

FANFOLD: Graph Normalizing Flows-driven Asymmetric Network for Unsupervised Graph-Level Anomaly Detection

摘要

本文介绍了一种名为FANFOLD的新型图归一化流驱动的非对称网络,用于无监督图级异常检测。该研究针对现有基于知识蒸馏的方法在图级异常检测中存在的对称性问题,提出了一种非对称网络结构,通过引入归一化流来学习样本的潜在分布,从而有效区分正常图和异常图。FANFOLD在训练阶段将正常图的原始分布转换为标准正态分布,在推理阶段利用源-目标损失计算异常分数,以区分正常和异常图。实验结果表明,FANFOLD在15个不同领域的数据集上优于9种基线方法,显示出其在无监督图级异常检测任务中的优越性。

Read more...

GraphArena:大型语言模型在图计算问题上的新挑战

GraphArena: Benchmarking Large Language Models on Graph Computational Problems

摘要

GraphArena是一项针对大型语言模型(LLMs)在图计算问题上的基准测试工具。该工具通过使用百万级规模的现实世界图数据,涵盖知识图谱、社交网络和分子结构等多种场景,评估LLMs在图计算任务上的推理能力。GraphArena包含10个计算任务,包括4个多项式时间问题和6个NP完全问题,通过严格的评估框架对LLMs的输出进行分类,如正确、次优或幻觉(格式正确但不可行)。评估结果显示,即使是顶尖的LLMs在处理更大、更复杂的图问题时也会遇到困难,并存在幻觉问题。GraphArena为现有的LLM基准提供了宝贵的补充,并已开源。

Read more...

H-STAR:融合SQL与文本推理的先进表格处理算法

H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables

摘要

本文介绍了一种名为H-STAR的新型算法,该算法针对表格推理任务,结合了符号(SQL逻辑)和语义(基于文本)两种推理方法。H-STAR通过表格提取和自适应推理两个步骤,有效地解决了传统单一推理方法在处理复杂表格数据时的局限性。实验结果表明,H-STAR在多个表格问答和事实验证数据集上显著优于现有最先进的方法,展现了其高效性和有效性。

Read more...

JSCDS:利用Jensen-Shannon Divergence优化龋齿图像分类的核心数据选择方法

JSCDS: A Core Data Selection Method with Jason-Shannon Divergence for Caries RGB Images-Efficient Learning

摘要

本文介绍了一种名为JSCDS的核心数据选择方法,该方法利用Jensen-Shannon Divergence(JSD)来提高牙科龋齿RGB图像的分类效率。在深度学习模型中,高质量的数据对于提升模型性能至关重要,但同时也需要大量的训练资源。JSCDS通过选择核心数据集,有效消除了低质量和混淆数据,从而在不显著影响模型性能的前提下提高了训练效率。该方法通过计算样本嵌入表示和聚类中心之间的互信息,捕捉高维数据间的非线性依赖关系,显著提升了预测性能和时间效率。实验结果表明,JSCDS在仅使用50%的核心数据时,其性能就超过了使用完整数据集的模型。

Read more...

MH-pFLGB:医疗图像分析中的模型异质性个性化联邦学习新突破

MH-pFLGB: Model Heterogeneous personalized Federated Learning via Global Bypass for Medical Image Analysis

摘要

本文介绍了一种名为MH-pFLGB的新型个性化联邦学习方法,专门用于处理医疗图像分析中的模型异质性问题。该方法通过引入全局旁路策略,有效减少了对外部公共数据集的依赖,并能够处理非独立同分布(non-IID)数据。MH-pFLGB通过集成一个全局旁路模型和特征融合模块,增强了传统联邦学习的效果,使其在多个医疗任务中展现出优越的性能。

Read more...

MMEVALPRO:革新多模态模型评估的新基准

MMEvalPro: Calibrating Multimodal Benchmarks Towards Trustworthy and Efficient Evaluation

摘要

MMEVALPRO是一项针对大型多模态模型(LMMs)评估的新基准,旨在解决现有评估基准中存在的系统性偏差问题。该基准通过引入感知和知识锚定问题,增强了原始的多项选择题(MCQs),并定义了真实准确性(Genuine Accuracy, GA)作为主要评估指标,以更严格地评估模型的多模态理解能力。MMEVALPRO包含2,138个问题三元组,总计6,414个独特问题,其中三分之二由人类专家手动标注,其余来自现有基准(MMMU, ScienceQA, MathVista)。实验结果表明,MMEVALPRO比现有基准更具挑战性和可信度,最先进的LMMs与人类表现之间存在显著差距。

Read more...

pFLFE:通过特征增强实现个性化联邦学习的医疗图像分割新框架

pFLFE: Cross-silo Personalized Federated Learning via Feature Enhancement on Medical Image Segmentation

摘要

本文介绍了一种名为pFLFE的新型个性化跨领域联邦学习框架,专门用于医疗图像分割。该框架旨在解决医疗数据稀缺和隐私保护的问题,通过在不同医疗机构间利用多样化数据进行训练,同时避免直接访问原始数据。pFLFE框架通过特征增强和监督学习两个主要阶段,有效减少了客户端漂移问题,提高了训练稳定性和分割质量。此外,该框架设计了一种替代训练方法,减少了通信轮次,即使在通信资源有限的情况下也能保持分割质量。实验结果表明,pFLFE在三个医疗分割任务中优于现有最先进的方法。

Read more...
Previous Page 115 of 156 Next Page