探索前沿:条件半监督数据增强在垃圾短信检测中的应用与突破

Conditional Semi-Supervised Data Augmentation for Spam Message Detection with Low Resource Data

摘要

本文由Ulin Nuha和Chih-Hsueh Lin共同撰写,探讨了在数据稀缺情况下通过条件半监督数据增强(CSSDA)进行垃圾短信检测的问题。传统的垃圾短信检测方法通常依赖于大量标记数据,而现有的数据增强技术在有效性和鲁棒性方面存在局限。CSSDA模型通过利用未标记数据进行数据增强,扩展了训练数据集,显著提高了垃圾短信检测的性能。实验结果表明,CSSDA在处理不同数量的未标记数据时,都能保持约85%的平衡准确率,显示出其优越的性能和鲁棒性。

Read more...

探索建筑形式的无限可能:Form Forge引领AI设计新纪元

Form Forge: Latent Space Exploration of Architectural Forms via Explicit Latent Variable Manipulation

摘要

本文介绍了一种名为“Form Forge”的创新系统,该系统利用StyleGAN2-ADA模型,通过直接操纵潜在变量来探索建筑形式的潜在空间。受Franois Blanciak的著作《SITELESS: 1001 Building Forms》的启发,Form Forge允许用户交互式地导航和修改潜在空间中的建筑形式,从而为建筑设计和人机交互提供了一种新颖的探索工具。该系统的开发旨在简化与高维复杂空间的交互,并作为对这类工具如何支持建筑设计创意过程的初步研究。

Read more...

探索视觉上下文中的逻辑推理:LogicVista基准测试的先进性与应用

LogicVista: Multimodal LLM Logical Reasoning Benchmark in Visual Contexts

摘要

LogicVista是一个评估多模态大型语言模型(MLLMs)在视觉上下文中逻辑推理能力的基准测试。随着MLLMs在图像诗歌创作和数学推理等领域的进步,逻辑推理任务的重要性日益凸显,尤其是在导航和解谜等活动中。LogicVista通过包含5种逻辑推理任务和9种不同能力的448个多选题,全面评估了8种MLLMs的逻辑认知能力。每个问题都附有正确答案和人工编写的推理过程,支持开放式和多选题的评估。该基准测试的代码和数据已公开,以便于模型性能的严格评估和比较。

Read more...

探索解析器性能预测的新前沿:MTPPS-PPP系统的创新与应用

Automatic Prediction of the Performance of Every Parser

摘要

本文介绍了一种新的解析器性能预测(PPP)模型,该模型利用机器翻译性能预测系统(MTPPS),基于文本、链接结构和括号树结构信息的外在和新颖特征,统计上独立于任何语言或解析器。这种新系统MTPPS-PPP能够预测任何语言中任何解析器的性能,有助于估计理解给定文本的语法难度、设定解析输出的期望、为特定领域选择解析器以及解析器组合系统。该系统在括号F1的PPP中取得了最先进的结果,相比仅使用文本特征取得了更好的结果,并与使用解析器和语言标签特定信息的前期研究表现相似。

Read more...

探索非线性因果关系的新前沿:CAF-PoNo方法的突破与应用

Enabling Causal Discovery in Post-Nonlinear Models with Normalizing Flows

摘要

本文介绍了一种名为CAF-PoNo(Causal discovery via Normalizing Flows for Post-Nonlinear models)的新方法,用于在Post-Nonlinear(PNL)因果模型中进行因果发现。PNL模型因其灵活性和适应性在复杂因果关系的建模中备受青睐,但准确捕捉模型所需的逆变性约束一直是现有研究的难题。CAF-PoNo方法利用Normalizing Flows架构来强化PNL模型中的逆变性约束,通过精确重建隐藏噪声,从而通过统计独立性测试进行因果效应识别。此外,该方法具有显著的可扩展性,能够通过因果顺序识别扩展到多变量因果发现,有效地揭示复杂的因果关系。实验结果表明,CAF-PoNo在双变量和多变量因果发现任务中均优于几种最先进的方法。

Read more...

探索高效去噪:LDNLM在乘性噪声去除中的应用与突破

Linear Attention Based Deep Nonlocal Means Filtering for Multiplicative Noise Removal

摘要

本文介绍了一种针对乘性噪声的去噪方法,该噪声广泛存在于雷达图像、医学图像等领域。传统的去噪方法如非局部均值滤波(NLM)在处理乘性噪声时存在计算复杂度高和推理速度慢的问题。为此,研究者提出了一种基于线性注意力机制的深度非局部均值滤波(LDNLM)方法,通过深度通道卷积神经网络(CNN)提取像素邻域信息,并利用线性注意力机制替代传统的相似度计算和加权平均过程,从而实现线性复杂度的非局部去噪算法。实验结果表明,LDNLM在模拟和真实乘性噪声图像上均表现出优于现有方法的性能,同时保持了与传统NLM相近的可解释性。

Read more...

提升医学视觉语言模型的事实准确性:RULE方法的突破与应用

RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models

摘要

本文探讨了医学大型视觉语言模型(Med-LVLMs)在医疗诊断中的应用,特别是其在生成响应时可能出现的事实错误问题。为了提高这些模型的事实准确性,研究者提出了一种名为RULE的新方法,该方法通过校准选择检索上下文的数量和使用偏好数据集进行微调,来控制事实风险并平衡模型对内部知识和检索上下文的依赖。实验结果显示,RULE在三个医学视觉问答(VQA)数据集上平均提高了20.8%的事实准确性。

Read more...

揭秘临床语言模型的隐形威胁:BadCLM后门攻击的深度解析

BadCLM: Backdoor Attack in Clinical Language Models for Electronic Health Records

摘要

本文探讨了临床语言模型在电子健康记录(EHR)系统中的安全漏洞,特别是针对这些模型的后门攻击。文章介绍了一种新的基于注意力的后门攻击方法BadCLM(Bad Clinical Language Models),该方法能够在模型中嵌入一个后门,使得模型在遇到特定触发器时产生错误的预测,而在其他情况下则正常工作。通过在MIMIC III数据集上的医院内死亡率预测任务中验证了BadCLM的有效性,揭示了临床决策支持系统中的一个重大安全风险。

Read more...

革新生物医学问答:利用生成语言模型提升答案的准确性与可靠性

How do you know that? Teaching Generative Language Models to Reference Answers to Biomedical Questions

摘要

本文介绍了一种生物医学领域的检索增强生成(RAG)系统,旨在提高在线用户问题答案的准确性和可靠性。该系统通过微调的大型语言模型(LLM)进行参考问题回答,其中从PubMed检索的相关摘要作为输入传递给LLM的上下文。系统的输出是基于PubMed摘要的答案,每个陈述都相应地引用了来源,允许用户验证答案。与PubMed搜索引擎相比,该检索系统实现了23%的绝对改进。基于小样本的手动评估,我们的微调LLM组件在引用相关摘要方面与GPT-4 Turbo取得了可比的结果。我们公开了用于微调模型的数据集以及基于Mistral-7B-instruct-v0.1和v0.2的微调模型。

Read more...

高效无环因果图采样:一种可扩展的贝叶斯因果发现方法

Scalable Variational Causal Discovery Unconstrained by Acyclicity

摘要

本文介绍了一种可扩展的贝叶斯因果发现方法,该方法能够在不显式强制无环性的情况下,有效地从观测数据中学习因果图的后验分布。传统的因果发现方法在处理大规模问题时面临计算上的挑战,尤其是在确保无环性约束方面。本文提出的方法通过引入一种新颖的可微分DAG采样技术,能够高效地生成无环因果图,并通过变分推断框架学习因果图的后验分布。实验结果表明,该方法在合成数据集和真实数据集上都表现出色,优于现有的几种先进方法。

Read more...
Previous Page 63 of 156 Next Page