探索RTM模型在推文情感分析与属性判别中的先进应用

Identifying Intensity of the Structure and Content in Tweets and the Discriminative Power of Attributes in Context with Referential Translation Machines

摘要

本文介绍了一种使用参考翻译机(RTM)来识别推文结构和内容强度以及属性在上下文中的判别力的方法。通过将任务转化为机器翻译性能预测(MTPP),RTM模型能够预测英语、阿拉伯语和西班牙语推文中的情感强度,并评估属性在区分两个词时的有效性。该研究在SemEval-2018的两个预测任务中展示了RTM模型的应用,取得了令人鼓舞的结果。

Read more...

探索具身任务规划:MFE-ETP基准引领多模态基础模型的新前沿

MFE-ETP: A Comprehensive Evaluation Benchmark for Multi-modal Foundation Models on Embodied Task Planning

摘要

本文介绍了一种名为MFE-ETP的综合评估基准,用于评估多模态基础模型(MFMs)在具身任务规划中的性能。该基准旨在深入探讨MFMs在此领域的能力和局限性,通过构建一个包含对象理解、时空感知、任务理解和具身推理四个关键能力的系统评估框架。MFE-ETP基准以其复杂的任务场景、典型的任务类型、不同难度的任务实例和丰富的测试案例类型为特点,涵盖从多模态问题回答到具身任务推理的广泛范围。此外,本文还提供了一个简单易用的自动评估平台,用于在提出的基准上对多个MFMs进行自动化测试。通过使用该基准和评估平台,研究者评估了几个最先进的MFMs,并发现它们在性能上显著落后于人类水平。MFE-ETP是一个高质量、大规模且具有挑战性的基准,与现实世界任务相关。

Read more...

探索前沿:条件半监督数据增强在垃圾短信检测中的应用与突破

Conditional Semi-Supervised Data Augmentation for Spam Message Detection with Low Resource Data

摘要

本文由Ulin Nuha和Chih-Hsueh Lin共同撰写,探讨了在数据稀缺情况下通过条件半监督数据增强(CSSDA)进行垃圾短信检测的问题。传统的垃圾短信检测方法通常依赖于大量标记数据,而现有的数据增强技术在有效性和鲁棒性方面存在局限。CSSDA模型通过利用未标记数据进行数据增强,扩展了训练数据集,显著提高了垃圾短信检测的性能。实验结果表明,CSSDA在处理不同数量的未标记数据时,都能保持约85%的平衡准确率,显示出其优越的性能和鲁棒性。

Read more...

探索建筑形式的无限可能:Form Forge引领AI设计新纪元

Form Forge: Latent Space Exploration of Architectural Forms via Explicit Latent Variable Manipulation

摘要

本文介绍了一种名为“Form Forge”的创新系统,该系统利用StyleGAN2-ADA模型,通过直接操纵潜在变量来探索建筑形式的潜在空间。受Franois Blanciak的著作《SITELESS: 1001 Building Forms》的启发,Form Forge允许用户交互式地导航和修改潜在空间中的建筑形式,从而为建筑设计和人机交互提供了一种新颖的探索工具。该系统的开发旨在简化与高维复杂空间的交互,并作为对这类工具如何支持建筑设计创意过程的初步研究。

Read more...

探索视觉上下文中的逻辑推理:LogicVista基准测试的先进性与应用

LogicVista: Multimodal LLM Logical Reasoning Benchmark in Visual Contexts

摘要

LogicVista是一个评估多模态大型语言模型(MLLMs)在视觉上下文中逻辑推理能力的基准测试。随着MLLMs在图像诗歌创作和数学推理等领域的进步,逻辑推理任务的重要性日益凸显,尤其是在导航和解谜等活动中。LogicVista通过包含5种逻辑推理任务和9种不同能力的448个多选题,全面评估了8种MLLMs的逻辑认知能力。每个问题都附有正确答案和人工编写的推理过程,支持开放式和多选题的评估。该基准测试的代码和数据已公开,以便于模型性能的严格评估和比较。

Read more...

探索解析器性能预测的新前沿:MTPPS-PPP系统的创新与应用

Automatic Prediction of the Performance of Every Parser

摘要

本文介绍了一种新的解析器性能预测(PPP)模型,该模型利用机器翻译性能预测系统(MTPPS),基于文本、链接结构和括号树结构信息的外在和新颖特征,统计上独立于任何语言或解析器。这种新系统MTPPS-PPP能够预测任何语言中任何解析器的性能,有助于估计理解给定文本的语法难度、设定解析输出的期望、为特定领域选择解析器以及解析器组合系统。该系统在括号F1的PPP中取得了最先进的结果,相比仅使用文本特征取得了更好的结果,并与使用解析器和语言标签特定信息的前期研究表现相似。

Read more...

探索非线性因果关系的新前沿:CAF-PoNo方法的突破与应用

Enabling Causal Discovery in Post-Nonlinear Models with Normalizing Flows

摘要

本文介绍了一种名为CAF-PoNo(Causal discovery via Normalizing Flows for Post-Nonlinear models)的新方法,用于在Post-Nonlinear(PNL)因果模型中进行因果发现。PNL模型因其灵活性和适应性在复杂因果关系的建模中备受青睐,但准确捕捉模型所需的逆变性约束一直是现有研究的难题。CAF-PoNo方法利用Normalizing Flows架构来强化PNL模型中的逆变性约束,通过精确重建隐藏噪声,从而通过统计独立性测试进行因果效应识别。此外,该方法具有显著的可扩展性,能够通过因果顺序识别扩展到多变量因果发现,有效地揭示复杂的因果关系。实验结果表明,CAF-PoNo在双变量和多变量因果发现任务中均优于几种最先进的方法。

Read more...

探索高效去噪:LDNLM在乘性噪声去除中的应用与突破

Linear Attention Based Deep Nonlocal Means Filtering for Multiplicative Noise Removal

摘要

本文介绍了一种针对乘性噪声的去噪方法,该噪声广泛存在于雷达图像、医学图像等领域。传统的去噪方法如非局部均值滤波(NLM)在处理乘性噪声时存在计算复杂度高和推理速度慢的问题。为此,研究者提出了一种基于线性注意力机制的深度非局部均值滤波(LDNLM)方法,通过深度通道卷积神经网络(CNN)提取像素邻域信息,并利用线性注意力机制替代传统的相似度计算和加权平均过程,从而实现线性复杂度的非局部去噪算法。实验结果表明,LDNLM在模拟和真实乘性噪声图像上均表现出优于现有方法的性能,同时保持了与传统NLM相近的可解释性。

Read more...

提升医学视觉语言模型的事实准确性:RULE方法的突破与应用

RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models

摘要

本文探讨了医学大型视觉语言模型(Med-LVLMs)在医疗诊断中的应用,特别是其在生成响应时可能出现的事实错误问题。为了提高这些模型的事实准确性,研究者提出了一种名为RULE的新方法,该方法通过校准选择检索上下文的数量和使用偏好数据集进行微调,来控制事实风险并平衡模型对内部知识和检索上下文的依赖。实验结果显示,RULE在三个医学视觉问答(VQA)数据集上平均提高了20.8%的事实准确性。

Read more...

揭秘临床语言模型的隐形威胁:BadCLM后门攻击的深度解析

BadCLM: Backdoor Attack in Clinical Language Models for Electronic Health Records

摘要

本文探讨了临床语言模型在电子健康记录(EHR)系统中的安全漏洞,特别是针对这些模型的后门攻击。文章介绍了一种新的基于注意力的后门攻击方法BadCLM(Bad Clinical Language Models),该方法能够在模型中嵌入一个后门,使得模型在遇到特定触发器时产生错误的预测,而在其他情况下则正常工作。通过在MIMIC III数据集上的医院内死亡率预测任务中验证了BadCLM的有效性,揭示了临床决策支持系统中的一个重大安全风险。

Read more...
Previous Page 63 of 156 Next Page