BackMix:革新心电图视图分类的背景增强技术

BackMix: Mitigating Shortcut Learning in Echocardiography with Minimal Supervision

摘要

本文由Kit M. Bransby等人撰写,针对心电图(echocardiography)视图分类中神经网络学习到的不良快捷方式(shortcut learning)问题,提出了一种名为BackMix的简单而有效的随机背景增强方法。该方法通过在训练集中随机交换背景,强制模型关注超声扇区(ultrasound sector)内的数据,从而提高分类准确性和泛化能力。此外,论文还提出了wBackMix方法,通过重新加权分类损失,增强增强样本的贡献。实验结果表明,即使在仅有5%的分割标签的半监督设置下,BackMix也能显著提升分类性能和关注度指标。

Read more...

CAPM:基于Maxpool的CNN快速鲁棒验证新方法

CAPM: Fast and Robust Verification on Maxpool-based CNN via Dual Network

摘要

本文介绍了一种名为CAPM(Convex Adversarial Polytope for Maxpool-based CNN)的新方法,用于提高基于Maxpool的卷积神经网络(CNN)在面对有界范数对抗扰动时的验证边界。通过将Maxpool函数分解为一系列ReLU函数,CAPM扩展了凸松弛技术,从而能够通过双网络高效计算验证边界。实验结果表明,CAPM不仅提供了与最先进方法相媲美的验证精度,而且计算成本远低于现有的验证方法,如DeepZ、DeepPoly和PRIMA。此外,CAPM适用于大规模CNN,这在以往的研究中通常被认为是计算上不可行的。在某些情况下,CAPM的速度比PRIMA、DeepPoly和DeepZ快40倍、20倍或2倍,并且提供了显著更高的验证边界。

Read more...

Chat AI:引领HPC与AI融合的新时代,打造无缝、安全、高效的智能服务体验

Chat AI: A Seamless Slurm-Native Solution for HPC-Based Services

摘要

本文介绍了一种名为Chat AI的创新解决方案,旨在为基于高性能计算(HPC)的服务提供一个高效、安全和私密的原生Slurm集成平台。随着大型语言模型(LLMs)的广泛采用,研究人员需要一个能够运行开源或自定义微调LLMs的基础设施,同时确保用户数据隐私和安全。Chat AI通过利用本地大学和研究中心的可信环境,提供了一个替代商业LLM服务的私有和安全选项。该解决方案与Slurm无缝集成,能够在HPC集群上与常规Slurm工作负载并行运行,同时利用Slurm创建的时间间隙。为了确保HPC系统的安全性,使用了SSH ForceCommand指令构建了一个强大的断路器,防止面向Web的服务器受到攻击。Chat AI已成功部署为生产服务,并提供了源代码。

Read more...

CPL:优化共形预测长度的新框架

Length Optimization in Conformal Prediction

摘要

本文提出了一种名为 CPL(Conformal Prediction with Length-Optimization)的新型框架,旨在解决共形预测中的条件有效性和长度效率问题。该框架在保证条件有效性的前提下,通过最小化预测集的平均长度来优化长度效率。在无限样本情况下,CPL 框架通过强对偶性结果实现了条件有效性和长度最优性。在有限样本情况下,CPL 框架通过使用给定的一致性分数和假设类来松弛最小最大问题,从而保证了算法的条件有效性和长度效率。实验结果表明,CPL 框架在各种真实世界和合成数据集上的表现优于现有的共形预测方法,特别是在边际有效性、组条件有效性和更复杂的条件有效性情况下。

Read more...

Deriva-ML:引领eScience领域机器学习模型的新纪元

Deriva-ML: A Continuous FAIRness Approach to Reproducible Machine Learning Models

摘要

本文介绍了一种名为Deriva-ML的连续FAIR(Findable, Accessible, Interoperable, Reusable)数据管理方法,旨在提高机器学习(ML)模型在eScience应用中的正确性和可重复性。文章强调了高质量数据对于ML结果的重要性,并提出了一种数据中心化的方法,通过构建一个云托管平台和实施最佳实践,以支持多学科团队在eScience领域的协作和数据管理。通过两个实际案例研究,展示了如何利用Deriva-ML架构和最佳实践来改善ML在eScience中的应用。

Read more...

EFV++:基于事件流的高性能模式识别框架

Retain, Blend, and Exchange: A Quality-aware Spatial-Stereo Fusion Approach for Event Stream Recognition

摘要

本文提出了一种名为EFV++的新型双流框架,用于基于事件流的模式识别。该框架通过区分融合的方式,同时处理事件图像和事件体素两种常见的事件表示形式。利用Transformer和图神经网络(GNN)分别学习空间和三维立体信息。为了解决直接融合可能导致的次优解问题,本文提出了一种质量感知的三级特征处理方法,即保留高质量特征、融合中等质量特征、交换低质量特征。此外,引入了一种新颖的混合交互读出机制,以增强特征的多样性作为最终表示。实验证明,该框架在多个广泛使用的基于事件流的分类数据集上达到了最先进的性能。

Read more...

FedMap:革命性的联邦学习剪枝技术,提升通信效率与模型性能

FedMap: Iterative Magnitude-Based Pruning for Communication-Efficient Federated Learning

摘要

本文介绍了一种名为FedMap的新型迭代幅度剪枝方法,旨在提高联邦学习(FL)部署的通信效率。联邦学习是一种分布式机器学习方法,允许在分散的数据上进行训练,同时保护隐私。然而,FL系统中的客户端设备通常资源受限,包括计算能力、内存、存储和带宽。FedMap通过协作学习逐渐稀疏的全局模型,确保所有客户端对全局模型参数的相同子集进行剪枝和细化,从而逐步减少全局模型的大小和通信开销。FedMap的关键优势在于能够从零开始训练全局模型,适用于医疗和金融等隐私敏感领域,这些领域通常缺乏合适的预训练数据。通过广泛的评估,FedMap在IID和非IID环境中均显示出稳定的客户端模型性能,为缓解FL系统中的通信瓶颈提供了有前景的解决方案。

Read more...

FedMLP:解决医疗图像多标签分类任务异质性的创新联邦学习方法

FedMLP: Federated Multi-Label Medical Image Classification under Task Heterogeneity

摘要

本文介绍了一种名为FedMLP的新型联邦学习方法,旨在解决医疗图像分类中的多标签任务异质性问题。在临床实践中,由于医疗知识和疾病流行程度的不同,每个机构可能只诊断部分类别,导致任务异质性。FedMLP通过伪标签标记和全局知识学习两个阶段,有效地补充了缺失的标签,并利用全局模型作为教师进行一致性正则化,防止遗忘缺失类别的知识。实验结果表明,FedMLP在两个公开的医疗数据集上优于现有的联邦半监督和噪声标签学习方法。

Read more...

GCX:计算资源交易的创新平台

Commodification of Compute

摘要

本文介绍了一种全球计算交换平台(GCX),旨在解决计算资源分配效率低下的问题。该平台利用区块链技术和智能合约,创建了一个安全、透明、高效的计算能力买卖市场。通过标准化计算单位、建立分层架构和引入创新的去中心化金融交易技术,GCX 有望优化资源利用、稳定价格,并促进计算资源的民主化访问。

Read more...

HuatuoGPT-Vision:引领医学多模态大型语言模型的新纪元

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

摘要

本文介绍了一种名为HuatuoGPT-Vision的新型多模态大型语言模型(MLLM),旨在通过大规模注入医学视觉知识来提升模型的医学多模态能力。该研究通过精心筛选和处理PubMed中的医学图像-文本对,利用GPT-4V模型进行数据去噪和格式化,构建了一个包含130万医学视觉问答(VQA)样本的高质量数据集PubMedVision。实验验证表明,PubMedVision显著提升了现有MLLM的医学多模态能力,并在多个基准测试中显示出优越性能。此外,使用PubMedVision训练的34B参数医学MLLM HuatuoGPT-Vision在开放源代码的MLLM中表现出最佳性能。

Read more...
Previous Page 131 of 156 Next Page