深度学习新突破:YZS-Model精准预测有机药物溶解度

YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention

摘要

本文介绍了一种基于图卷积网络(GCN)和Transformer注意力机制的新型深度学习框架YZS-Model,用于预测有机药物的溶解度。该模型通过结合注意力机制的Transformer、长短期记忆网络(LSTM)和GCN,旨在提高溶解度预测的精确度。研究使用了包含9,943个化合物的训练集,并在抗肿瘤化合物数据集上进行了测试,实现了0.55的关联系数(R2)和0.59的均方根误差(RMSE),优于基准模型。此外,在独立测试中,该模型相对于基准模型提高了45.9%的相对准确性,显示出深度学习在提高溶解度预测准确性方面的巨大潜力,并为未来的药物设计和筛选提供了新的见解。

Read more...

火星探索新突破:深度强化学习驱动下的主动悬挂系统

Autonomous Control of a Novel Closed Chain Five Bar Active Suspension via Deep Reinforcement Learning

摘要

本文由Nishesh Singh等人撰写,探讨了在行星探索中,特别是在火星探索中,如何通过深度强化学习实现新型闭链五杆主动悬挂系统的自主控制。文章针对火星车在崎岖地形中的稳定性和高效穿越能力问题,提出了一种结合软演员-评论家(SAC)算法和比例积分微分(PID)控制的新型悬挂系统。该系统能够根据周围障碍物的距离、障碍物的高度以及车体的姿态,精确控制悬挂系统的控制链路,从而在Gazebo环境中进行模拟验证。

Read more...

生成式人工智能在多模态医学数据合成中的应用:综述与展望

Generative AI for Synthetic Data Across Multiple Medical Modalities: A Systematic Review of Recent Developments and Challenges

摘要

本文是一篇关于生成式人工智能在多模态医学数据合成中的应用的综述。文章介绍了生成对抗网络(GANs)、变分自编码器(VAEs)、扩散模型(DMs)和大型语言模型(LLMs)等生成式模型在医学数据合成中的应用,包括影像学、文本、时间序列和表格数据等。文章还讨论了这些模型的工作原理、先进性、应用前景以及面临的挑战。

<工作原理> 生成式模型的工作原理是通过学习真实数据的分布,生成与真实数据相似的新数据。GANs通过对抗训练来学习数据分布,VAEs通过变分推断来近似数据分布,DMs通过逐步添加噪声并逆转来学习数据分布,LLMs通过学习语言的概率分布来生成文本。

<工作流程> 生成式模型的工作流程通常包括数据预处理、模型训练、模型评估和模型应用等步骤。在数据预处理阶段,需要对数据进行清洗、归一化和标注等处理。在模型训练阶段,需要选择合适的模型架构和训练算法,并使用预处理后的数据进行训练。在模型评估阶段,需要使用各种评估指标来评估模型的性能。在模型应用阶段,可以将训练好的模型应用于数据生成、数据增强、疾病预测等任务。

<应用前景> 生成式模型在医学领域有着广泛的应用前景,包括医学图像合成、医学文本生成、生理信号合成等。这些应用可以帮助医生更好地理解疾病、提高诊断准确性、改善治疗效果等。

<标题> 生成式人工智能在多模态医学数据合成中的应用:综述与展望

Read more...

突破封闭世界假设:神经语义解析中的幻觉检测新框架

Handling Ontology Gaps in Semantic Parsing

摘要

本文探讨了神经语义解析(NSP)模型在处理超出其目标符号表示范围的概念时产生幻觉输出的问题。传统的NSP模型基于封闭世界假设,即模型只能处理其目标符号系统内的概念,这导致模型在遇到超出其知识范围的查询时会产生错误或可能具有冒犯性的回答。为了解决这一问题,本文提出了幻觉模拟框架(HSF),这是一个通用设置,用于刺激和分析NSP模型的幻觉行为。通过使用HSF和KQA Pro作为基准数据集,本文评估了最先进的幻觉检测技术,并提出了一种新的幻觉检测策略,该策略利用NSP模型的计算图来检测幻觉,特别是在存在本体论缺口和域外话语的情况下。

Read more...

突破衍射极限:超振荡衍射神经网络实现远场超分辨成像

Super-resolution imaging using super-oscillatory diffractive neural networks

摘要

本文介绍了一种基于超振荡衍射神经网络(SODNN)的光学超分辨成像技术,该技术能够突破传统光学设备的衍射极限,实现远场超分辨成像。SODNN通过利用衍射层实现光学互连和成像样本或生物传感器实现非线性,调制入射光场以在三维空间中产生光学超振荡效应,从而生成超分辨聚焦点。该研究不仅解决了现有超振荡成像设备的性能限制,如强旁瓣、短工作距离、有限焦深和色差问题,还展示了SODNN在多波长和多聚焦点阵列中的有效应用,为智能光学仪器的开发提供了新的思路。

Read more...

课程学习与质量驱动数据选择:提升多模态大型语言模型性能的新方法

Curriculum Learning with Quality-Driven Data Selection

摘要

本文介绍了一种新颖的数据选择方法,该方法通过利用图像-文本相关性和模型困惑度来评估和选择不同质量的数据,从而在多模态大型语言模型(MLLMs)的视觉指令调优中提高零样本能力。该方法通过将数据质量映射到一个二维空间中,允许基于数据在该分布中的位置进行选择,并构建多阶段不同质量的子集以促进课程学习。通过在多个数据集上的综合实验,结果显示在五个常用评估能力上相比使用完整数据集有显著提升。此外,本文还提出了一个课程学习策略,通过多阶段训练使用不同质量的数据,显著提高了模型的微调性能。代码、数据和模型已在https://anonymous.4open.science/r/EHIT-31B4公开发布。

Read more...

革命性进展:利用Grounding DINO和SAM实现自动化图像数据标注

Segment Anything Model for automated image data annotation: empirical studies using text prompts from Grounding DINO

摘要

本文探讨了在零样本对象检测和图像分割领域中,Grounding DINO和Segment Anything Model(SAM)的结合应用。特别是在医学图像分割等专业领域,由于目标对象(如器官、组织和肿瘤)可能不在现有类别名称中,传统的基于类别名称的检测方法面临挑战。论文提出利用Grounding DINO的指代表达理解(REC)能力,通过语言描述来检测任意目标,并将其作为SAM的输入,以实现自动化的图像数据标注。研究通过在多个公开数据集上的实验,揭示了错误预测的模式,并提出了一种通过过滤预测边界框相对面积来减少错误的方法,显著提高了分割质量和标注效率。

Read more...

革命性进展:基于Transformer的伊朗手语识别系统及其广泛应用前景

A Transformer-Based Multi-Stream Approach for Isolated Iranian Sign Language Recognition

摘要

本文介绍了一种基于Transformer的多流方法,用于孤立的伊朗手语(ISL)识别。该研究旨在通过最新的深度学习工具,如Transformer,来识别ISL单词,以弥合聋人和听觉正常人群之间的沟通障碍。研究使用了包含101个常用学术环境中的ISL单词的数据集,通过结合早期融合和晚期融合的Transformer编码器网络,并利用遗传算法进行优化。提取的关键特征包括手和唇的关键点,以及从手语视频中提取的手之间的距离和角度。此外,除了训练模型的类别外,还使用了单词的嵌入向量作为多任务学习,以实现更平滑和高效的学习。该模型在生成的句子数据集上进行了测试,并开发了实时反馈用户的交互式手语训练软件,测试数据准确率达到90.2%。该软件和研究总体上可以作为手语识别模型在现实世界中实际应用的初步步骤,对聋人社区有很大帮助。

Read more...

"AI文档记录的革新:自动化与多模态支持的未来趋势"

Documentation Practices of Artificial Intelligence

摘要

本文由Stefan Arnold等人撰写,探讨了人工智能(AI)领域中透明度和责任性的持续挑战,特别强调了严格文档记录的必要性。通过文献综述,论文概述了当前文档记录实践的趋势、存在的问题以及影响文档记录的多方面因素。论文指出,AI文档记录正朝着更加全面、吸引人和自动化的方向发展,这对于提高AI的透明度和责任性至关重要。

Read more...

"COBB:黑箱LLM推理能力提升的新方法"

Learning to Correct for QA Reasoning with Black-box LLMs

摘要

本文针对大型语言模型(LLM)在黑箱设置下的推理能力改进问题,提出了一种名为COBB的新方法。COBB通过训练一个较小的适应模型,将原始黑箱LLM的推理映射到正确的推理上。该方法不依赖于输出标记概率等详细信息,而是通过遗传算法优化数据集构建,并在训练过程中对比正确与错误推理的概率,从而显著提高了各种问答基准的推理准确性。

Read more...
Previous Page 138 of 156 Next Page