探索大型语言模型的虚拟角色条件化:Anthology方法的先进性与应用

Virtual Personas for Language Models via an Anthology of Backstories

摘要

本文介绍了一种名为“Anthology”的方法,用于通过利用开放式的生命叙事(称为“backstories”)来条件化大型语言模型(LLMs)以创建特定的虚拟角色。该方法通过增强实验结果的一致性和可靠性,同时确保多样性子群体的更好代表性,展示了其在匹配人类受访者响应分布方面的显著改进。通过在全国代表性的人类调查中进行的三个实验,Anthology方法在匹配人类响应分布方面实现了高达18%的改进,在一致性指标上实现了27%的改进。该方法的代码和生成的backstories已在GitHub上公开,以便未来研究和应用。

Read more...

探索开放词汇时间动作定位的自训练方法:利用未标记视频提升泛化能力

Exploring Scalability of Self-Training for Open-Vocabulary Temporal Action Localization

摘要

本文探讨了在开放词汇时间动作定位(OV-TAL)中通过自训练方法利用未标记的YouTube视频来扩展词汇量的有效性和可扩展性。由于大规模标注数据集的稀缺,现有的OV-TAL方法依赖于小规模的完全标注数据集进行训练。本文提出了一种两阶段的自训练方法,首先在人工标注的数据集上训练一个类别无关的动作定位器,然后使用该定位器为未标记的视频生成伪标签,并将这些伪标签与人工标注的数据集结合,以训练更通用的动作定位器。实验证明,利用网络规模的视频进行自训练显著提高了动作定位器的泛化能力。此外,本文还指出了现有OV-TAL评估方案的问题,并提出了一种新的评估协议。

Read more...

探索指数权重算法在多玩家博弈中的收敛性与应用前景

Games played by Exponential Weights Algorithms

摘要

本文研究了具有恒定学习率的指数权重算法(Exponential Weights Algorithm)在离散时间重复交互中的最终迭代收敛性质。文章考虑了多个玩家独立使用指数权重算法的情况,并分析了混合策略轮廓(mixed action profile)pt在不同阶段的行为。文章证明了在存在严格纳什均衡(strict Nash equilibrium)的情况下,玩家在下一阶段选择严格纳什均衡的概率几乎必然收敛到0或1。此外,文章还证明了pt的极限,如果存在,属于“纳什均衡与等额支付”(Nash Equilibria with Equalizing Payoffs)集合。在强协调游戏中,玩家的支付在所有玩家选择相同行动时为正,否则为0,文章证明了pt几乎必然收敛到某个严格纳什均衡。文章最后提出了一些开放问题。

Read more...

探索提示技术,提升LLM生成安全代码能力

Prompting Techniques for Secure Code Generation: A Systematic Investigation

摘要

本文研究了不同提示技术对大型语言模型(LLM)生成安全代码的影响。通过对现有文献的系统综述,作者确定了15种可用于代码生成的提示技术,并将其分为5类。研究结果表明,提示技术可以有效提高LLM生成安全代码的能力,特别是递归批评和改进(RCI)技术,在减少安全漏洞方面表现出色。

Read more...

探索星系演化:基于物理的生成模型在天体物理学中的应用与评估

Using Galaxy Evolution as Source of Physics-Based Ground Truth for Generative Models

摘要

本文探讨了使用星系演化数据作为基于物理的生成模型的真实性评估标准。作者提出,天体物理数据如星系图像可以用来测试生成模型,除了人类判断外,还可以利用物理驱动的真实性标准。文章构建了条件去噪扩散概率模型(DDPM)和条件变分自编码器(CVAE),并测试它们在生成基于红移(星系年龄)的逼真星系图像的能力。这是首批使用物理驱动指标来评估这些生成模型的研究之一。研究发现,基于人类评估,两种模型生成的星系图像都具有可比性,但物理基础的指标能更好地揭示生成模型的优缺点。总体上,DDPM模型在大多数物理基础指标上表现优于CVAE模型。最终,如果能够证明生成模型能够学习星系演化的物理规律,它们有可能解锁新的天体物理发现。

Read more...

探索未来交通:基于深度学习的旅行时间预测技术革新

Trajectory Data Mining and Trip Travel Time Prediction on Specific Roads

摘要

本文由Muhammad Awais Amin等人在《Trajectory Data Mining and Trip Travel Time Prediction on Specific Roads》中提出,针对巴基斯坦伊斯兰堡的道路条件,设计了一套完整的轨迹数据挖掘流程,并利用先进的人工神经网络、多层感知器和长短期记忆网络模型,对频繁路线的旅行时间进行预测。研究结果显示,在持续10分钟至60分钟的旅行中,预测误差平均在30秒至1.2分钟之间。该研究不仅提升了旅行时间预测的准确性,还为智能交通系统的优化提供了新的视角。

Read more...

探索模糊聚类的新境界:一种创新的簇有效性度量指标

A new validity measure for fuzzy c-means clustering

摘要

本文提出了一种新的模糊C均值聚类(Fuzzy C-Means, FCM)的有效性度量指标。该指标利用模糊簇之间的接近度来衡量簇间的重叠程度,通过最小化簇间接近度来获得最佳的模糊C分区。通过在多个知名数据集上的实验,证明了该指标的有效性和可靠性。关键词:簇有效性,模糊聚类,模糊C均值。

Read more...

探索知识图谱中的简单可解释概率分类器:新技术与应用前景

Simple and Interpretable Probabilistic Classifiers for Knowledge Graphs

摘要

本文探讨了在知识图谱(Knowledge Graphs, KGs)背景下,从不完全数据中学习概率分类器的问题。作者提出了一种基于简单信念网络的归纳方法,特别是基于多元伯努利分布的朴素贝叶斯分类器及其扩展到两层网络的模型。这些模型能够转换为概率公理(或规则),从而提高解释性,并且可以利用专家知识进行初始化。论文通过实验评估了这些模型在不同本体上的分类任务中的有效性。

Read more...

探索虚拟染色技术在高吞吐量筛选中的泛化能力:一项深度研究

Can virtual staining for high-throughput screening generalize?

摘要

本文探讨了在制药行业中,高吞吐量筛选(HTS)产生的海量图像数据对虚拟染色模型训练的潜力。文章主要研究了在不同实验条件下训练的模型是否能够泛化到其他条件下的问题。研究针对三种细胞类型(肺、卵巢和乳腺)和两种表型(毒性和非毒性条件),评估了虚拟染色模型在三种常见的HTS数据分布偏移下的泛化能力:未见过的表型、未见过的细胞类型以及两者的组合。研究发现,使用非毒性条件样本训练的虚拟核和细胞质模型不仅能够泛化到毒性条件样本,而且在所有评估层面上表现优于毒性条件样本训练的模型。此外,模型对未见过的细胞类型的泛化能力因细胞类型而异,卵巢或肺细胞样本训练的模型在其他条件下表现良好,而乳腺细胞样本训练的模型泛化能力较差。总体而言,该研究为实验训练数据生成提供了有价值的策略,特别是在数据中心化的方法上,为虚拟染色模型的泛化能力提供了深入的见解。

Read more...

探索视频时刻检索的新前沿:基于不精确查询的排序技术

TVR-Ranking: A Dataset for Ranked Video Moment Retrieval with Imprecise Queries

摘要

本文提出了一项名为“Ranked Video Moment Retrieval (RVMR)”的新任务,旨在通过自然语言查询从视频集合中定位并排序匹配的时刻。尽管计算机视觉、自然语言处理和信息检索社区已经提出了一些相关任务,但RVMR任务最能反映实际的时刻搜索场景。为了促进RVMR的研究,本文基于TVR数据集的原始视频和现有时刻注释,开发了TVR-Ranking数据集。本文的主要贡献是手动注释了94,442个查询-时刻对的相关性级别,并开发了NDCG@K, IoU ≥ µ评估指标来评估这一新任务。实验表明,新的RVMR任务为现有模型带来了新的挑战,并相信这一新数据集有助于多模态搜索的研究。

Read more...
Previous Page 41 of 156 Next Page