探索AI治理的新框架:Switch、Ladder与Matrix模型的比较与应用

The Switch, the Ladder, and the Matrix: Models for Classifying AI Systems

摘要

本文《The Switch, the Ladder, and the Matrix: Models for Classifying AI Systems》由Jakob Mökander等人撰写,探讨了人工智能(AI)系统分类的必要性和方法。文章指出,尽管AI伦理原则已被广泛采纳,但在实际操作中仍存在原则与实践之间的鸿沟。主要障碍之一是缺乏明确的物质范围定义,即AI伦理原则应适用于哪些系统和过程。文章通过比较以往的分类尝试,提出了三种分类模型:Switch(二元分类)、Ladder(基于风险的分类)和Matrix(多维分类),并分析了每种模型的优缺点,旨在为设计、部署或监管AI系统的组织提供实用的概念工具,以实现AI治理的实际操作。

Read more...

探索CosyVoice:引领多语言零样本TTS技术的新纪元

CosyVoice: A Scalable Multilingual Zero-shot Text-to-speech Synthesizer based on Supervised Semantic Tokens

摘要

本文介绍了一种基于监督语义令牌的可扩展多语言零样本文本到语音合成器——CosyVoice。该研究解决了传统文本到语音(TTS)模型中语音令牌缺乏明确语义信息和与文本对齐的问题。通过从多语言语音识别模型中提取监督语义令牌,并结合大型语言模型(LLM)和条件流匹配模型,CosyVoice在零样本语音克隆中显著提高了内容一致性和说话者相似度。实验结果表明,CosyVoice具有良好的可扩展性,利用大规模数据进一步提升了合成性能。

Read more...

探索EMBANet:一种灵活高效的多分支注意力网络

EMBANet: A Flexible Efffcient Multi-branch Attention Network

摘要

本文介绍了一种名为EMBANet的新型多分支注意力网络,该网络通过引入多分支连接(MBC)模块来处理输入张量,从而获得多尺度特征图。EMBANet通过允许变换操作类型和分支数量的灵活调整,为注意力网络设计带来了新的自由度(DoF)。文章详细介绍了EMBANet的工作原理、工作流程以及其在计算机视觉任务中的应用前景,展示了其在分类、检测和分割等任务中优于现有骨干网络的性能。

Read more...

探索MINDECHO:引领角色扮演语言代理的新纪元

MINDECHO: Role-Playing Language Agents for Key Opinion Leaders

摘要

本文介绍了一种名为MINDECHO的框架,用于开发和评估代表关键意见领袖(KOL)的角色扮演语言代理(RPLAs)。随着大型语言模型(LLMs)在各种应用中的出色表现,角色扮演语言代理的需求日益增长,尤其是在模拟KOL的领域。MINDECHO通过收集KOL在不同专业领域的互联网视频转录数据,并利用GPT4合成对话,进行个性化模型训练和推理时检索。该框架的评估涵盖了知识、语调等通用维度以及粉丝为中心的维度。实验证明,MINDECHO在开发和评估KOL RPLAs方面具有显著效果。

Read more...

探索人工智能在企业知识工作中的应用:WorkArena++ 基准的挑战与前景

WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks

摘要

WorkArena++ 是一篇关于人工智能在企业环境中应用的论文,主要探讨了大型语言模型(LLMs)和视觉语言模型(VLMs)在自动化知识工作任务中的能力。论文提出了一个名为 WorkArena++ 的新基准,包含682个现实工作流程任务,旨在评估网络代理在规划、问题解决、逻辑/算术推理、信息检索和上下文理解等方面的能力。通过对比最先进的LLMs和VLMs以及人类工作者的表现,论文揭示了这些模型在实际工作环境中作为有用助手所面临的挑战。此外,论文还提供了一种机制,可以轻松生成数千条真实观察/行动轨迹,用于微调现有模型。总体而言,WorkArena++ 旨在为社区提供一个有用的资源,以推动自主代理的发展。

Read more...

探索大型语言模型在集体创新中的潜力与挑战

Collective Innovation in Groups of Large Language Models

摘要

本文探讨了大型语言模型(LLMs)在集体创新中的应用,特别是在解决创新任务中的表现。研究通过让LLMs参与“Little Alchemy 2”游戏,分析了LLMs在孤立状态和群体中的表现,以及社会连接性对集体创新的影响。研究发现,动态连接的LLM群体在创新任务中表现优于完全连接的群体,这与先前的人类和计算研究一致。此外,LLMs在利用任务知识方面表现出潜力,但在多步骤推理和开放式探索方面仍面临挑战。

Read more...

探索大型语言模型的时间逻辑推理能力:LTLBench基准数据集的构建与应用

LTLBench: Towards Benchmarks for Evaluating Temporal Logic Reasoning in Large Language Models

摘要

本文由Weizhi Tang和Vaishak Belle共同撰写,题为“LTLBench: Towards Benchmarks for Evaluating Temporal Logic Reasoning in Large Language Models”,旨在探讨大型语言模型(LLMs)在时间逻辑推理(TR)能力方面的表现。论文提出了一种新颖的方法,通过利用随机有向图生成、线性时间逻辑(LTL)公式和NuSMV模型检查器来设计和开发一个用于构建评估LLMs TR能力的基准数据集的流程。基于此流程,作者构建了一个名为LTLBench的基准数据集,包含2,000个TR挑战,并对六种LLMs进行了评估。此外,论文还探讨了增加事件数量和公式操作符对TR问题复杂性和LLMs性能的影响。研究结果表明,尽管LLMs在处理TR挑战方面显示出一定的潜力,但它们在复杂的TR问题上仍面临挑战。论文期望这项工作能为LLMs的TR能力提供深入见解,并为未来的TR评估提供有价值的工具。

Read more...

探索扩张ResNet模型在眼底疾病分类中的先进应用

Explainable AI: Comparative Analysis of Normal and Dilated ResNet Models for Fundus Disease Classification

摘要

本文介绍了一种使用扩张残差网络(Dilated ResNet)模型进行眼底疾病分类的方法。通过在ResNet模型的高层替换普通卷积滤波器为扩张卷积滤波器,该方法旨在提高模型对疾病的分类准确性并减少计算时间。研究使用了Ocular Disease Intelligent Recognition (ODIR)数据集,该数据集包含八种类型的常见眼底疾病。评估指标包括精确度、召回率、准确率和F1分数。研究对比了普通ResNet模型和扩张ResNet模型在五个不同深度的变体(ResNet-18, ResNet-34, ResNet-50, ResNet-101, ResNet-152)上的表现,结果显示扩张ResNet模型在多类疾病分类中表现更优。

Read more...

探索未来:强化学习在混合整数线性规划中的新前沿——折扣伪成本方法

Discounted Pseudocosts in MILP

摘要

本文介绍了一种结合强化学习概念的混合整数线性规划(MILP)新方法——折扣伪成本(Discounted Pseudocosts)。传统伪成本在分支定界过程中估计目标函数的变化,而本文提出的折扣伪成本通过引入前瞻性视角,更接近于强化学习中的“总奖励”或“折扣总奖励”概念。初步实验表明,这种方法能增强分支策略并加速解决复杂的MILP问题。

Read more...

探索未知:BiRoDiff——双足机器人在未见地形上的扩散策略控制

BiRoDiff: Diffusion policies for bipedal robot locomotion on unseen terrains

摘要

本文由GVS Mothish、Manan Tayal和Shishir Kolathaya共同撰写,介绍了一种名为BiRoDiff的扩散策略框架,用于双足机器人在未知地形上的运动控制。该框架的核心在于利用扩散模型学习单一的行走控制器,使其能够在多种地形上进行运动,特别是在未见过的地形上也能有效运作。这一技术的开发对于双足机器人在灾难响应和探索等实际应用场景中的实用性扩展具有重要意义。BiRoDiff框架通过离线数据学习,相较于在线学习,具有更好的可扩展性和训练方案的简洁性。此外,该控制器在模拟环境中展示了其对未见地形的泛化能力和高频控制步长生成的能力,相较于传统的生成模型,它在计算资源有限的情况下表现更为出色。

Read more...
Previous Page 58 of 156 Next Page