Nash CoT:降低成本,提升大型语言模型推理性能的新方法

Nash CoT: Multi-Path Inference with Preference Equilibrium

摘要

本文介绍了一种名为Nash Chain-of-Thought (Nash CoT)的新型推理方法,旨在提高大型语言模型(LLMs)在复杂问题上的推理能力,同时降低推理成本。Nash CoT通过将语言解码视为偏好共识游戏,构建了一个双玩家游戏系统,利用LLM自主选择上下文相关的模板并生成输出,以达到Nash均衡。这种方法在多个推理任务上实现了与现有方法相媲美或更优的性能,同时减少了所需的推理路径数量。

Read more...

SimDT:革新自动驾驶的样本高效模仿多令牌决策转换器

Sample-efficient Imitative Multi-token Decision Transformer for Generalizable Real World Driving

摘要

本文介绍了一种名为“样本高效模仿多令牌决策转换器(SimDT)”的创新方法,旨在解决自动驾驶领域中从模拟环境到真实世界设置的知识转移问题。SimDT通过引入多令牌预测、模仿在线学习和优先经验回放,显著提升了决策转换器的性能。实验结果表明,SimDT在Waymax基准测试中超越了流行的模仿学习和强化学习算法,显示出在复杂动态环境中的强大适应性和样本效率。

Read more...

探索QOG:基于语言模型的问题与选项生成技术的前沿进展

QOG:Question and Options Generation based on Language Model

摘要

本文介绍了一种基于语言模型的问题与选项生成(QOG)方法,旨在从给定的上下文中生成问题-选项对。QOG在多个领域有广泛应用,包括模型微调、信息检索和教育辅助工具。论文通过三种不同的方法(Pipeline QOG、Multitask QOG和End2end QOG)来实现这一目标,并展示了End2end QOG在计算效率和稳定性方面的优越性。此外,论文还引入了GPT-4作为评估工具,以确保生成的问题-选项对符合人类评估标准。

Read more...

探索药物安全的新视角:DrugWatch平台的创新与应用

DrugWatch: A Comprehensive Multi-Source Data Visualisation Platform for Drug Safety Information

摘要

DrugWatch是一款综合性的多源数据可视化平台,专门用于药物安全信息的分析。该平台通过整合来自结构化、文本和用户持有的药物安全数据,为研究人员和从业者提供了一个一站式的信息分析、检索和注释服务。DrugWatch不仅允许用户理解药物的常见副作用及其统计信息,还支持灵活检索相关医疗报告,或使用自动化注释工具对用户自己的医疗文本进行注释。该平台通过自然语言处理(NLP)技术和丰富的交互式可视化组件,致力于提供全面的信息支持,以促进药物安全研究。

Read more...

"基于模型的机器学习在多天线多频率信道映射学习中的应用"

Model-based learning for multi-antenna multi-frequency location-to-channel mapping

摘要

本文探讨了多天线多频率环境下的位置到信道映射学习问题。通过利用基于模型的机器学习范式,从传播信道模型中推导出一种特定问题的神经网络架构,有效克服了传统神经网络在学习快速变化函数时的频谱偏差问题。该架构仅学习低频稀疏校正项,激活高频分量的字典。在真实合成数据上的评估显示,该架构在准确性上远超传统隐式神经表示(INR)架构。此外,该模型基于近似的信道模型解释了其学习性能,突出了基于模型的机器学习范式的可解释性。

Read more...

"革新物理教育:基于LLM的个性化学习工具"

A Personalised Learning Tool for Physics Undergraduate Students Built On a Large Language Model for Symbolic Regression

摘要

本文介绍了一种基于大型语言模型(LLM)的个性化学习工具,旨在增强物理学本科生的记忆和问题解决能力。该工具通过交错练习方法,结合符号回归和维度分析技术,为学生提供即时且个性化的指导。论文的核心在于利用LLM进行符号回归,并通过提示工程结合维度分析,帮助学生理解物理变量之间的关系。该工具在费曼物理学讲座中的方程上进行了测试,能够准确识别大多数方程中物理变量之间的关系,显示出其在本科物理教育中的潜在价值。

Read more...

**神奇的LoRA压缩术:让你的AI服务飞起来!**

Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead

摘要

本文介绍了一种名为“Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead”的方法,该方法旨在解决在服务实时响应查询时,需要处理大量不同LoRA适配器的挑战。通过压缩LoRA适配器,该方法可以在服务数千个LoRA时提高吞吐量,同时保持较高的性能。

Read more...

探索神经网络之外的可解释推荐系统:基于用户评论的透明潜在类别模型

An Interpretable Alternative to Neural Representation Learning for Rating Prediction – Transparent Latent Class Modeling of User Reviews

摘要

本文提出了一种基于用户评论的透明潜在类别模型,用于评分预测任务。在神经网络和深度学习技术广泛应用于推荐系统的背景下,本文关注于协同过滤数据的稀疏性和随机性,以及神经网络方法的解释性问题。通过引入一种拓扑组织用户和产品潜在类别的概率模型,本文提供了一种可视化友好且易于检查的工具,以便从文本角度理解用户和产品的特征。此外,本文探讨了使用这些可解释的量作为评分预测模型输入的可能性,并在可解释性和预测性能方面与基于文本的神经网络方法进行了比较。实验结果表明,所提出的潜在类别表示在预测性能上与难以解释的方法相当。

Read more...

探索神经网络在推荐系统中的应用:感知机协同过滤的先进性

Perceptron Collaborative Filtering

摘要

本文由Arya Chakraborty撰写,探讨了使用神经网络(特别是感知机)在协同过滤推荐系统中的应用。协同过滤是一种通过收集大量用户的偏好信息来预测特定用户兴趣的技术。传统上,这一过程使用多元逻辑回归分类器实现,但本文提出使用神经网络可以实现更高的准确性。神经网络通过反向传播和梯度下降等先进优化技术,能够更好地拟合复杂数据集,从而提供更精确的推荐。

Read more...

构建未来零售:AI副驾驶的设计与评估实践

Design and evaluation of AI copilots – case studies of retail copilot templates

摘要

本文由Microsoft的研究人员提出,主要探讨了AI副驾驶(AI copilots)的设计与评估方法,特别是在零售领域的应用。文章分为两部分:设计部分详细介绍了AI副驾驶的架构,包括大型语言模型(LLM)、知识检索插件、协调层、系统提示和负责任AI护栏;评估部分则讨论了如何通过系统的测试和评估来确保AI副驾驶的质量和安全性,以及如何管理其在商业环境中使用时可能产生的意外后果。文章通过Microsoft在零售领域的实际案例,展示了良好的设计和评估实践对于构建有效、以人为中心的AI助手的重要性。

Read more...
Previous Page 146 of 156 Next Page