探索QOG:基于语言模型的问题与选项生成技术的前沿进展

QOG:Question and Options Generation based on Language Model

摘要

本文介绍了一种基于语言模型的问题与选项生成(QOG)方法,旨在从给定的上下文中生成问题-选项对。QOG在多个领域有广泛应用,包括模型微调、信息检索和教育辅助工具。论文通过三种不同的方法(Pipeline QOG、Multitask QOG和End2end QOG)来实现这一目标,并展示了End2end QOG在计算效率和稳定性方面的优越性。此外,论文还引入了GPT-4作为评估工具,以确保生成的问题-选项对符合人类评估标准。

Read more...

探索药物安全的新视角:DrugWatch平台的创新与应用

DrugWatch: A Comprehensive Multi-Source Data Visualisation Platform for Drug Safety Information

摘要

DrugWatch是一款综合性的多源数据可视化平台,专门用于药物安全信息的分析。该平台通过整合来自结构化、文本和用户持有的药物安全数据,为研究人员和从业者提供了一个一站式的信息分析、检索和注释服务。DrugWatch不仅允许用户理解药物的常见副作用及其统计信息,还支持灵活检索相关医疗报告,或使用自动化注释工具对用户自己的医疗文本进行注释。该平台通过自然语言处理(NLP)技术和丰富的交互式可视化组件,致力于提供全面的信息支持,以促进药物安全研究。

Read more...

"基于模型的机器学习在多天线多频率信道映射学习中的应用"

Model-based learning for multi-antenna multi-frequency location-to-channel mapping

摘要

本文探讨了多天线多频率环境下的位置到信道映射学习问题。通过利用基于模型的机器学习范式,从传播信道模型中推导出一种特定问题的神经网络架构,有效克服了传统神经网络在学习快速变化函数时的频谱偏差问题。该架构仅学习低频稀疏校正项,激活高频分量的字典。在真实合成数据上的评估显示,该架构在准确性上远超传统隐式神经表示(INR)架构。此外,该模型基于近似的信道模型解释了其学习性能,突出了基于模型的机器学习范式的可解释性。

Read more...

"革新物理教育:基于LLM的个性化学习工具"

A Personalised Learning Tool for Physics Undergraduate Students Built On a Large Language Model for Symbolic Regression

摘要

本文介绍了一种基于大型语言模型(LLM)的个性化学习工具,旨在增强物理学本科生的记忆和问题解决能力。该工具通过交错练习方法,结合符号回归和维度分析技术,为学生提供即时且个性化的指导。论文的核心在于利用LLM进行符号回归,并通过提示工程结合维度分析,帮助学生理解物理变量之间的关系。该工具在费曼物理学讲座中的方程上进行了测试,能够准确识别大多数方程中物理变量之间的关系,显示出其在本科物理教育中的潜在价值。

Read more...

**神奇的LoRA压缩术:让你的AI服务飞起来!**

Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead

摘要

本文介绍了一种名为“Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead”的方法,该方法旨在解决在服务实时响应查询时,需要处理大量不同LoRA适配器的挑战。通过压缩LoRA适配器,该方法可以在服务数千个LoRA时提高吞吐量,同时保持较高的性能。

Read more...

探索神经网络之外的可解释推荐系统:基于用户评论的透明潜在类别模型

An Interpretable Alternative to Neural Representation Learning for Rating Prediction – Transparent Latent Class Modeling of User Reviews

摘要

本文提出了一种基于用户评论的透明潜在类别模型,用于评分预测任务。在神经网络和深度学习技术广泛应用于推荐系统的背景下,本文关注于协同过滤数据的稀疏性和随机性,以及神经网络方法的解释性问题。通过引入一种拓扑组织用户和产品潜在类别的概率模型,本文提供了一种可视化友好且易于检查的工具,以便从文本角度理解用户和产品的特征。此外,本文探讨了使用这些可解释的量作为评分预测模型输入的可能性,并在可解释性和预测性能方面与基于文本的神经网络方法进行了比较。实验结果表明,所提出的潜在类别表示在预测性能上与难以解释的方法相当。

Read more...

探索神经网络在推荐系统中的应用:感知机协同过滤的先进性

Perceptron Collaborative Filtering

摘要

本文由Arya Chakraborty撰写,探讨了使用神经网络(特别是感知机)在协同过滤推荐系统中的应用。协同过滤是一种通过收集大量用户的偏好信息来预测特定用户兴趣的技术。传统上,这一过程使用多元逻辑回归分类器实现,但本文提出使用神经网络可以实现更高的准确性。神经网络通过反向传播和梯度下降等先进优化技术,能够更好地拟合复杂数据集,从而提供更精确的推荐。

Read more...

构建未来零售:AI副驾驶的设计与评估实践

Design and evaluation of AI copilots – case studies of retail copilot templates

摘要

本文由Microsoft的研究人员提出,主要探讨了AI副驾驶(AI copilots)的设计与评估方法,特别是在零售领域的应用。文章分为两部分:设计部分详细介绍了AI副驾驶的架构,包括大型语言模型(LLM)、知识检索插件、协调层、系统提示和负责任AI护栏;评估部分则讨论了如何通过系统的测试和评估来确保AI副驾驶的质量和安全性,以及如何管理其在商业环境中使用时可能产生的意外后果。文章通过Microsoft在零售领域的实际案例,展示了良好的设计和评估实践对于构建有效、以人为中心的AI助手的重要性。

Read more...

MMBee:引领直播礼物推荐新纪元——基于多模态融合与行为扩展的先进模型

MMBee: Live Streaming Gift-Sending Recommendations via Multi-Modal Fusion and Behaviour Expansion

摘要

本文介绍了一种名为MMBee的新型实时多模态融合和行为扩展模型,用于直播礼物发送预测。直播服务因其实时互动和娱乐性而日益流行,观众可以通过聊天、发送评论或虚拟礼物来表达对主播的偏好。准确建模礼物互动不仅增强了用户体验,还增加了主播的收入。以往的研究将直播礼物预测视为传统的推荐问题,使用分类数据和观察到的历史行为来建模用户偏好。然而,使用有限的分类信息精确描述直播中的实时内容变化是具有挑战性的。此外,由于礼物行为的稀疏性,捕捉用户的偏好和意图相当困难。MMBee模型通过实时多模态融合和行为扩展来解决这些问题,具体包括多模态融合模块(MFQ)和图引导的兴趣扩展(GIE)方法。实验结果表明,MMBee在公共数据集和快手真实世界直播数据集上都取得了显著的性能提升,并通过在线A/B实验进一步验证了其有效性。MMBee已在快手部署,服务于数亿用户。

Read more...

探索Poetry2Image:一种革命性的中国古典诗歌图像生成框架

Poetry2Image: An Iterative Correction Framework for Images Generated from Chinese Classical Poetry

摘要

本文介绍了一种名为Poetry2Image的迭代校正框架,用于从中国古典诗歌生成图像。该框架解决了文本到图像生成模型在处理中国古典诗歌时经常出现的元素缺失或语义混淆问题。通过利用外部诗歌数据集和大型语言模型(LLM),Poetry2Image建立了一个自动反馈和校正循环,显著提高了诗歌与图像之间的对齐度。实验结果显示,该方法在元素完整性和语义正确性方面均有显著提升,不仅促进了古代诗歌文化的传播,也为类似非微调方法增强LLM生成提供了参考。

Read more...
Previous Page 146 of 156 Next Page