迈向类人驾驶:主动推理在自动驾驶车辆控制中的应用

Towards Human-Like Driving: Active Inference in Autonomous Vehicle Control

摘要

本文介绍了一种基于主动推理理论的新型自动驾驶车辆(AV)控制方法。传统的自动驾驶系统依赖于模块化管道、模仿学习或强化学习,这些方法在适应性、泛化能力和计算效率方面存在局限性。主动推理理论源自神经科学,将大脑视为预测机器,通过动态模型平衡感知和行动来最小化预测误差(称为“惊奇”)。本文的方法结合了主动推理和深度学习,用于AV的横向控制,使其能够在模拟城市环境中进行车道跟随操作。实验结果表明,该模型在有限数据下有效学习并泛化,显著减少了计算需求,并在适应性和效率方面优于传统方法,推动了主动推理在实际自动驾驶应用中的潜力。

Read more...

阿拉伯语故事自动生成:大型语言模型的新突破

Arabic Automatic Story Generation with Large Language Models

摘要

这篇论文主要探讨了利用大型语言模型进行阿拉伯语故事自动生成的研究。作者通过翻译和生成数据集,并使用自定义提示模板对模型进行微调,实现了在现代标准阿拉伯语和两种阿拉伯方言中生成连贯流畅的故事。该研究还提出了一种新的阿拉伯语自动故事评估框架,并开发了两个用于自动故事生成的新数据集。通过人类评估和自动评估,证明了该模型能够生成符合特定指令的连贯和流畅的故事。

<工作原理> 该研究的关键在于使用大型语言模型(LLM)进行故事生成。作者使用了经过微调的 AraLLaMa-2-base 模型,并采用了两种微调策略:直接在 GPT-4 Turbo 生成的数据上进行微调,以及在翻译数据上进行微调后,再在 GPT-4-Turbo 生成的数据上进行微调。通过这种方式,模型能够学习到不同的故事风格和语言表达方式,从而提高生成故事的质量和多样性。

<工作流程>

  1. 数据收集:作者使用了多种数据源,包括机器翻译和 GPT-4 生成的数据。对于机器翻译数据,作者使用了多语言句子嵌入进行过滤,以确保数据质量。对于 GPT-4 生成的数据,作者使用了精心设计的提示模板,以生成适合阿拉伯语上下文的故事。
  2. 提示设计:提示在与 LLM 的交互中起着关键作用,它是用户与模型沟通的主要方式。作者设计了一个包含 12 个特征的提示模板,以确保生成的故事具有高质量和多样性。
  3. 模型微调:作者使用了 Huggingface PEFT 库对 AraLLaMa-2-base 模型进行微调。在微调过程中,作者使用了量化技术和 QLoRA 层,以提高模型的效率和性能。
  4. 评估:作者使用了 GPT-4 作为评估器,并进行了广泛的人类评估,以比较不同模型的性能和能力。

<应用前景> 该研究的应用前景非常广泛,包括娱乐、教育、游戏等领域。在娱乐领域,该技术可以用于生成多样化的故事,提高用户体验。在教育领域,该技术可以用于生成个性化的故事,满足学习者的需求。在游戏领域,该技术可以用于生成互动式故事,增强用户的参与度和享受度。

<标题> 阿拉伯语故事自动生成:大型语言模型的新突破

Read more...

非洲民主在生成式虚假信息时代的挑战与对策

African Democracy in the Era of Generative Disinformation: Challenges and Countermeasures against AI-Generated Propaganda

摘要

本文由Chinasa T. Okolo博士撰写,探讨了生成式人工智能(Generative AI)在非洲选举中产生虚假信息(disinformation)的挑战与对策。文章指出,尽管生成式AI技术在教育、医疗和商业流程优化等领域有巨大潜力,但其负面影响,特别是在选举过程中的虚假宣传,已成为公众关注的焦点。文章通过案例研究,分析了生成式AI在非洲选举中的应用及其对民主进程的影响,并讨论了政府、民间社会、学术界和公众在负责任地开发和使用AI方面的角色。此外,文章还探讨了事实核查组织在减轻虚假信息负面影响方面的作用,以及提高公民AI素养和政府监管措施的必要性。

Read more...

革新伤口管理:轻量级AI模型在智能手机上的应用探索

Early Explorations of Lightweight Models for Wound Segmentation on Mobile Devices

摘要

随着全球老龄化人口的增加,慢性伤口(如糖尿病足溃疡)的管理成为医疗保健领域的一大挑战。传统的伤口评估方法依赖于治疗师的主观判断,这不仅效率低下,而且缺乏客观性。本文《Early Explorations of Lightweight Models for Wound Segmentation on Mobile Devices》探讨了在移动设备上使用轻量级模型进行伤口分割的可能性,旨在通过智能手机照片实现客观且便捷的伤口监测。研究采用了多种轻量级架构,如ENet、TopFormer和UNeXt,通过公开数据集进行实验,结果显示这些模型在性能上与传统的UNet相当,且在实际应用中表现出良好的效果。

Read more...

"AI赋能教育创新:探索人工智能在教学设计中的协作应用"

Collaborative Design of AI-Enhanced Learning Activities

摘要

本文由Margarida Romero撰写,探讨了人工智能(AI)在教育中的应用,特别是在增强学习活动中的协作设计。文章指出,尽管AI在教育中的应用日益广泛,但教育者需要提高AI素养,并学会将AI适当地融入教学中。为此,作者与Terra Numerica和Maison de l’Intelligence Artificielle合作,开发了一个形成性干预措施,旨在帮助教育者理解AI,并促进其在学习设计中的创造性应用。通过一系列工作坊,参与者不仅提升了对AI的理解,还学会了如何设计AI增强的教育活动,以促进学生的参与和个性化学习体验。

Read more...

"OPEN方法:解决强化学习中的非平稳性、可塑性损失和探索问题"

Can Learned Optimization Make Reinforcement Learning Less Difficult?

摘要

本文探讨了强化学习(RL)在实际应用中面临的独特挑战,特别是非平稳性、可塑性损失和探索需求。为了解决这些问题,研究者提出了一种名为OPEN的新方法,该方法通过元学习优化规则来专门针对这些挑战。OPEN方法在多种学习环境中表现出色,能够灵活地使用随机性进行探索,并在单一和小规模环境集合中超越或与传统优化器相媲美。此外,OPEN展示了在环境分布和代理架构范围内的强大泛化能力。

Read more...

"TE-SSL:革新阿尔茨海默病进展分析的自监督学习框架"

TE-SSL: Time and Event-aware Self Supervised Learning for Alzheimer"s Disease Progression Analysis

摘要

本文由Jacob Thrasher等人撰写,针对阿尔茨海默病(AD)的进展分析,提出了一种名为TE-SSL(Time and Event-aware Self Supervised Learning)的新型框架。该研究的核心在于利用自监督学习(SSL)技术,结合时间-事件标签作为监督信号,以提高疾病进展分析的准确性。文章通过对比现有SSL方法,展示了TE-SSL在生存分析下游任务中的优越性能。该研究不仅为理解疾病动态提供了新视角,还为个性化患者护理和早期干预提供了技术支持。

Read more...

"XAI-CHEST框架:提升6G网络中信道估计的效率与可解释性"

Explainable AI for Enhancing Efficiency of DL-based Channel Estimation

摘要

本文介绍了在未来的6G网络中,基于深度学习的信道估计(DL-based Channel Estimation)的效率提升问题。文章提出了一种新颖的基于扰动(perturbation-based)的XAI-CHEST框架,旨在通过识别模型输入中的相关和不相关部分来解释黑箱模型行为,从而确保其高效和安全的部署。该框架通过在无关输入上引入高噪声来识别相关模型输入,从而提高整体性能并优化所使用模型的架构。模拟结果显示,XAI-CHEST框架提供了有效的解释,同时提高了比特错误率性能并降低了计算复杂度。

Read more...

"云端数字化:文化遗产元数据采集的新纪元"

Microsoft Cloud-based Digitization Workflow with Rich Metadata Acquisition for Cultural Heritage Objects

摘要

本文介绍了一种基于Microsoft 365云技术的数字化工作流程,旨在为文化遗产对象获取丰富的元数据。该解决方案由Jagiellonian大学与Jagiellonian图书馆合作开发,利用MS Excel文件作为元数据采集接口,Office Script进行验证,以及MS Sharepoint进行存储。此工作流程允许领域专家(如文献学家、历史学家、哲学家、图书馆员、档案管理员、策展人等)无需信息系统经验即可进行元数据采集。最终目标是创建一个描述分析藏品的知识图谱,并链接到通用知识库和其他文化遗产收藏。该工作流程已在DiHeLib项目中针对“柏林收藏”进行了两次试点评估,并在国际嘉宾参与的研讨会中得到了改进和确认。

Read more...

"保护企业级LLM应用:一种基于角色安全和北约级别的创新架构"

A Simple Architecture for Enterprise Large Language Model Applications based on Role based security and Clearance Levels using Retrieval-Augmented Generation or Mixture of Experts

摘要

本文提出了一种基于角色安全和企业大型语言模型应用的简单架构,该架构利用基于角色的安全和北约安全级别,结合检索增强生成(RAG)和专家混合模型(MoE)。该研究旨在解决当前大型语言模型(LLMs)在处理安全和信息访问方面的局限性。通过使用用户角色和安全级别,过滤RAG中的文档和MoE中的专家,从而防止信息泄露。

Read more...
Previous Page 34 of 156 Next Page