ChatGPT在教育中的革命性应用:提升学习体验与技能发展

Revolutionising Role-Playing Games with ChatGPT

摘要

本文探讨了在高等教育中使用ChatGPT进行角色扮演游戏的教学方法,特别是在云计算工程硕士课程中的应用。研究基于Vygotsky的社会文化理论,通过ChatGPT模拟商业场景,旨在分析AI模拟对学生学习体验的影响。研究发现,ChatGPT不仅提高了学生的参与度和批判性思维能力,还促进了理论知识的有效应用。此外,研究强调了适应性教学方法在促进数字素养和为学生准备数字工作场所方面的重要性。论文还强调了将AI整合到课程中,以及高等教育中持续创新的需要,以确保面向未来的高质量教学。研究结果突出了AI和ChatGPT作为创新教育工具的潜力,不仅增强了学习体验,还有助于通过教育实现可持续发展目标(SDGs)。

Read more...

D-Rax:革命性的放射科助手,利用AI提升诊断准确性

D-Rax: Domain-specific Radiologic assistant leveraging multi-modal data and eXpert model predictions

摘要

本文介绍了一种名为D-Rax的领域特定放射助手,该工具利用多模态数据和专家模型预测,旨在通过自然语言接口为放射科医生提供辅助。D-Rax通过精细调整LLaVA-Med架构,结合MIMIC-CXR图像数据、视觉问题回答(VQA)对以及多个专家AI模型的预测结果,显著提高了对话分析的准确性。该工具特别适用于胸部X射线(CXR)图像的分析,能够辅助放射科报告的编写,提高诊断的准确性和效率。

Read more...

FedIA:解决医疗图像分割中异质性标注完整性问题的创新联邦学习方法

FedIA: Federated Medical Image Segmentation with Heterogeneous Annotation Completeness

摘要

本文介绍了一种名为FedIA的新型联邦学习解决方案,专门针对医疗图像分割中存在的异质性标注完整性问题。在联邦学习(FL)的背景下,由于不同客户端的标注完整性不一,传统的FL方法往往假设标注的统一性和完整性,这在实际应用中并不总是成立。FedIA通过将不完整标注视为噪声数据,旨在减少这些噪声对神经网络性能的负面影响。该方法通过评估客户端标注的完整性,优先考虑具有更完整标注的客户端,并对不完整标注进行校正,从而确保模型在准确数据上进行训练。FedIA在两个广泛使用的医疗图像分割数据集上进行了验证,显示出优于现有解决方案的性能。

Read more...

FPGA上的高效能神经网络加速器:AMU的突破性设计与应用

Fast, Scalable, Energy-Efficient Non-element-wise Matrix Multiplication on FPGA

摘要

本文提出了一种基于FPGA的高吞吐量、可扩展且能效高的非元素级矩阵乘法单元(AMU),作为神经网络(NN)的基本组件。AMU通过优化MADDNESS算法中的层间和层内冗余,设计了一种快速、高效的近似矩阵乘法模块。实验结果显示,使用AMU的FPGA基数量化神经网络(QNN)加速器相比现有解决方案,吞吐量提高了9倍,能效提高了112倍。

Read more...

GemmAr: 通过阿拉伯语指令调优增强大型语言模型

GemmAr: Enhancing LLMs Through Arabic Instruction-Tuning

摘要

本文介绍了一项关于增强大型语言模型(LLMs)在阿拉伯语指令调优方面的研究。研究团队开发了名为InstAr-500k的新型阿拉伯语指令数据集,并通过对该数据集的精细调整,提升了开源Gemma-7B模型的性能。经过多轮评估,调整后的模型在多个阿拉伯语自然语言处理(NLP)基准测试中表现卓越。这一成果强调了该数据集在提升阿拉伯语语言模型能力方面的有效性,并为进一步的阿拉伯语NLP发展提供了资源。此外,研究团队还开发了专门针对阿拉伯语NLP任务的模型GemmAr-7B-V1。

Read more...

HRSAM:革命性高分辨率图像分割技术,开启高效精准分割新纪元

HRSAM: Efficiently Segment Anything in High-Resolution Images

摘要

本文介绍了一种名为HRSAM的高效高分辨率图像分割模型,旨在解决传统分割模型在处理高分辨率图像时遇到的内存不足和可扩展性问题。HRSAM通过集成Flash Attention和创新的PSCWin注意力机制,有效降低了空间复杂度并提高了计算效率。此外,HRSAM++版本进一步采用了多尺度策略,显著提升了模型在处理大尺寸输入图像时的性能。实验结果表明,HRSAM模型在保持低延迟的同时,显著优于现有最先进的方法,为高精度交互式图像分割提供了新的解决方案。

Read more...

IFTT-PIN:开创自校准PIN输入新纪元,提升安全与可用性的双重保障

IFTT-PIN: A Self-Calibrating PIN-Entry Method

摘要

本文介绍了一种名为IFTT-PIN的新型PIN输入方法,该方法利用自校准技术,允许用户在无需显式校准过程的情况下个性化界面。IFTT-PIN通过消除按钮预定义颜色的需求,使用户能够自由选择按钮的含义,同时系统能够同时推断用户的PIN和按钮映射。该方法在防止肩窥攻击方面显示出显著效果,通过用户研究(N=24)证明,IFTT-PIN将PIN攻击解码率降低了约8.5倍,同时仅将PIN输入编码率降低了约1.4倍,实现了安全性与可用性的正向权衡。此外,IFTT-PIN的输入速率在初次接触后的21天内显著提高,表明自校准界面具有记忆性,即使在使用初始未定义的用户界面时也是如此。

Read more...

LayTextLLM:革新文档理解的大型语言模型整合布局与文本技术

A Bounding Box is Worth One Token: Interleaving Layout and Text in a Large Language Model for Document Understanding

摘要

本文探讨了在文档理解任务中,如何通过大型语言模型(LLMs)有效整合光学字符识别(OCR)衍生的文本与空间布局。传统的整合方法存在序列过长或未能充分利用LLMs的自回归特性等局限。为此,本文提出了LayTextLLM模型,该模型通过将每个边界框映射为一个单一嵌入并与文本交错,有效避免了长序列问题,同时充分利用了LLMs的自回归特性。LayTextLLM在关键信息提取(KIE)和视觉问答(VQA)任务中展现出显著的性能提升,相较于现有最先进的文档理解模型,KIE任务提升了27.0%,VQA任务提升了24.1%。

Read more...

MARLIN:革新零售内部物流的云集成服务机器人

MARLIN: A Cloud Integrated Robotic Solution to Support Intralogistics in Retail

摘要

本文介绍了一种名为MARLIN的服务机器人系统,该系统与K4R平台集成,K4R平台是一个用于零售领域复杂AI应用的云系统。MARLIN通过与K4R平台的持续数据交换,提升了其在感知、自主导航和任务规划方面的能力。文章详细描述了MARLIN在零售内部物流场景中的应用,特别是在协助商店员工补货方面的能力。实验结果表明,MARLIN能够更新零售商店的数字表示,检测和分类障碍物,自主规划和执行补货任务,适应环境中的意外变化,并与商店员工进行交互。此外,文章还评估了一种用于自主导航的铰接式牵引挂车系统的新算法,该算法在狭窄空间中的导航能力优于制造商的专有导航方法。

Read more...

MeMemo:开启设备端检索增强与个性化文本生成的新纪元

MeMemo: On-device Retrieval Augmentation for Private and Personalized Text Generation

摘要

本文介绍了一种名为MeMemo的创新工具,它是一个开源的JavaScript工具包,专门设计用于在浏览器环境中进行设备端密集检索增强的文本生成。MeMemo通过利用先进的近似最近邻搜索技术HNSW,解决了大型语言模型(LLMs)在数据隐私要求严格的领域(如个人财务、教育和医疗)中的应用限制。该工具通过在客户端进行向量存储和密集检索,不仅保护了用户数据隐私,还降低了AI初学者和日常LLM用户的应用门槛。MeMemo的开发和应用展示了其在私密和个性化内容创建以及交互式原型设计方面的广阔前景。

Read more...
Previous Page 92 of 156 Next Page