探索高效双曲Transformer:完全在双曲空间中的创新模型
摘要
本文介绍了一种名为Hypformer的高效双曲Transformer模型,该模型完全在双曲空间中运行,特别适用于处理具有树状和层次结构的数据。Hypformer通过引入两个基础模块——双曲变换(HTC)和双曲调整与细化(HRC),定义了Transformer在双曲空间中的基本模块。此外,Hypformer开发了一种线性自注意力机制,使其能够首次处理十亿级规模的图数据和长序列输入。实验结果证实了Hypformer在各种数据集上的有效性和效率,展示了其作为大规模数据表示和大模型有效且可扩展解决方案的潜力。
Read more...








