探索未来通信技术:基于大型模型的数据无损压缩新范式
摘要
本文由Ziguang Li等人提出,探讨了基于大型语言模型(LLM)的数据无损压缩方法,命名为LMCompress。该方法的核心理念是“理解即压缩”,即通过提高模型对数据的深入理解来实现更高效的压缩。LMCompress在图像、音频、视频和文本等多种数据类型上展示了显著的压缩效率提升,其压缩比率远超传统方法,如JPEG-XL、FLAC和H264等,甚至在某些情况下达到了三到四倍的提升。
Read more...本文由Ziguang Li等人提出,探讨了基于大型语言模型(LLM)的数据无损压缩方法,命名为LMCompress。该方法的核心理念是“理解即压缩”,即通过提高模型对数据的深入理解来实现更高效的压缩。LMCompress在图像、音频、视频和文本等多种数据类型上展示了显著的压缩效率提升,其压缩比率远超传统方法,如JPEG-XL、FLAC和H264等,甚至在某些情况下达到了三到四倍的提升。
Read more...本文介绍了一种基于深度学习的三维形状重建框架,用于从无相位声散射远场数据中恢复物体形状。该问题在医学成像、声纳、传感等多个领域具有重要意义。传统的逆散射问题由于数据信息有限且问题本身不适定,解决起来非常困难。本文提出的ISSRNet框架通过使用一个紧凑的概率形状潜在空间和一个卷积神经网络,能够从单一入射波、单一频率的无相位远场数据中重建复杂的三维形状。该框架在合成三维粒子数据集和ShapeNet数据集上进行了评估,显示出即使在数据变化显著的情况下,也能产生准确的重建结果。
Read more...本文介绍了一种名为INDICT的新框架,旨在通过内部批判对话增强大型语言模型(LLMs)在代码生成中的安全性和有用性。在实际应用中,LLMs在处理复杂且可能恶意的指令时,往往难以在安全性和有用性之间找到平衡。INDICT框架通过引入一个双批判系统,包括一个安全驱动的批判者和一个有用性驱动的批判者,来解决这一问题。这两个批判者通过外部知识(如代码片段和网络搜索)来分析和改进LLMs生成的代码,从而在代码生成和执行阶段提供预先和事后的指导。实验结果显示,INDICT框架在多种编程语言和基准测试中显著提高了代码输出的质量和安全性。
Read more...本文由Jialong Xu等人撰写,针对大规模多输入多输出(MIMO)系统中的信道估计问题,提出了一种基于信念信息(Belief Information)的深度学习方法。在未来的无线通信系统中,为了支持如沉浸式通信等新兴场景,传输速率需要持续提升。然而,当前的MIMO系统依赖于插入导频信号来实现精确的信道估计,这会消耗大量的传输资源,严重降低频谱效率。本文提出的方法通过引入一个即插即用的信念信息模块,使现有的单天线信道估计网络能够无缝适应多天线信道估计,并充分利用多个天线之间的空间相关性。实验结果表明,该方法在恶劣信道条件下,能够提高1~2 dB的信道估计性能或减少1/3~1/2的导频开销。
Read more...本文由Xianda Chen等人撰写,针对混合交通环境中连接和自动化车辆(CAVs)与人类驾驶车辆(HDVs)共存时的交通振荡问题,提出了一种新颖的“CAV-AHDV-CAV”车辆跟随结构和强化学习方法。该研究通过将CAVs与HDVs之间的交互视为一个整体单元,利用深度强化学习分析车辆平衡状态,并采用状态融合策略,有效地减少了交通中的“停-走”模式。研究在多个数据集上进行了训练和测试,结果显示该模型在避免碰撞、维持车辆平衡以及降低时间头距标准差方面表现优异,显示出在混合交通环境中提高交通流效率和安全性的潜力。
Read more...本文介绍了一种名为UQE的新型查询引擎,专门设计用于处理非结构化数据库。UQE通过利用大型语言模型(LLMs)的能力,直接从非结构化数据集合中提取洞察。该引擎接受一种名为通用查询语言(UQL)的查询,这是一种SQL方言,允许在指定条件和操作符时具有完全的自然语言灵活性。UQE不仅利用LLMs进行非结构化数据分析,还结合了采样和优化技术的进步,以实现高效和准确的查询执行。此外,UQE借鉴了经典编译器理论的技术,以更好地协调采样方法和基础模型调用之间的流程。实验证明,UQE在不同模态的数据分析中,包括图像、对话和评论,以及一系列有用的查询类型,如条件聚合、语义检索和抽象聚合,都表现出了效率和准确性。
Read more...本文介绍了一种名为MuseCL的多语义对比学习框架,用于通过多模态数据预测城市地区的社会经济指标。该框架通过结合街景图像、遥感图像、兴趣点(POI)数据和人口流动数据,提取多维语义特征,以实现对城市区域的细粒度分析和准确的社会经济预测。实验结果显示,MuseCL在多个城市和指标上的表现优于其他竞争模型,平均R2值提高了10%。该研究为城市可持续发展和人类居住环境的改善提供了重要的技术支持。
Read more...本文由Xianda Chen等人撰写,题为“EditFollower: Tunable Car Following Models for Customizable Adaptive Cruise Control Systems”。文章主要探讨了在自动驾驶车辆尚未普及的背景下,高级驾驶辅助系统(ADAS)中的自适应巡航控制(ACC)系统的重要性。当前ACC系统通常采用固定设置,未能充分考虑驾驶员的社会偏好,可能导致系统功能解除。为此,作者提出了可编辑行为生成(EBG)模型,这是一种数据驱动的跟车模型,允许调整驾驶不礼貌水平。该模型结合了长短期记忆(LSTM)和Transformer架构,通过集成不同的不礼貌计算方法,生成具有不同礼貌水平的真实代理轨迹。实验结果显示,与基准相比,该模型在HighD和Waymo数据集上的平均平方误差(MSE)有所降低,证明了其风格可控性。这是首个能够动态调整不礼貌水平的数据驱动跟车模型,为考虑驾驶员社会偏好的ACC系统开发提供了有价值的见解。
Read more...本文探讨了大型语言模型(LLMs)在复杂推理任务中的局限性,特别是在生成和细化符号形式化表示方面的挑战。为了解决这些问题,作者提出了Logic-LM++,这是对Logic-LM的改进版本,利用LLMs的成对比较能力来评估和改进符号形式化表示。实验结果表明,Logic-LM++在自然语言推理任务上优于Logic-LM和其他基于LLM的技术,特别是在FOLIO和AR-LSAT数据集上显示出显著的性能提升。
Read more...本文探讨了大型语言模型(LLMs)在复杂推理任务中的局限性,并提出了一种改进方法Logic-LM++。该方法通过利用LLMs的成对比较能力,评估和优化由LLM提出的形式规范的改进,从而提高推理任务的准确性。实验表明,Logic-LM++在三个数据集(FOLIO、ProofWriter和AR-LSAT)上的表现优于现有技术,平均提高了18.5%的标准提示准确率。
Read more...