探索金融翻译的未来:大型语言模型在中英金融新闻翻译中的应用与挑战
摘要
本文介绍了一项关于中英金融领域机器翻译的研究,由上海外国语大学经济与金融学院和教育学院的研究人员共同完成。研究团队构建了一个名为FFN的细粒度中英金融新闻平行语料库,并评估了ChatGPT和ERNIE-bot等大型语言模型(LLMs)在金融翻译领域的性能。研究通过BLEU、TER和chrF等评价指标,对比了LLMs与DeepL和Google翻译软件的翻译质量,并训练了一个基于OpenNMT的模型进行性能评估。研究结果显示,尽管LLMs在机器翻译领域取得了显著进展,但在金融领域的翻译准确性和质量仍有待优化。
原理
FFN语料库的构建基于从2014年至2023年间从主流媒体网站如CNN、FOX和China Daily收集的金融新闻文章。该语料库包含1,013篇主要文本和809个标题,所有内容均经过人工校对以确保质量。研究团队使用BLEU、TER和chrF等评价指标来量化翻译质量,并通过对比不同LLMs和传统翻译软件的性能,揭示了LLMs在金融领域翻译中的优势与不足。特别是,研究详细分析了LLMs在处理金融术语、公司名称和组织名称等方面的错误,以及在翻译长句和复杂语法结构时的信息遗漏问题。
流程
研究团队首先从多个知名新闻网站收集金融新闻文章,然后通过人工筛选和校对,构建了高质量的中英平行语料库。接下来,使用该语料库对ChatGPT、ERNIE-bot、DeepL和Google翻译等系统进行性能评估。此外,还训练了一个基于OpenNMT的模型,以进一步验证语料库的有效性。实验过程中,研究团队特别关注了不同提示风格对LLMs翻译能力的影响,并通过多种评价指标对翻译结果进行了详细分析。
应用
该研究不仅为金融领域的机器翻译提供了宝贵的数据资源,还为未来LLMs在特定领域(如金融)的优化和应用提供了深入见解。随着全球化的加深和金融交易的增加,中英金融翻译的需求日益增长。因此,优化LLMs在金融翻译领域的性能,将极大地促进国际金融交流和合作,具有广阔的应用前景。
