"Skywork-Math:突破大型语言模型在数学推理上的极限"
摘要
本文探讨了如何通过数据扩展法增强大型语言模型(LLMs)在数学推理能力上的表现。研究团队引入了Skywork-Math模型系列,这些模型在常见的7B参数LLMs上进行了监督微调(SFT),使用了他们提出的250万实例的Skywork-MathQA数据集。Skywork-Math 7B模型在MATH和GSM8K基准测试中取得了显著的准确率,分别达到了51.2%和83.9%,超越了早期版本的GPT-4。这一成果得益于他们创新的两阶段数据合成和模型SFT流程,该流程包括三种不同的增强方法和一个多样化的种子问题集,确保了Skywork-MathQA数据集在不同难度级别上的数量和质量。此外,研究还提供了实用的见解,以增强LLMs在数学推理方面的能力,适用于研究和工业应用。
Read more...








