字节跳动旗下的豆包大模型团队近日传来重要消息,他们正式推出了首个多语言软件错误修正(SWE)数据集——Multi-SWE-bench。这一创新工具旨在评估和提升大型语言模型在自动修复代码错误方面的能力。 Multi-SWE-bench是在原有SWE-bench的基础上拓展而来,其最大亮点 ...