新京报贝壳财经讯(记者罗亦丹)12月31日,智谱AI旗下GLM技术团队发文称,“在2024年的最后一天,我们将发布我们本年度最后一个模型GLM-Zero的初代版本GLM-Zero-Preview,这是智谱首个基于扩展强化学习技术训练的推理模型。”
GLM-Zero-Preview专注于增强模型推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面表现大幅提升。其在AIME 2024、MATH500和 LiveCodeBench评测中,效果与OpenAI-o1-Preview相当。
根据GLM团队在官方公号给出的图片案例,Zero推理模型同OpenAI此前推出的o1一样,也能给出深度思考的步骤,如下图所示。
“目前的GLM-Zero-Preview与OpenAI的o3模型还有不少的差距。未来,我们将持续优化迭代强化学习技术。很快,我们将会推出正式版GLM-Zero,将深度思考的能力从数理逻辑扩展到更多更通用的技术,继续向AGI迈进。”GLM技术团队表示。
编辑 俞金旻
校对 杨利