Kimi 宣布推出趋近 OpenAI o1 系列水平的新一代数学推理模型 k0-math。
公告称,k0-math 是 Kimi 推出的首款推理能力强化模型,采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升了解决数学难题的能力,可以帮助用户完成更具挑战性的数学任务 。
在多项数学基准能力测试中,k0-math 的表现能对标 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中,k0-math 初代模型成绩超过o1-mini和o1-preview模型。
在业界最常使用的数学能力基准测试 MATH 中,k0-math 模型得分 93.8,超过 o1-mini 的 90 分和 o1-preview 的 85.5 分。k0-math 这一成绩仅次于暂未开放使用的 o1 完全版 94.8 分。
在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。接下来,k0-math 模型会持续迭代,提升更难题目的解题能力,挑战数学模型的能力极限。
Kimi创始人杨植麟介绍,k0-math 模型和更强大的Kimi探索版,未来几周将会分批陆续上线Kimi网页版和Kimi智能助手APP,帮助大家解决更有挑战的数学和搜索调研类任务。
未经允许不得转载:岩猫星空网 » Kimi 发布新一代数学推理模型 k0-math