开源日报 | AI被连续否定30次;Java“上位”;开源模型之王翻车;A18芯片采用Arm最新架构;鸿蒙系统“飞天”;IBM曾经是伟大的企业

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.9.9

今日要闻

苹果全新 A18 芯片基于 Arm 最新 V9 架构

TIOBE 9 月榜单:Java 上位,C 语言跌至历史最低

开源模型之王Reflection一夜翻车,炒作背后真相揭晓

近日,AI 开源社区因为一款新模型 Reflection 70B 掀起了讨论风暴。该模型由 HyperWrite 公司开发,原本被认为是基于 Llama 3.1 70B Instruct 构建的,并且在多个基准测试中超越了 GPT-4。这个模型横扫了 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。 凭借如此惊艳的效果,Reflection 70B 被冠以开源大模型新王。该模型更是由两位开发者(Matt Shumer 和 Glaive AI 创始人 Sahil Chaudhary)花了 3 周完成。

但独立分析机构和 Reddit 社区的测试显示,Reflection 70B 可能仅是经过 LoRA 调整的 Llama 3,而非 Llama 3.1。该机构表示,Reflection Llama 3.1 70B 的 MMLU 得分仅与 Llama 3 70B 相同,并且明显低于 Llama 3.1 70B。还有科学推理与知识(GPQA)和定量推理(MATH)基准测试的结果,同样不如 Llama 3.1 70B。

今日观察

—END—

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

 

未经允许不得转载:岩猫星空网 » 开源日报 | AI被连续否定30次;Java“上位”;开源模型之王翻车;A18芯片采用Arm最新架构;鸿蒙系统“飞天”;IBM曾经是伟大的企业