开源日报 | 李彦宏内部讲话曝光;阿里25周年马云内部发声;今天的App必须要把自己AI化;软件有半衰期;开源大模型编程框架ell

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.9.11

今日要闻

Canonical 正在将 GraalVM 打包成 deb 格式引入 Ubuntu

Reflection 70B AI 模型被曝第三方基准测试效果不佳

据 venturebeat 报道,上周推出的号称可与顶级商业大模型一较高下的开源大模型Reflection 70B今日被曝在第三方测试中表现不佳。

上周末独立的第三方评估人员和开源人工智能社区成员在 Reddit 和 Hacker News 上发帖,开始质疑该模型的性能,并表示无法自行复制。有些人甚至发现了一些回复和数据,表明该模型与 Anthropic 的 Claude 3.5 Sonnet 模型有关,也许只是一个薄薄的 “包装”。

在独立的人工智能评估机构Artificial Analysis在X上发布其对Reflection 70B的测试结果比HyperWrite最初声称的得分低得多之后,批评的声音越来越多。

Reflection 公司联合创始人兼首席执行官 Matt Shumer对此表示道歉,并表示这些差异归咎于模型上传到 Hugging Face 的过程中出现的问题,并承诺在上周修正模型权重,但至今仍未做到。

阿里25周年马云内部发声

李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型之间的差距会变大

“外界对大模型有相当多的误解,” 近日据媒体报道,李彦宏的一则内部讲话曝光。 在最近一次和员工交流中,李彦宏谈及三个大模型认知误区,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。 李彦宏谈到,未来大模型之间的差距可能会越来越大。他表示,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。

今日观察

—END—

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

 

未经允许不得转载:岩猫星空网 » 开源日报 | 李彦宏内部讲话曝光;阿里25周年马云内部发声;今天的App必须要把自己AI化;软件有半衰期;开源大模型编程框架ell