开源日报 | 马斯克给英伟达打工;扎克伯格因为AI开源又火了;横向对比各家LLM的长上下文;将.NET移植到任天堂NES;“腾讯元宝”

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.5.30

今日要点

最强开源编程大模型一夜易主 —— Mistral AI 发布 Codestral

Mistral 发布了新的编程大模型 Codestral,并开源模型参数权重。据称 Codestral 在代码基准测试中显著优于 Llama3 70B 等大模型。

Codestral 在 80 多种编程语言的不同数据集上进行了训练,其中包括最流行的语言,如 Python、Java、C、C++、JavaScript 和 Bash。对于不那么主流的语言比如 Swift 和 Fortran 同样表现出色。这种广泛的语言基础确保 Codestral 可以在各种编码环境和项目中为开发者提供帮助。

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕

谷歌今年 3 月 27 日不小心将其部分内部 API 文档发布到 GitHub 上,直到 5 月 7 日才被删除。这些内部文件披露了 Google 搜索引擎相关的敏感信息。

俄罗斯考虑向使用外国软件的公司收费

俄罗斯政府考虑对使用外国软件的本土企业收取费用,因为莫斯科正寻求减少对外国技术的依赖并加强本国技术。

腾讯混元推出大模型应用:“腾讯元宝”

腾讯混元全面升级,推出大模型APP「腾讯元宝」。其核心竞争力是腾讯的生态。在 AI 搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过 AI 搜索增强,提升时新类和知识类问题效果。内容覆盖微信公众号等腾讯生态内容及互联网权威信源。

微软工程师将 .NET 移植到任天堂 NES

Jonathan Peppers 是微软 .NET for Android /.NET MAUI 团队的首席软件工程师。近日他在微软 Build 2024 开发者大会上分享了一个有趣的主题 —— 在任天堂 NES 游戏机上运行 .NET,演示了 C# 程序在 1985 年的游戏机上运行的效果(游戏机采用 6502 微处理器)。

今日观察

今日推荐

开源项目

https://gitee.com/opengoofy/hippo4j

hippo4j 通过对 JDK ThreadPoolExecutor 线程池增强,以及扩展三方框架底层线程池等功能,为业务系统提高线上运行保障能力。

每日一博

本文主要通过图示介绍了用主键进行分片查询的过程,介绍了主键分页查询存在 SQL 性能问题,如何去创建高效的索引去优化主键分页查询的 SQL 性能问题

对于数据分布不均如何发现,提供了一些 SQL 查询案例来进行参考,对 MySQL Index Condition Pushdown 优化算法做了一些简单介绍。

为了不被卡脖子——俄罗斯政府考虑对使用外国软件的本土企业收取费用

塔斯社周二援引俄罗斯数字发展部部长马克苏特 – 沙达耶夫(Maksut Shadaev)的话称,政府考虑对使用外国软件的本土企业收取费用,因为莫斯科正寻求减少对外国技术的依赖并加强本国技术。

点评

俄罗斯政府的这一政策是一个复杂的决策,它涉及到国家的技术自主性、经济发展、国际贸易关系以及创新生态等多个方面。这一政策的实施和效果值得业界和观察家们持续关注。

微软工程师将 .NET 移植到任天堂 NES

Jonathan Peppers 表示这次尝试将 .NET 移植到 NES 学习到了逆向工程、操作码、MSIL(如何将 MSIL 转换为 6502 程序集)、API 设计、二进制格式和 .NET 开发经验等知识。他表示虽然成功移植不能玩任何游戏,主要是运行 Hello World 和其他简单的演示程序,但该项目依然很酷 ———— 以及最重要的 “Nerd Flex”。

点评

Jonathan Peppers将.NET移植到NES的项目不仅是一次技术展示,也是对技术可能性的探索和对极客精神的庆祝。这种尝试超越了常规思维,体现了工程师对技术的热爱和对挑战的追求。

将现代的.NET框架与1985年的NES游戏机结合,是一次跨时代技术的有趣融合。这不仅是一种技术成就,也是对过去与现代技术的致敬。NES的硬件资源非常有限,而.NET是一个现代的、功能丰富的框架。成功在NES上运行.NET需要克服极大的技术限制,这本身就是一项技术壮举。

虽然目前该项目主要运行“Hello World”和其他简单演示程序,但它证明了在NES上运行现代编程语言的可行性,为未来可能的技术演示和教育工具奠定了基础。这一项目可能会激发对复古游戏机和游戏文化的兴趣,促进复古游戏社区的复兴和创新。

此类项目可能会启发未来的技术开发,例如在资源受限的环境下运行复杂软件的解决方案,或者在教育和娱乐领域创造新的应用。

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕

本次泄露文档中的部分内容与谷歌公开表态的信息以及 2023 年的美国司法部起诉谷歌的反垄断案件中的证词相矛盾。比如,谷歌曾一再否认使用点击导向的排名机制,否认子域名在排名中被单独考虑,否认收集或考虑域名的年限等等。但泄露文档证实,这些因素都是谷歌搜索引擎排名机制中的一环。

点评

开源之声

媒体观点

在降价潮把大模型拉回C位的如今,我们更应该审视的是在大模型进入中国一年后的当下,在技术、参数不再是唯一标准的如今,中国产业大模型的卡点如今到底在哪?

– 产业家

国内的相关数据显示,80%以上的网络安全公司都在将大模型技术集成到网络安全产品中,30%的公司已经开始做大模型安全的研究,也出现了一些安全创业的浪潮。

针对AI技术发展带来的安全风险,中国工程院院士、清华大学智能产业研究院院长张亚勤则建议,从事前沿大模型的企业或机构,要把10-30%的投资投到相关研究或产品的开发。

-科创板日报

-21世纪经济报道

这个 5 月,可能是 ChatGPT 发布至今大模型行业最热闹的时候:OpenAI、Google、微软、字节跳动、阿里巴巴等中美两国公司至少举办了 13 场与大模型相关的发布会,介绍了 10 多款新模型,拿出了一堆新产品。

热闹中的风险与失望是:不少从业者认为技术没有重大进步。

– 晚点LatePost

用户观点

  • 观点 1:信创(Russia version)
    • 观点 2:信创可能不好用,可总比没得用,有漏洞可能被恶意利用强
  • 观点 3:也是没办法了,现在不加压力促使这群企业主动做出改变,等到真出事可有好看的。
  • 观点 4:欧美都把软件的售后给断了,这些软件往下用确实问题也很大
  • 观点 5:Linux芬兰产,无国界
    • 观点 6:俄 自己会写,况且他们本身代码都不错
  • 观点 7:不是很懂哈,从商品的角度说,比如我购买了微软的office,实际上是已经收税了吧?如果说是以后购买office比购买WPS多收税的话,我觉得国内也可以推广一下这种规则
  • 观点 8:一堆可笑言论,这不就相当于软件的进口关税吗?上面这些评论,是不是害怕一个从几千米的空中掉下来的水滴砸死?
  • 观点 1:吃的太饱了
  • 观点 2:果然人类的进步始于无聊
  • 观点 3:这是编程最纯粹的快乐!
  • 观点 4:日系法务部有没有发出最强的通知?
  • 观点 5:其实我现在很难想象当年的程序员是如何在NES上开发游戏的,一个大概的流程可能都失传了吧……
  • 观点 6:你们.net 可真会玩
  • 观点:1:赠品是内奸
  • 观点 2:以后玩模拟器也要付费了,不充个SVIP,好多功能还没法用
  • 观点 3:什么时候在Linux也可以集成? 这样Linux也可以运行Andorid应用,软件生态可以大幅度提升
    • 观点 4:Deepin Linux 有 Android 运行时
  • 观点 5:能不能和HyperV共存呢
    • 观点 6:可以的至少之前的wsl和wsa都可以腾讯应该不至于那么菜
  • 观点 7:其实安卓生态的优势是主要因素,也可以移植到桌面鸿蒙和Linux, Mac 上去,没有任何难度
  • 观点 8:我安卓系统何时可以用windows11模拟器呢?
    • 观点 9:这个目前就别想了,硬件上就不行

—END—

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

未经允许不得转载:岩猫星空网 » 开源日报 | 马斯克给英伟达打工;扎克伯格因为AI开源又火了;横向对比各家LLM的长上下文;将.NET移植到任天堂NES;“腾讯元宝”