欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.5.14
今日要点
腾讯官宣:「混元文生图大模型」全面开源
混元文生图大模型(下称:混元 DiT,Scalable Diffusion Models with Transformers)由腾讯开源,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。
升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础。
混元 DiT 是一个基于 Diffusion transformer 的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元 DiT 能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解,参数量 15 亿。
开源编程助手Devon上线
用户仅需通过一个命令来安装和运行该工具,以在其 IDE 中进行项目的完整编辑和执行。开源地址:https://github.com/entropy-research/Devon
IBM 开源 Granite 代码模型
IBM 开源了它用于辅助编程的 Granite 代码模型,源代码托管在 GitHub 上,采用 Apache License 2.0 许可证,允许商业使用。
与其它 AI 模型不同的是,IBM 致力于避免模型的版权问题,使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型,可用于修 bug、解释代码和生成代码文档,使用了 116 种编程语言的代码进行训练,参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。
https://github.com/ibm-granite/granite-code-models
今日观察
今日推荐
开源项目
https://github.com/zellij-org/zellij
Zellij 是一个终端工作区。它具有终端多路复用器的基本功能(类似于tmux或screen),但包含许多内置功能,允许用户对其进行扩展并创建自己的个性化环境。
每日一博
当下,构建交互式应用程序的主流技术是 Web 技术,其中包括 HTML、CSS 与 JavaScript。在过去的 10 年,Web 技术生态发生了翻天覆地的变化,包括层出不穷的开发框架,诸如 React、Vue、Svelte,也包括日新月异的前端工程化工具,比如 Webpack、esbuild、Vite 等等。但归根结底,他们都逃不开 HTML、CSS、JavaScript 三剑客的范畴。
Web 技术生态成熟、稳定,然而却存在一个致命的问题,因为使用 Web 技术去构建跨平台应用程序并不是一件简单的事情。
腾讯云、阿里云宣布对 .art 域名价格进行调整
腾讯云发布公告称,因收到上游注册局成本价格变动通知,腾讯云决定于 2024 年 5 月 22 日 0 点,对.art 域名后缀(普通词)续费 / 转入价格进行调整:
点评
这一价格调整反映了域名注册市场的动态变化。腾讯云和阿里云作为主要的云服务提供商,其对.art域名的价格调整可能影响了整个域名注册市场的定价策略。
域名价格的变动还可能影响用户选择注册或续费特定域名的决策。例如,价格上涨可能会导致用户寻找更经济实惠的替代方案,或者在价格较高时选择不续费。
这一事件也显示了云服务提供商在市场中的竞争地位。腾讯云和阿里云作为市场上的主要玩家,他们的价格调整可能会对其他云服务提供商产生影响,迫使他们也进行相应的价格调整。
谷歌展示在 Android 虚拟机中运行 ChromeOS
根据 Android Authority 的报道,谷歌开发了支持在 Android 智能手机中基于虚拟机运行的 ChromeOS。
报道称,这个特别的 ChromeOS 构建版本内部代号为 “ferrochrome”,目标就是用于在虚拟机中运行。根据演示视频,“ferrochrome” 已经能够流畅地在 Google Pixel 8 运行 —— 并且是跑在虚拟机中。
点评
开源之声
媒体观点
“与已有规则不同,本案裁判把握开源许可协议约束力,界定开源代码权利人与软件二次开发者的权利边界,彰显了开源代码基础上二次研发的新成果应予保护,不必完全受制于国外机构单方制定的强制开源规则的鲜明导向。判决结果对于激励创新、促进软件业健康规范发展具有一定意义,给软件开发者吃了‘定心丸’。”苏州知识产权法庭庭长赵晓青谈及该案判决时如是说。
-人民法院报
李开复认为,国内大模型赛道的竞跑从狂奔到长跑,终局发展将取决于各个选手如何有效达到“TC-PMF”(技术成本和产品市场契合度)。
“大模型从训练到服务都很昂贵,算力紧缺是这一赛道的集体挑战,行业应当共同避免陷入不理性的ofo式流血烧钱打法,让大模型能够健康地蓄能长跑。”
-中国新闻网
-动脉vcbeat
多模态“抢镜”已久,单纯的语言模型似乎有点寂寞,而AI搜索似乎重新点燃了这方面的热情。它会是继视频和音乐创作之后的下一个AIGC热点领域吗?是不是很快就会进入激烈的“千搜大战”了?
-视智未来
用户观点
- 观点 1:未来需要新的芯片和计算机架构才能实现AGI。不管Sora还是chatGPT,都不是通用人工智能,也没有自主意识, 两次因果放大,跨越三个空间层级——自主信息系统的特点。DNA通过RNA读取信息,表现在蛋白质等生物大分子上,维持细胞运转,这是一次因果放大,更微观层面的扰动引起DNA的突变,也是一次因果放大,所以以DNA为主信息系统实现了两次因果放大,跨越了三个空间层级。同样,大脑思考学习表现在身体行为上,是一次因果放大,自主意识、偶发灵感亦源于更微观层面的扰动,也是一次因果放大,所以说大脑-神经系统也做到了两次因果放大,跨越了三个空间层级。而且这两级因果放大,后一级是非常稳定的,前一级是不稳定的。如果两级放大都非常稳定,就会融合成一级了,若两级都不稳定,那跟自然界一直都有发生的蝴蝶效应没什么区别了。对于前一级放大稳定,后一级不稳定,这其实就是普遍存在的主体行为变化产生的外界影响。现在的计算机只做到了一次因果放大,跨越两个空间层级,所以只是自动信息系统。未来若要冲刺人工智能则需要再下探一级。
- 观点 1:能自动优化屎山代码么
- 观点 2:必须推出合适的离线使用环境
—END—
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!
未经允许不得转载:岩猫星空网 » 开源日报 | OpenAI硬刚谷歌;部分人工智能系统已擅长“说谎”;看谁先打造出“AI微信”;一个能搞钱的开发思路