欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.4.7
今日要点
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
来自UC berkeley的研究人员开源了首个世界模型,多模态性能优秀,长视频理解吊打GPT-4,同时将上下文长度增加到百万级别。
上图展示了LWM的多模态训练。第一阶段是上下文扩展,重点是使用Books3数据集扩展上下文大小,从32K增长到1M。第二阶段,视觉语言培训,重点是对不同长度的视觉和视频内容进行培训。饼图详细说明了训练数据的分布情况,包括495B的文本-视频数据,以及33B的文本数据。
FFmpeg 7.0 “Dijkstra” 发布
FFmpeg 7.0 “Dijkstra” 现已发布。此版本以荷兰计算机科学家 Edsger W. Dijkstra 的名字命名,一些值得注意的变化包括原生 VVC 解码器(目前处于实验阶段)、IAMF 支持以及多线程 ffmpegCLI 工具。
该版本并不向后兼容,删除了 6.0 之前废弃的 API。对大多数 library callers 来说,最大的变化是删除了旧的 bitmask-based channel layout API,取而代之的是允许自定义通道排序或 Ambisonics 等功能的 AVChannelLayout API。某些过时的 ffmpegCLI 选项也已被移除,现在需要使用兼容 C11 的编译器来构建代码。
Redict 首个稳定版 7.3.0 发布,基于 Redis 7.2.4 的社区分支
Redict 首个稳定版 7.3.0已发布。此版本 fork 自 Redis 7.2.4,采用LGPL 开源协议 —— 团队称这是为了确保云厂商可以继续向其客户提供 Redict,而无需遵守繁琐的合规条款。
微软完成 Azure RTOS 的开源迁移:更名为 Eclipse ThreadX,采用 MIT 开源协议
今日观察
社交观察
从螺旋起飞到求给机会,从 30% 到 3% 不到,火狐到底发生啥了?
从 2010 年开始,火狐一直在丢失市场,市占率每 4 年跌 10%,前几年辛苦攒的用户全跑了。在 2017 年,Mozilla 的 CEO 也承认说:Firefox 没有跟上市场发展,没能及时满足用户需求,很多 Firefox 铁粉都成了 Chrome 用户。
– 差评
今日推荐
开源项目
https://github.com/toeverything/AFFiNE
AFFiNE 是开源协作知识库软件,注重隐私保护,面向专业人士打造。
特性
推荐理由
AFFiNE是一个注重隐私保护的开源个人笔记软件,提供了一个简洁直观的用户界面和Markdown支持,方便用户进行内容创作和格式化。作为一个离线优先的解决方案,AFFiNE让用户能够完全控制自己的数据,并在离线状态下工作,数据在重新联网时可以无冲突合并。AFFiNE的设计理念和对隐私的重视,使其成为Notion等在线笔记应用的优秀替代品。
每日一博
本文总结了作者在日常 / 大促业务的 “敏捷” 开发过程中产生的疑惑,并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中,梳理了一些简单设计方案可以缓解当时“头疼” 的几个敏捷迭代问题,并实践在项目迭代中。
事件点评
首例,美国法官裁定 AI 增强视频不足以作为法庭证据
美国全国广播公司 (NBC)报道称,在美国华盛顿州的一项三重谋杀案判决中,法官 Leroy McCullogh 判定使用 AI 增强过后的视频不足以作为证据呈现。这是行业中的首例此类裁决。
McCullogh 法官认为此类软件依赖于 "不透明的方法来表现 AI 模型认为应该显示的内容"。
裁决书写道:“本庭认为,采纳这一 AI 增强证据会导致问题混淆,混淆目击证人的证词,并可能导致一场耗时的审判中的审判,涉及 AI 模型所使用的不可同行评议的程序。”
点评
此裁决标志着AI技术在法庭证据领域的应用受到了限制,同时也引发了关于技术在法律程序中角色的重要讨论。此案例的影响深远,它不仅影响了当前的法庭实践,也为未来的法律和技术发展提供了重要的参考。对于法律界和科技界来说,这起案件是对如何在法律框架内合理应用新技术的考验,同时也突显了技术在司法领域应用的复杂性和潜在风险。
此外,这一事件还可能对公众对AI技术的看法产生影响,尤其是在法律和证据采集领域的应用。公众可能会更加关注AI技术的透明度和公正性,以及在法律程序中使用AI技术的潜在偏见和误导性。
总体而言,这一事件不仅是一个法律案例,也是对AI技术在法律和司法领域应用的深刻反思,其影响将波及到法律实践、技术发展和公众意识等多个方面。
德国也要 “自主可控”,州政府将 3 万台 PC 从 Windows 迁移到 Linux
在试点成功之后,德国北部州 Schleswig-Holstein(石勒苏益格 – 荷尔斯泰因)决定将政府机构使用的 3 万台 PC 从 Microsoft Windows 和 Microsoft Office 迁移到 Linux 和LibreOffice。
不过该政府做出这一决定并不是因为 Linux 和 LibreOffice 的技术优势,而是因为看重 “数字主权”。
州政府**表示该州成为德国第一个引入数字主权 IT 工作场所的州。数字主权 (Digitally Aovereign) 是指相对于封闭的私有软件,公共管理部门对开源软件构成的 IT 解决方案有更多的控制权。政府部门可以有更多的选择,可以资助当地的程序员改进开源软件,可以根据需要进行修改以部署在自己的基础设施中。
点评
德国石勒苏益格-荷尔斯泰因州的决策体现了对数字自主性的重视,同时也是对全球软件供应链依赖性的一次重要反思。虽然开源软件提供了更大的灵活性和控制权,但历史案例表明,此类迁移并非没有挑战。长远来看,这一举措可能会对开源软件的发展和政府IT策略产生深远影响。
超 4000 应用加入鸿蒙生态
华为官宣目前已有超 4000 个应用加入鸿蒙生态,鸿蒙生态进入第二阶段。值得注意的是,从今年 1 月 18 日华为宣布首批 200 多家应用厂商正在加速开发鸿蒙原生应用,到 3 月底超 4000 个应用,短短两个月时间增长幅度高达 20 倍。
点评
这一成就对于华为来说,不仅显示了其在推动鸿蒙生态系统方面的迅速进展,也反映了鸿蒙在业界的影响力和吸引力。对于华为而言,鸿蒙生态的快速扩张是其技术战略的重要里程碑,有助于提升其在操作系统领域的竞争力。
对于开发者来说,鸿蒙生态的快速增长意味着更多的机会和挑战。开发者可以利用鸿蒙平台开发出更多创新的应用,满足用户需求,同时也要面对更加激烈的竞争。对于整个操作系统市场来说,鸿蒙生态的快速发展可能改变现有的市场格局。
开源之声
媒体观点
在常昊看来,人工智能的确给如今的棋手带来了颠覆性的体验:“从AlphaGo击败李世石和柯洁开始,人工智能的围棋就已经进入了大家的视线。尤其是2018年,深度学习的技术开源之后,利用人工智能训练已经是每一个职业棋手必备的。这个过程颠覆了很多大家对围棋的认识。尤其是我,我小的时候学习的下法,很多都已经被人工智能给颠覆了。”
在承认人工智能“威力”的同时,常昊并不认为科技会让围棋失去魅力。“我觉得围棋的本质并没有变化。其实我们人类一直也在探索围棋的奥妙,围棋太难了,可以说,即便我们的高手也只是懂一点点。所以我也很希望人工智能这样一种科技的力量,可以帮助我们进一步探索围棋的奥妙,把围棋更深层的魅力展现出来。”
-羊城晚报
尽管现在 AI PC、AI 手机是噱头成分居多,真正在 C 端有决定意义的价值点较少。但这趟列车已经绑定了太多的人:高通、英特尔、三星、联想……以及一系列基础模型厂商、模型中间件厂商。某种意义上,这是“元宇宙 Plus”版的概念列车,必须找到终点,也必须驶到终点。与当年元宇宙的情况不同的是,大模型当下的技术发展曲线,仍在陡峭上升中——
至少在 GPT-5 发布前,所有的商业故事,都会如约讲下去。
-虎嗅APP
清华大学、新加坡国立大学和中国科学院大学的发布了一篇题为《LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images》的论文。该工作对当前最强的商业大模型 GPT-4V 和最受欢迎的开源模型 LLaVA-1.5 进行了实验,揭示了目前多模态大模型中的视觉编码漏洞。。
LLaVA-UHD 将图像分辨率限制在最大 672×1008。但是在未来,考虑到其具有潜力的效率和可扩展性,将探索更高分辨率的图像以及更具挑战性的任务,如小目标检测和分割。此外,目前图像片段是独立编码的,只在 LLMs 中进行交互。计划通过改进的视觉编码策略,在图像片段之间建立高效的连接,实现细粒度全局信息交互。
-机器之心Pro
中国科学院、北大、中国科技大学、滑铁卢大学、01.ai等10家机构联合推出了,专用于中文的高质量指令调优数据集——COIG-CQIA。
COIG-CQIA几乎抓取了中文互联网的论坛、网站、百度贴吧、问答社区等高质量数据集。用COIG-CQIA对Yi-6B、Yi-34B进行指令调优,再用GPT4在BELLE-EVAL上评估在各种数据集上训练的大模型性能。
有趣的一幕出现了,“弱智贴吧”的数据质量,居然大幅度超过知乎、豆瓣、是否等知名知识社区,还真是大智若愚啊~
-AIGC开放社区
用户观点
- 观点 1:建议安装双系统
- 观点 2:建议别建议
- 观点 3:还要再迁回去
- 观点 4:Linux为基础的系统和服务必定是未来趋势
- 观点 5:完全正确的选择。
- 观点 1:Docker插件好像有点问题,Docker部署不能用。提示:Cannot run program "docker.exe"
- 观点 2:数据库的导出指定了mysqldump的路径,下次导出还得继续指定路径
- 观点 3:更新了,挺不错,没发现问题
- 观点 1:我就问一条:这么多app里有微信吗?
- 观点 2:没有微信天也塌不了,正好不用加入工作群了。
程序员梗图
我直接垫四个瓶盖,还有谁!
—END—
未经允许不得转载:岩猫星空网 » 开源日报 | 德国也要 “自主可控”;搞AI的是真没钱了;JetBrains全家桶2024.1;FFmpeg 7.0