欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.2.29
今日要点
OpenSource Daily
阿里发布肖像视频生成框架 EMO
来自阿里巴巴的团队发布了音频驱动的肖像视频生成框架 EMO(Emote Portrait Alive),相关论文同步发表于 arXiv。输入一张参考图像和声音音频,该框架能够生成具有丰富面部表情和头部姿势的声音肖像视频。
字节跳动打造 MegaScale:用于训练 LLM 的单一 “万卡集群”
MegaScale 将大语言模型训练扩展到超过 10000 个 GPU,在 12288 个 GPU 上训练 175B LLM 模型时,MegaScale 实现了 55.2% 的模型 FLOP 利用率(MFU),与层内模型并行技术 Megatron-LM 相比,MFU 提高了 1.34 倍。
今日观察
– 微博一个动态类型的幽灵
– 量子位
今日推荐
开源之声
每日项目榜
每日 GitHub 精选
在线阅读完整日报内容,访问:
开源日报第 19 期:我让 AI 用 C 语言写一个算法;微软三进制 LLM
往期回顾
未经允许不得转载:岩猫星空网 » 开源日报 | 我让 AI 用 C 语言写一个算法;微软三进制 LLM