科技 第173页

零一万物发布 Yi 大模型 API 并启动公测,支持上下文 200K

3
零一万物通过其微信公众号宣布,经过一段时间的开发和内测正式发布Yi大模型API,同时启动邀测。目前,Yi 大模型 API 邀测名额限量开放中,申请成功即送1000万tokens。 此次邀测提供了两种模型: 本次重磅出台 Yi-34B-Chat-200K API,加速大模型应用进入“长文本时代”。200K 支持处理约 20~30 万个中英文字符(例如,可以轻松...
赞 (0)阅读(43)

华为发布通信行业首个大模型

1
2月26日至2月29日举行的世界移动通信大会(MWC24)期间,华为发布了由其自主研发的服务于通信行业的大模型。 根据介绍,华为通信大模型是一款基于人工智能的商用大模型,提供关键的智能化技术能力,用于优化通信网络性能、智能调度资源等,旨在实现在5G技术基础上演进而来的5G-A时代智能化目标。 华为董事、ICT产品与解决方案总裁杨超斌介绍,华为通信大模型支撑运...
赞 (0)阅读(47)

字节跳动打造 MegaScale:用于训练 LLM 的单一“万卡集群”

1
字节跳动联合北京大学的研究团队在 arXiv 上发表论文,介绍他们用于训练大语言模型的生产系统 MegaScale。该团队为 MegaScale 搭建了超过 10000 块 GPU(12,288)的单一集群,算力利用率超过 55%。 https://arxiv.org/pdf/2402.15627.pdf 整个系统涵盖了从模型块和优化器设计到计算与通信的重叠...
赞 (0)阅读(31)

李彦宏:大模型为云业务带来约 6.6 亿元增量收入

1
在百度 2023 年第四季度及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度智能云四季度总营收 84 亿元,其中大模型为云业务带来约6.6亿元增量收入。预计到 2024 年,这一增量收入有望达到数十亿元人民币,主要来源将包括广告业务和人工智能云服务的销售。 百度于近期上线了千帆AppBuilder和千帆ModelBuilder两款MaaS产...
赞 (0)阅读(41)

替代 Nginx,Cloudflare 开源 Pingora Rust 框架

1
早在 2022 年,Cloudflare 就曾宣布将放弃 Nginx,转而采用 Pingora —— 一个他们使用 Rust 在内部构建的新 HTTP 代理。时至今日,Cloudflare 宣布在 Apache 2.0 许可下开源了 Pingora 框架。 Pingora 是一个 Rust 异步多线程框架,可以帮助构建 HTTP 代理服务。截至目前,Ping...
赞 (0)阅读(43)

Meta 计划 7 月发布 Llama 3

根据 The Information 的报道,Meta 计划在 7 月发布最新版本的大语言模型 —— Llama 3。 Meta 的一位员工透露,由于研究人员尚未开始对模型进行微调,因此公司尚未决定Llama 3是否是多模态的。Meta员工还说,Llama 3最高可能拥有超过1400亿个参数,相比之下,去年7月发布的Llama 2的参数最高为700亿。 参数...
赞 (0)阅读(37)

海光成立 HygonArch SIG ,提供优秀“芯魂”系统和解决方案

近日,经openKylin社区技术委员会审议通过,HygonArch SIG正式成立。 HygonArch SIG由社区理事单位海光信息技术股份有限公司发起成立,致力于构建C86软件生态体系,多层次满足社区开发者以及用户的业务场景。 01SIG目标 HygonArch SIG将围绕海光处理器的指令集优势,海光内嵌异构安全处理器的安全技术,以及海光C86上层软...
赞 (0)阅读(31)

阿里发布肖像视频生成框架 EMO

1
来自阿里巴巴的团队发布了音频驱动的肖像视频生成框架 EMO(Emote Portrait Alive),相关论文同步发表于 arXiv。 https://arxiv.org/pdf/2402.17485.pdf 输入一张参考图像和声音音频,该框架能够生成具有丰富面部表情和头部姿势的声音肖像视频。 EMO的工作过程分为两个主要阶段:首先,利用参考网络(Refe...
赞 (0)阅读(31)