首个图文混合创作大模型“书生·浦语灵笔”开源

上海人工智能实验室(上海 AI 实验室)宣布推出首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer,简称“浦语灵笔”),依托强大的多模态性能,解锁“一键生成”图文混合文章的创作能力,为大模型落地应用提供更多可能。

目前,浦语灵笔已开源其中的智能创作和对话(InternLM-XComposer-7B)及多任务预训练(InternLM-XComposer-VL-7B)版本,并提供免费商用。

此前,上海AI实验室曾陆续开源了书生·浦语大语言模型的7B(InterLM-7B)及20B(InternLM-20B)版本。基于书生·浦语大语言模型(InternLM),浦语灵笔接受视觉和语言模态输入,不仅在图文对话方面表现优秀,更具备图文并茂文章的“一键生成”能力。

浦语灵笔能够进行流利的中英文图文对话,准确理解图像内容;并解锁了图文并茂文章创作的全新能力。除自动配图能力外,浦语灵笔还提供了配图推荐和更换功能,根据用户实际需求定制图文内容。

目前,浦语灵笔已支持科普文稿、营销广告、新闻稿件、影视评论、生活指南等类型文章的图文并茂生成,并将逐渐开放更多能力。

浦语灵笔为图文文章创作设计了“三步走”的算法流程:

研究人员采用5个主流的多模态大模型评测对InternLM-XComposer-VL-7B的能力进行了详细测试。

未经允许不得转载:岩猫星空网 » 首个图文混合创作大模型“书生·浦语灵笔”开源