据 MistralAI 官方消息,Mistral AI 推出了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。
– 原生多模态,使用交错图像和文本数据进行训练 – 在多模式任务上表现出色,在遵循指令方面表现出色 – 从头开始训练的新型 400M 参数视觉编码器 – 基于 Mistral Nemo 的 12B 参数多模态解码器 – 支持可变图像尺寸和长宽比 – 支持 128k token 的长上下文窗口中的多个图像
Pixtral Large 是 Mistral AI 多模态家族中的第二个模型,现已在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。
根据官方新闻稿,该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色,尤其在 MathVista 中达到了 69.4% 的准确率,超越了所有竞争对手。
详情查看官方公告。
未经允许不得转载:岩猫星空网 » Mistral 发布多模态 AI 模型:Pixtral Large