?【AI新纪元】Xinference 0.14.4!新增视频模型+多项改进,AI 体验再升级!?

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 – https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。   Xinference 的功能和亮点有:

? Xinference 0.14.4 ? 发布,新增了 CogVideoX 5B ? 视频模型的支持。

更新指南 * pip:pip install ‘xinference==0.14.4’ ? * Docker:拉取最新版本即可 ?

更新日志 * 新增内置支持模型     * 视频模型CogVideoX-5b ?️ * 新功能     * sd系列图像模型支持padding ?️     * cosyvoice-300m-instruct 语音模型支持无需instruction ? * BUG修复     * 修复transformers推理引擎无法加载lora的问题 ?     * 修复docker compose无法拉起的问题 ?     * 修复image-to-text模型健康检查带来的问题 ?️     * 修复sglang不同版本参数不同的问题 ?     * 修复注册模型列表错误的问题 ?     * 修复列举视频模型的问题 ?     * 修复VL模型显存占用问题 ?️ * 即将废弃:     * v0.15.0 xinference内置客户端chat接口即将废弃prompt, system_prompt 和 chat_history参数,这三个参数将被messages参数替代,与openai形式保持一致. ⚠️     * v0.15.0 Qwen系列的react形式的tool call功能将移除,由OpenAI API形式的tool call代替。移除qwen-chat 1代的tool call能力(不影响qwen1.5-chat和qwen2). ?     * v0.15.0 将移除chatglm3。因其官方已基本不更新同时各规格接口不一致,glm系列模型推荐直接使用glm4-chat. ?️

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持,也欢迎更多使用者和开发者参与体验和使用 Xinference。   欢迎您在 https://github.com/xorbitsai/inference 给我们一个 星标,这样你就可以在 GitHub 上及时收到每个新版本的通知。

未经允许不得转载:岩猫星空网 » ?【AI新纪元】Xinference 0.14.4!新增视频模型+多项改进,AI 体验再升级!?