xinference linux系统下部署

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。

一休Q_Q

2518人浏览 · 2024-09-19 17:51:13

一休Q_Q · 2024-09-19 17:51:13 发布

1.创建虚拟环境

conda create -n xinfer pyrhon=3.10

2.使用虚拟环境

conda activate xinfer

(xinfer) root@home:~$ python -V
Python 3.10.14

3.pip安装环境

pip install "xinference[all]"

4.启动服务

nohup xinference-local --host 0.0.0.0 --port 9997 &

5.打开ui页面

http://192.168.0.*:9997/ui/#/launch_model

6.模型配置

如果本地有模型，则在“Optional Configurations”最下面的model path处贴上模型的本地地址。

7.点击running models

选择想测试的模型，测试模型效果。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

MySQL 启动失败 (code=exited, status=1FAILURE) 异常解决方案

在日常运维和开发过程中，MySQL数据库的稳定运行至关重要。然而，MySQL有时会因为配置文件错误或环境问题而启动失败。本文将以 MySQL 启动失败的案例为例，详细介绍如何通过查看日志文件，定位问题并解决 MySQL 启动异常。通过上述步骤，我们成功解决了 MySQL 启动失败的问题。首先，查看 MySQL 的错误日志文件，找到具体的错误信息。通过错误提示，确定配置文件中的问题所在。修改或注释掉

2048 AI社区

【实战经验】解决ComfyUI加载报错:PytorchStreamReader failed reading zip archive: failed finding central directory

2048 AI社区

昇腾AI开发者必看：CANN训练营四大专题课程详解与学习路径

2025年昇腾CANN训练营第二季，基于CANN开源开放全场景，推出0基础入门系列、码力全开特辑、开发者案例等专题课程，助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证，即可领取精美证书，完成社区任务更有机会赢取华为手机、平板、开发板等大奖。报名链接昇腾CANN训练营是一个针对AI开发者进行技术赋能和实操活动的平台，为开发者提供高质量AI学习课程、开发环境和免费算力，助力开