Skip to content

k8s集群部署,不使用GPU进行推理 #4189

@Notailli

Description

@Notailli

System Info / 系統信息

cuda:12.8
python:3.11.7

Running Xinference with Docker? / 是否使用 Docker 运行 Xinfernece?

  • docker / docker
  • pip install / 通过 pip install 安装
  • installation from source / 从源码安装

Version info / 版本信息

xprobe/xinference:v1.11.0

The command used to start Xinference / 用以启动 xinference 的命令

具体步骤
新增 Xinference Helm 仓库

helm repo add xinference https://xorbitsai.github.io/xinference-helm-charts
更新仓库索引,查询可安装版本

helm repo update xinference
helm search repo xinference/xinference --devel --versions
安装

helm install xinference xinference/xinference -n xinference --version 0.0.1-v1.11.0

Reproduction / 复现过程

根据k8s部署之后,没有通过GPU进行模型推理,而是使用的CPU

Expected behavior / 期待表现

希望能够通过GPU进行模型推理

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions