对话模型部署教程

本文以ChatGLM3-6B开源模型为例，介绍如何将对话模型部署至容器实例中

首先，请阅读各模型的官方文档，根据模型所支持的框架，python版本等信息寻找匹配的镜像源创建实例。

容器创建完成后，进入终端界面，从模型的官方Github上克隆模型仓库。

git clone https://github.com/THUDM/ChatGLM3

进入文件夹： cd ChatGLM3

使用pip安装模型依赖项：

pip install -r requirements.txt

下载模型至实例中，首先需要安装GIT-LFS

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash

sudo apt-get install git-lfs

下载模型

git clone https://huggingface.co/THUDM/chatglm3-6b

至此，模型已在容器中部署完成。

代码调用

python

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True, device='cuda')
model = model.eval()
response, history = model.chat(tokenizer, "你好呀", history=[])
print(response)