摘要:让大家熟悉如何通过云主机部署DeepSeek,并且通过本地部署的DeepSeek快速搭建RAG向量数据库。
一、案例介绍
本文将介绍如何通过在云主机部署Deepseek模型,在基于本地部署的前提下快速搭建属于自己的RAG向量数据库。RAG是检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种结合信息检索和生成式 AI 的技术架构。RAG 通过从外部知识库(如文档、数据库)中检索相关信息,并将其作为上下文输入给 LLM(大型语言模型),从而提高回答的准确性,减少幻觉问题。
通过实际操作,让大家熟悉如何通过云主机部署DeepSeek,并且通过本地部署的DeepSeek快速搭建RAG向量数据库!
二、案例时间
本案例总时长预计60分钟。
三、案例流程

说明:
① 云主机安装Ollama;
② 使用Ollama部署DeepSeek和mxbai-embed-large词向量模型;
③ 云主机获取项目代码及调取本地DeepSeek;
④ 上传数据集,构建RAG向量数据库。
四、资源总览
本案例预计花费总计
0
元。
资源名称
|
规格
|
单价(元)
|
时长(分钟)
|
云主机
|
2vCPUs
| 4GB X86 Ubuntu 22.04 Server定制版 |
免费
|
60
|
五、云主机部署DeepSeek
5.1安装Ollama
Ollama 是一个强大的开源工具,旨在帮助用户轻松地在本地运行、部署和管理大型语言模型(LLMs)。它提供了一个简单的命令行界面,使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构,并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。
在云主机桌面右键选择“
Open Terminal Here
”,打开命令终端窗口。

执行安装命令如下:
curl -fsSL https://ollama.com/install.sh | sh

5.2模型部署
接下来可以借助 Ollama 工具来部署 Deepseek 大模型,部署 deepseek-r1:1.5b 版本,执行命令:
ollama run deepseek-r1:1.5b

部署的时间长短依赖于网络的情况,部署完成后,我们就可以与 Deepseek 大模型进行对话了:

在桌面重新打开一个终端将以下命令复制进去,下载mxbai-embed-large 词向量模型。
ollama pull mxbai-embed-large

六、RAG向量数据库创建
6.1虚拟环境创建
打开云主机桌面CodeArts IDE for Python。

打开后,点击新建工程,输入工程名称:RAG,点击创建。

创建好后,左下角选择管理->设置。

在搜索框中输入:active,找到图中所示,在前方方框中点击勾选。

打开终端,前方出现(venv)字样表示创建成功,如果没有请点击
小垃圾桶图标
关闭终端重新打开一下。

6.2 RAG向量数据库构建
左下角打开终端输入命令,入完毕后按下回车进行下载。下载完毕后,在左侧目录下出现chatpdf-rag-deepseek-r1文件夹表示下载成功。
git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1

下载完毕后,再次输入以下命令,输入完毕后按下回车,进入该目录下。
cd chatpdf-rag-deepseek-r1

进入到目录后在终端复制以下命令下载相应环境包。
pip install -r requirements.txt

6.3 RAG向量数据库功能实现
下载完毕后,点击后进入chatpdf-rag-deepseek-r1目录,对rag.py文件进行修改。修改rag.py文件的第23行代码,修改后的效果如下:
def __init__(self, llm_model: str = "deepseek-r1:1.5b", embedding_model: str = "mxbai-embed-large"):

修改完毕后,终端输入以下命令运行,首次运行可能会出现输入Email,出现时输入自己常用Email即可,输入完毕后效果如下:
streamlit run app.py

同时浏览器会自动弹出网址界面。

图示英文字符的意思如下:
Upload a Docunment:上传文档;
Settings(Number of Retrieved Results (k)):检索结果数;
Similarity Score Threshold:相似度得分阈值;
Chat History:聊天记录;
Message:提示信息。
注:上传的文档格式需要为PDF格式。
这里我们将提前准备好的数据进行上传。
数据可以前往以下地址自行下载获取,上传的数据中包括AI的基础理论知识以及常用的AI框架的介绍,这里上传数据是为了使大模型能够进行RAG向量数据库的生成,使DeepSeek可以读取到数据库中的内容。
下载完毕后点击图中’Browse files’字样进行数据上传。

点击后选择下载的数据,再点击打开进行数据上传。

上传后等待读取(过程需要一点时间请耐心等待),数据中包含AI方面的基础知识,所以我们进行问题提问,这里提问:机器学习有哪些核心技术?,输入完毕后回车发送消息。

可以看到返回信息,结合我们上传的数据进行检索生成。
至此本地部署DeepSeek构建RAG向量数据库实验案例到此结束。