来自
我有一名AI助手,名字叫”老六”。为什么呢?是因为它有时候会一本正经的胡说八道。
没错,这是大模型的缺点——”幻觉”。所以LLMs+知识库是解决”幻觉”的方法。
同时对于企业来说,需要考虑信息安全,企业私有的知识库显然不能利用公域的大模型。那么搭建一套基于本地大模型的个人/企业知识库,是一个很好的解决方案。
1. 搭建本地大模型
安装Ollama
我们先进入Ollama的官网,下载对应操作系统的安装包。下载完成后,直接安装即可,没有任何选项。
https://ollama.com
拉取大模型
在Ollama的官网上可以进入Models页面中查看可以下载的模型,其中Meta的Llama2 7b版本需要大概8GB内存就可以跑起来。如果你条件足够,可以跑13b和70b版本,分别对应16GB和64GB内存。除了Meta的Llama模型,你也可以下载其它的模型。
打开终端,键入如下代码,即可自动下载模型。
ollama?run?llama2
等待下载完成后,你就可以直接在终端中与大模型进行对话了。怎么样,如此简单你就拥有了一个属于你自己私人的chatAI。
但是不是觉得终端里运行对话不那么好看,你希望在chatGPT那样的网页上进行对话。没问题,让open WebUI来帮你解决问题。
2. 搭建用户界面
Open WebUI是一个可扩展的、功能丰富的、用户友好的自托管网页用户界面,旨在完全离线运行。它支持各种LLM运行程序,包括与Ollama和openAI兼容的API。
安装Docker
在此之前,需要先安装Docker,它就像一个容器,为每个项目装载了必备的环境和必要条件。
首先我们去Docker官网,下载Docker Desktop的安装包,并进行安装。
安装完成后,等待程序加载完成,即可进入Docker。如果你是首次使用,则Containers中是没有任何项目的。
安装open WebUI
刚才已经装完ollama以及成功安装并运行模型后。在终端中运行以下代码,即可开始安装WebUI。
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
等待下载和安装完成后,进入Docker Desktop中,即可看见安装成功的WebUI项目。
此时,进入任意浏览器中,在地址栏中输入:http://localhost:3000?即可访问WebUI。
首次登录,输入邮箱密码注册,即可登录。
选择模型llama2,即可在对话框中输入文字,开始对话。界面是不是很熟悉,很像chatGPT,用着顺手多了。
open WebUI还有很多其它功能,比如它本身自带RAG。可以在对话框中输入“#”,然后跟上网址,即可访问网页的实施信息,并进行内容生成。
还可以上传文档,基于文本进行更深层次的知识交互。如果你对知识库的要求不高,做到这一点以后,基本能满足大多数个人的需求了。
3. 与知识库相连
如果你对知识库交互有更大的需求,可以安装以下这款应用。
AngthingLLM
https://useanything.com
这是一个可以基于大模型的知识库交互软件,可以应用本地大模型,或调用公域大模型API。知识库也同样可以使用本地的,而且几乎不占用很大的资源。
完成安装后,先会要求配置大模型。这里可以选择Ollama的本地模型,选择Llama2 7b。
然后会让你选择嵌入模式和向量数据库,我们选择默认的即可,或者接入外部API。
配置完成后,再为你的工作空间起个名字,即可进入AnythingLLM中。
在正式使用前,你需要上传你的知识文档,支持多种形式,但图片形式PDF不可读取。
最后,你就可以在对话框中,和你的知识进行对话交流了。
这样,你就拥有了一个本地化的大模型,且能和你自己的知识库交互,信息安全,内容可靠。还等什么,赶紧配置起来吧。