跳到主要内容

减少内存占用

如果你在一个内存受限的环境中部署这个镜像,可以采取一些措施来精简镜像。

在 Raspberry Pi 4 (arm64) 上使用 v0.3.10 版本时,这能够将空闲内存消耗从超过 1GB 减少到约 200MB(通过 docker container stats 观察)。

简要说明

设置以下环境变量(或现有部署中的相应 UI 设置):RAG_EMBEDDING_ENGINE: ollamaAUDIO_STT_ENGINE: openai

详细解释

大部分的内存消耗是由于加载了机器学习模型。即使你使用的是外部语言模型(OpenAI 或 unbundled ollama),也可能为了其他目的加载多个模型。

截至 v0.3.10 版本,包括:

  • 语音转文字(默认为 whisper)
  • RAG 嵌入引擎(默认使用本地 SentenceTransformers 模型)
  • 图像生成引擎(默认禁用)

前两个选项默认启用并使用本地模型。你可以通过管理面板更改这些模型(RAG:文档类别,设置为 Ollama 或 OpenAI;语音转文字:音频部分,选择 OpenAI 或 WebAPI)。如果你正在部署一个新的 Docker 镜像,也可以通过以下环境变量进行设置:RAG_EMBEDDING_ENGINE: ollamaAUDIO_STT_ENGINE: openai。请注意,如果已经存在 config.json 文件,这些环境变量将不会生效。