DeepSeek-GUI vs Hermes Desktop vs Open WebUI：三个 AI Agent 桌面界面的深度对比

基于各项目的 GitHub 源码、README 及 release notes 直接分析，不凭印象。

源码版本：DeepSeek-GUI (2026-06)、Hermes Desktop（Hermes Agent v0.16.0, 2026-06-05）、Open WebUI（当前 main 分支）。

一、项目定位和解决的问题

DeepSeek-GUI

解决的核心问题：让 DeepSeek 模型从终端命令行变成一个可以长时间、高频使用的桌面工作台项目。

作者的原话概括是"把 Kun 的高 Token ROI 本地智能体能力带进桌面窗口"。它不是一个聊天壳，而是围绕真实项目开发工作设计的：选工作目录，发起任务，实时看推理、工具调用和文件改动，需要时审批或回退。

关键点：它有自己内置的 Agent 运行时叫 Kun，不是调用外部 CLI，而是把完整的 agent loop 做进了 Electron 应用里。

适用人群：开发者和高频 AI 使用者，特别是用 DeepSeek API 做真实项目开发的人。### Hermes Desktop

解决的核心问题：给 Hermes Agent（Nous Research 的自主 AI Agent）提供一个非终端的图形界面，让不用 CLI 的人也能用起来。

它在 v0.16.0（"The Surface Release"）才加入，是 100 个 PR、一周内完成的。定位是同一个 agent、同一套 skills 和 memory，但从终端窗口变成桌面应用。

它的特点是和 CLI/Gateway 共用完全相同的后端：hermes desktop 命令启动 Electron 应用，里面的 Python 后端就是 hermes dashboard，聊天走的是同一个 gateway API 和嵌入式 TUI。不是另起一套，是把已有的 Hermes 能力用一个窗口包起来。

适用人群：已经用 Hermes CLI 的用户想要图形界面，或者想给非技术朋友提供一键安装包的情形。

Open WebUI

解决的核心问题：提供一个自托管的、完全离线的 AI 平台前端，统一管理各种 LLM 后端（Ollama、OpenAI 兼容 API 等），并在此基础上构建生成、RAG、工具调用等完整能力。

它解决的不是某一个 agent 的界面问题，而是谁来做 AI 平台的统一入口的问题。

适用人群：需要把 Ollama 或其他 LLM 服务能力暴露给团队/个人 Web 界面的人；需要 RAG 知识库、多用户权限管理的组织；想用浏览器访问本地模型的普通用户。---

二、技术架构对比

DeepSeek-GUI

架构：Electron + React + TypeScript，单运行时 Kun（Node.js 进程内跑的 agent loop）。

Kun 是内置的 Agent 运行时，源码在 kun/ 目录下，用 TypeScript 实现完整的 agent loop：工具调用、上下文压缩、MCP 集成、文件读写、bash 执行全部在 Kun 进程内完成。通过 HTTP/SSE 与 Electron 渲染层通信。前端用 Zustand 做状态管理，Codemirror 做代码编辑，Shiki 做语法高亮。

数据存储用 better-sqlite3（本地 SQLite），配置用 electron-store。

依赖关键词：better-sqlite3、electron-store、zustand、codemirror、shiki、@modelcontextprotocol/sdk、streamdown。

Hermes Desktop

架构：Electron + React + TypeScript，Python 后端（重用 hermes dashboard）。

Electron 主进程启动 Python 后端（hermes dashboard），渲染进程通过 React 组件渲染界面。关键设计：聊天内容保留嵌入式 TUI 路径（xterm 终端组件），不是纯 React 消息气泡，而是内嵌终端视图。

技术栈：React 19 + Tailwind CSS 4 + assistant-ui/react + xterm + node-pty + TanStack Query + React Router + shiki + streamdown + motion。

依赖关键词：@assistant-ui/react、@xterm/xterm、node-pty、react-router-dom、@tanstack/react-query、nanostores、@nous-research/ui（内部组件库）。

Open WebUI

架构：Python 后端 + Svelte/SvelteKit 前端（构建为静态资源由 Python 托管），不是 Electron。

默认部署方式是 Docker 或 pip 安装后通过 open-webui serve 在 localhost:8080 访问。后端存储支持 SQLite 和 PostgreSQL。支持 9 种向量数据库做 RAG。Redis 支持用于多节点水平扩展。完整 RBAC 权限系统，支持 LDAP/SCIM 2.0/OAuth。

后端代码在 backend/ 目录，Python 写，Ollama/OpenAI API 兼容层、RAG 管线、MCP 工具调用、Pipeline 插件框架全部在 Python 侧完成。

依赖关键词：Svelte/SvelteKit（前端）、FastAPI/uvicorn（后端）、Ollama SDK、ChromaDB/Qdrant、Redis、SQLAlchemy。## 三、关键维度对比

维度	DeepSeek-GUI	Hermes Desktop	Open WebUI
宿主形态	Electron 桌面应用	Electron 桌面应用	Web 应用（浏览器访问），也可 Docker 部署
Agent 运行时	自带 Kun（Node.js agent loop）	重用 Hermes Python 后端	无独立 agent 运行时；Ollama/OpenAI 就是后端
后端语言	Node.js（Kun）	Python（hermes dashboard）	Python（FastAPI）
前端技术	React 19 + Tailwind	React 19 + Tailwind	Svelte/SvelteKit
部署方式	预编译安装包（deb/dmg/exe）	预编译安装包或 hermes desktop 命令	Docker / pip / K8s / Helm
数据存储	SQLite（better-sqlite3）	与 Hermes CLI 共用配置目录	SQLite 或 PostgreSQL
多用户	单用户桌面应用	多 profile（不同 Hermes 配置）	完整 RBAC + LDAP/SCIM/OAuth
模型支持	DeepSeek API 为主，支持兼容端点	所有 Hermes 支持的模型	Ollama、OpenAI 兼容 API、Groq、Mistral、OpenRouter 等
RAG / 知识库	无内置，依赖 MCP 工具扩展	无原生 RAG，依赖 skills/MCP	内置完整 RAG（9 种向量库 + 网页抓取 + 文档解析）
工具/MCP	图形化 MCP 管理，Kun 支持 MCP 工具调用	通过 Hermes MCP/skills 体系	Pipeline 插件框架，原生 Python Function Calling，MCP 支持
语音	未提及	支持（语音输入+输出）	支持多种 STT/TTS 提供商
多语言	中英文界面	默认英文，v0.16 新增完整简体中文翻译	多语言 i18n，社区贡献
更新机制	electron-updater 自更新	electron-updater + hermes update 命令	Docker 拉新镜像 / pip 升级
Stars	~2,900	属于 NousResearch/hermes-agent（主体仓库）	~140,000
开源协议	MIT	MIT	MIT（有 Enterprise 商业版）

1. 谁在做"Agent"，谁在做"界面"

这是三者最根本的分界线。

DeepSeek-GUI 和 Hermes Desktop 都是完整的 Agent 系统：它们不仅有界面，还自带或重用了完整的 agent loop（工具调用、上下文管理、记忆、skills）。界面是 agent 的一部分，不是外挂。

Open WebUI 本质上是界面层。它不实现 agent loop，而是把 Ollama、OpenAI 等已有的推理后端包装成统一的 Web 界面。它的 Pipeline 插件框架和 Function Calling 是在 Python 后端里做的，但核心定位是"让多个 LLM 后端有一个统一入口"，而不是"实现一个自主 agent"。

所以 DeepSeek-GUI 和 Hermes Desktop 是竞品关系（都是带完整 agent 能力的桌面应用），Open WebUI 和它们不在同一个赛道。

2. 运行时的设计哲学

Kun（DeepSeek-GUI）：把 agent loop 做进 Node.js 进程，用 TypeScript 实现。优势是 Electron 原生 JS 环境，前后端通信零序列化开销。Kun 的核心卖点是"高 Token ROI"——通过 cache-first loop、按需工具上下文、上下文压缩来减少 API 调用成本。这是一个针对 DeepSeek API 成本优化的 agent 运行时。

Hermes Desktop：不重新实现 agent loop，直接重用 Hermes 已有的 Python 后端（hermes dashboard + tui_gateway）。Electron 壳只是一个窗口，真正的 agent 逻辑全在 Python 侧。好处是 CLI 和 GUI 行为完全一致，bug 修一处就行；代价是必须捆绑 Python 运行时，安装包体积大，启动慢。

Open WebUI：后端是 Python FastAPI，前端是 Svelte。它没有传统意义上的 agent loop，但通过 Pipeline 插件和 Function Calling 实现了类似能力。它的设计目标是"平台化"——多用户、多模型、可扩展，而不是"一个 agent 做好一件事"。### 3. 上下文和记忆

DeepSeek-GUI 的 Kun 把上下文管理做成了核心特性：稳定 prompt 前缀让 DeepSeek 缓存命中、按需压缩工具结果、跟踪 token 节省量并在 GUI 里显示。这是它区别于其他两者的显著特点——把 token 消耗变成可见的、可优化的指标。

Hermes Desktop 的记忆体系继承自 Hermes Agent 本身：跨 session 的持久化 memory、skills 索引、session 间的 @session 引用。这些能力在桌面端和 CLI 端完全一致，桌面端只是多了一个可视化的 session 管理界面。

Open WebUI 的记忆依赖对话历史（存储在 SQLite/PostgreSQL）和 RAG 知识库。它没有 agent 级别的跨 session 记忆，但通过向量数据库实现了文档级别的知识持久化。

4. 目标用户和使用场景

DeepSeek-GUI：适合用 DeepSeek API 做真实项目开发的人。它的文件变更审查、需求-计划-执行工作流、写作工作台都是围绕"开发者日常使用"设计的。如果你主要用 DeepSeek 写代码、改文件、跑脚本，这是最顺手的。

Hermes Desktop：适合已经用 Hermes CLI 的人想要图形界面，或者需要把 Hermes 提供给非技术用户。它的多 profile 支持、远程 gateway 连接、Fleet Mission Control（多 session 管理）是面向"agent 重度用户"的功能。

Open WebUI：适合需要把 LLM 能力以 Web 界面暴露给多用户的场景。企业内部分享、团队知识库、多模型对比测试。它的 RBAC、LDAP 集成、水平扩展能力是面向"部署给多人用"的需求。

5. 成熟度和生态

Open WebUI 是三者中最成熟的：14 万 Stars、完整的文档、活跃的 Discord 社区、Enterprise 商业版、大量第三方集成。它已经是一个"产品"。

DeepSeek-GUI 处于早期但功能完整的阶段：核心功能（聊天、文件操作、MCP、写作工作台）都实现了，有预编译安装包，但生态较小，主要靠作者个人维护。

Hermes Desktop 是最新的：v0.16.0 才发布，功能还在快速迭代中。它的优势是背靠 Hermes Agent 主仓库的开发节奏，新功能会持续涌入；劣势是 API 可能还不稳定，文档相对缺乏。---

五、总结

三个项目解决的是不同层面的问题：

DeepSeek-GUI：给 DeepSeek API 做一个高 Token ROI 的桌面 agent 工作台，核心是 Kun 运行时 + 项目开发工作流。
Hermes Desktop：给 Hermes Agent 加一个 Electron 窗口，让同一个 agent 有 GUI 入口，核心是复用已有 Python 后端 + 多 profile/远程连接。
Open WebUI：做一个自托管的 AI 平台 Web 界面，统一管理多个 LLM 后端，核心是多用户 + RAG + 插件生态。

如果只选一个：个人开发用 DeepSeek-GUI（DeepSeek 用户）或 Hermes Desktop（Hermes 用户），团队部署用 Open WebUI。

如果你觉得本文有用，请点赞，收藏，转发